OpenAI luncurkan versi API untuk Dall-E 3
DALL-E 3 adalah model text-to-image OpenAI yang awalnya hanya hadir di ChatGPT dan Bing Chat, dan kini tersedia melalui API.
OpenAI meluncurkan sejumlah API baru pada hari pengembang pertamanya, salah satunya DALL-E 3. Ini adalah model text-to-image OpenAI yang awalnya hanya hadir di ChatGPT dan Bing Chat, dan kini tersedia melalui API.
Mirip dengan versi DALL-E sebelumnya, API ini menggunakan moderasi bawaan untuk membantu melindungi dari penyalahgunaan. DALL-E 3 menawarkan opsi format, kualitas serta resolusi yang berbeda mulai dari 1024×1024 hingga 1792×1024, dengan harga mulai dari USD0,04 per gambar yang dihasilkan.
Berbeda dengan API DALL-E 2, DALL-E 3 tidak dapat digunakan untuk membuat versi gambar yang diedit dengan meminta model mengganti beberapa area dari gambar yang sudah ada atau membuat variasi dari gambar yang sudah ada.
Ketika prompt dikirim ke DALL-E 3, OpenAI mengatakan bahwa prompt tersebut akan secara otomatis menulis ulang “untuk alasan keamanan” dan “untuk menambahkan lebih banyak detail” — yang dapat menyebabkan hasil yang kurang tepat tergantung pada perintahnya.
Di sisi lain, OpenAI kini menyediakan API text-to-speech, Audio API, yang menawarkan enam suara preset — Alloy, Echo, Fable, Onyx, Nova, dan Shimer — untuk dipilih dan dua varian model AI generatif. Ini ditayangkan mulai hari ini, dengan harga mulai dari USD0,015 per masukan 1.000 karakter.