Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis

Sora dapat meningkatkan standar manfaat AI generatif dalam dunia kreatif. (Foto: Gizchina)

A A A

JAKARTA - OpenAI semakin inovatif dengan kemampuan mengubah teks ke video yang sangat realistis. Fitur baru yang disebut Sora itu dapat meningkatkan standar manfaat AI generatif dalam dunia kreatif.

Melansir CNet, Sabtu (17/2/2024), seperti pengubah teks kevvideo Google, Lumiere, ketersediaan Sora terbatas. Namun, berbeda dengan Lumiere, Sora dapat menghasilkan video berdurasi hingga 1 menit.

Fitur mengubah teks ke video kini menjadi daya tarik terbaru dalam pengembangan AI generatif OpenAI, Google, Microsoft, dan lainnya. Tren generasi teks dan gambar diyakini memantapkan posisi pendapatan ketiga provider tadi hingga mencapai 1,3 triliun dollar AS atau sekira Rp 16 triliun pada 2032 mendatang.

Sebuah unggahan resmi dari OpenAI menerangkan bahwa Sora akan berguna bagi segmen kreator visual, desainer, dan pembuat film. Pengujiannya dianggap sangat penting untuk mengatasi potensi deepfake dalam penggunaan AI untuk membuat gambar dan video.

Selain mendapatkan umpan balik dari luar organisasi, startup AI tersebut ingin membagikan kemampuanya untuk eksplorasi AI lebih lanjut.

Baca Juga: OpenAI Tingkatkan Kemampuan ChatGPT dengan Fitur Suara dan Gambar

Salah satu hal yang mungkin membedakan Sora terletak padakemampuannya untuk menginterpretasikan prompt panjang hingga mencapai 135 kata. Video sampel yang dibagikan oleh OpenAI pekan lalu menunjukkan bahwa Sora dapat menciptakan berbagai karakter dan adegan, mulai dari orang-orangan dan hewan-hewan, monster-monster berbulu, hingga pemandangan kota, lanskap, taman zen bahkan New York City yang tenggelam di bawah air.

Hal ini berkat sebagian dari karya terdahulu OpenAI dengan model-model Dall-E dan GPT-nya. Generator teks-ke-gambar Dall-E 3 dirilis pada bulan September 2023 sebagai langkah besar dari Dall-E 2 dari 2022, selain model AI terbaru OpenAI, GPT-4 Turbo yang dirilis padaNovember lalu.

Secara khusus, Sora mengadopsi teknik rekapsulasi Dall-E 3, yang diklaim OpenAI menghasilkan deskripsi yang sangat deskriptif untuk data latihan visual.

"Sora mampu menghasilkan adegan kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail akurat dari subjek dan latar belakang," tulis pos tersebut. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada dalam dunia fisik," tulis OpenAI.

Halaman :

Baca Selengkapnya

Lihat Juga :