Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis 

Sabtu, 17 Februari 2024 - 09:19 WIB
loading...
Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis 
Sora dapat meningkatkan standar manfaat AI generatif dalam dunia kreatif. (Foto: Gizchina)
A A A
JAKARTA - OpenAI semakin inovatif dengan kemampuan mengubah teks ke video yang sangat realistis. Fitur baru yang disebut Sora itu dapat meningkatkan standar manfaat AI generatif dalam dunia kreatif.

Melansir CNet, Sabtu (17/2/2024), seperti pengubah teks kevvideo Google, Lumiere, ketersediaan Sora terbatas. Namun, berbeda dengan Lumiere, Sora dapat menghasilkan video berdurasi hingga 1 menit.

Fitur mengubah teks ke video kini menjadi daya tarik terbaru dalam pengembangan AI generatif OpenAI, Google, Microsoft, dan lainnya. Tren generasi teks dan gambar diyakini memantapkan posisi pendapatan ketiga provider tadi hingga mencapai 1,3 triliun dollar AS atau sekira Rp 16 triliun pada 2032 mendatang.

Sebuah unggahan resmi dari OpenAI menerangkan bahwa Sora akan berguna bagi segmen kreator visual, desainer, dan pembuat film. Pengujiannya dianggap sangat penting untuk mengatasi potensi deepfake dalam penggunaan AI untuk membuat gambar dan video.

Selain mendapatkan umpan balik dari luar organisasi, startup AI tersebut ingin membagikan kemampuanya untuk eksplorasi AI lebih lanjut.



Salah satu hal yang mungkin membedakan Sora terletak padakemampuannya untuk menginterpretasikan prompt panjang hingga mencapai 135 kata. Video sampel yang dibagikan oleh OpenAI pekan lalu menunjukkan bahwa Sora dapat menciptakan berbagai karakter dan adegan, mulai dari orang-orangan dan hewan-hewan, monster-monster berbulu, hingga pemandangan kota, lanskap, taman zen bahkan New York City yang tenggelam di bawah air.

Hal ini berkat sebagian dari karya terdahulu OpenAI dengan model-model Dall-E dan GPT-nya. Generator teks-ke-gambar Dall-E 3 dirilis pada bulan September 2023 sebagai langkah besar dari Dall-E 2 dari 2022, selain model AI terbaru OpenAI, GPT-4 Turbo yang dirilis padaNovember lalu.

Secara khusus, Sora mengadopsi teknik rekapsulasi Dall-E 3, yang diklaim OpenAI menghasilkan deskripsi yang sangat deskriptif untuk data latihan visual.

"Sora mampu menghasilkan adegan kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail akurat dari subjek dan latar belakang," tulis pos tersebut. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada dalam dunia fisik," tulis OpenAI.



Video sampel yang dibagikan oleh OpenAI memang terlihat sangat realistis - kecuali mungkin ketika wajah manusia muncul dari dekat atau ketika makhluk-makhluk laut sedang berenang sehingga mungkin kesulitan untuk membedakan mana yang nyata dan mana yang tidak.

Model ini juga dapat menghasilkan video dari gambar diam dan memperpanjang video yang ada atau mengisi bingkai yang hilang, mirip dengan yang dapat dilakukan oleh Lumiere. "Sora berfungsi sebagai dasar untuk model yang dapat memahami dan mensimulasikan dunia nyata, sebuah kemampuan yang kami percaya akan menjadi tonggak penting untuk mencapai AGI," tambah OpenAI.

AGI, atau kecerdasan buatan umum menjadj bentuk AI yang lebih maju yang lebih dekat dengan kecerdasan mirip manusia dan mencakup kemampuan untuk melakukan berbagai tugas. Meta dan DeepMind juga telah menunjukkan minat dalam mencapai tonggak ini.

Kelemahan Sora


OpenAI mengakui bahwa Sora memiliki kelemahan, seperti kesulitan dalam menggambarkan detil sebuah adegan yang kompleks dan memahami sebab akibat. Misalnya, seseorang mungkin menggigit sepotong kue, tetapi setelahnya, kue tersebut mungkin tidak memiliki bekas gigitan.

OpenAI belum membagikan kapan Sora akan tersedia secara luas karena ingin mengambil beberapa langkah penting dalam hal keamanan terlebih dahulu. Hal ini termasuk memenuhi standar keamanan OpenAI yang ada, yang melarang kekerasan ekstrem, konten seksual, citra yang membenci, kemiripan selebriti, dan IP orang lain.

"Meskipun penelitian dan pengujian yang ekstensif, kami tidak dapat memprediksi semua cara bermanfaat yang akan digunakan orang terhadap teknologi kami, ataupun semua cara orang akan menyalahgunakannya," tulis OpenAI .
(msf)
Baca Berita Terkait Lainnya
Copyright ©2024 SINDOnews.com
All Rights Reserved
read/ rendering in 0.1405 seconds (0.1#10.140)