Ubah Teks Jadi Video, Sora Dianggap Inovasi AI Visioner

Senin, 19 Februari 2024 - 09:07 WIB
loading...
Ubah Teks Jadi Video,...
OpenAI menyebut fitur Sora ini sebagai simulator dunia. (Foto: Merca20)
A A A
JAKARTA - OpenAI membuat inovasi kecerdasan buatan yang mengubah materi tekstual menjadi video beresolusi tinggi. Fitur ini diberi nama Sora.

OpenAI memerlihatkan beberapa cuplikan video sampel yang sangat mengesankan, mulai dari sepasang orang yang berjalan melintasi lanskap bersalju hingga drone yang mengikuti mobil SUV vintage putih di jalanan tanah.

Perkembangan ini dianggap inovasi signifikan untuk teknologi kecerdasan buatan generatif. Bahkan, OpenAI sudah menyebut fitur Sora ini sebagai "simulator dunia" yang mampu memahami aspek penting dari dunia tiga dimensi dan bisa mengeluarkan adegan mirip CGI dari lanskap digital.

"Hasil simulasi kami menunjukkan bahwa memperbesar model generasi video menjadi jalan menjanjikan menuju pembangunan simulator tujuan umum dari dunia fisik," tulis OpenAI melalui siaran pers dilansir dari Wired, Senin (19/2/2024).



Kemampuan Sora tersebut mendukung pembacaan terhadap geometri 3D dan konsistensi sejumlah data. Tak ayal, Sora disebut sebagai evolusi alami dari model pengubah difusi yang sejauh ini sebagian besar digunakan untuk menghasilkan gambar beresolusi tinggi.

Model difusi tadi bekerja dengan secara bertahap menambahkan noise ke gambar asli dan kemudian secara progresif mempelajari cara menghilangkan noise ini, sehingga menciptakan gambar baru. Untuk melatih Sora, OpenAI memberikan sejumlah besar video yang dilengkapi dengan keterangan untuk membangun hubungan antara cuplikan video dan input teks.

Selain menghasilkan cuplikan baru sepenuhnya dari prompt, Sora juga dapat memperpanjang klip atau mengubah gambar yang dihasilkan kecerdasan buatan menjadi video.

Saat mengembangkan Sora, peneliti OpenAI mengamati sejumlah kemampuan muncul yang menarik saat dilatih dalam skala besar. Misalnya, cara menyimulasikan beberapa aspek dari orang, hewan, dan lingkungan dari dunia fisik. Cuplikan video yang dihasilkan menunjukkan bahwa Sora dapat menghasilkan pergeseran kamera yang dinamis dan sangat halus saat memindai, melacak, atau memperbesar serta menunjukkan tingkat pemahaman 3D yang nyata.



"Kemampuan-kemampuan ini memerlihatkan bahwa meningkatnya model-model video ini menjanjikan untuk pengembangan simulator fisik dan digital," tulis OpenAI.

Namun, kemampuan Sora dinilai masih jauh dari sempurna. Pertama, model ini masih belum sepenuhnya memahami sebab dan akibat. "Sebagai contoh, seseorang mungkin menggigit sepotong kue, tetapi setelah itu, kue tersebut mungkin tidak memiliki bekas gigitan," tulis OpenAI.

Cuplikan lain menunjukkan cangkir kaca bocor, namun isinya keluar dalam kondisi cangkirnya tidak benar-benar pecah terlebih dahulu. Meskipun memiliki keterbatasan, Sora bisa menjadi kecerdasan buatan visioner di segmen video. OpenAI pun sangat sadar akan potensi teknologi ini untuk disalahgunakan. Sebagai hasilnya, perusahaan memilih untuk secara perlahan memperkenalkannya ke publik.

"Kami akan sangat berhati-hati tentang semua implikasi keamanan untuk ini," kata peneliti OpenAI Bill Peebles kepada Wired.
(msf)
Dapatkan berita terkini dan kejutan menarik dari SINDOnews.com, Klik Disini untuk mendaftarkan diri anda sekarang juga!
Baca Berita Terkait Lainnya
Copyright ©2024 SINDOnews.com
All Rights Reserved
read/ rendering in 0.2099 seconds (0.1#10.140)