Ubah Teks Jadi Video, Sora Dianggap Inovasi AI Visioner
Senin, 19 Februari 2024 - 09:07 WIB
loading...
A
A
A
Kemampuan Sora tersebut mendukung pembacaan terhadap geometri 3D dan konsistensi sejumlah data. Tak ayal, Sora disebut sebagai evolusi alami dari model pengubah difusi yang sejauh ini sebagian besar digunakan untuk menghasilkan gambar beresolusi tinggi.
Model difusi tadi bekerja dengan secara bertahap menambahkan noise ke gambar asli dan kemudian secara progresif mempelajari cara menghilangkan noise ini, sehingga menciptakan gambar baru. Untuk melatih Sora, OpenAI memberikan sejumlah besar video yang dilengkapi dengan keterangan untuk membangun hubungan antara cuplikan video dan input teks.
Selain menghasilkan cuplikan baru sepenuhnya dari prompt, Sora juga dapat memperpanjang klip atau mengubah gambar yang dihasilkan kecerdasan buatan menjadi video.
Saat mengembangkan Sora, peneliti OpenAI mengamati sejumlah kemampuan muncul yang menarik saat dilatih dalam skala besar. Misalnya, cara menyimulasikan beberapa aspek dari orang, hewan, dan lingkungan dari dunia fisik. Cuplikan video yang dihasilkan menunjukkan bahwa Sora dapat menghasilkan pergeseran kamera yang dinamis dan sangat halus saat memindai, melacak, atau memperbesar serta menunjukkan tingkat pemahaman 3D yang nyata.
Baca Juga: Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis
Model difusi tadi bekerja dengan secara bertahap menambahkan noise ke gambar asli dan kemudian secara progresif mempelajari cara menghilangkan noise ini, sehingga menciptakan gambar baru. Untuk melatih Sora, OpenAI memberikan sejumlah besar video yang dilengkapi dengan keterangan untuk membangun hubungan antara cuplikan video dan input teks.
Selain menghasilkan cuplikan baru sepenuhnya dari prompt, Sora juga dapat memperpanjang klip atau mengubah gambar yang dihasilkan kecerdasan buatan menjadi video.
Saat mengembangkan Sora, peneliti OpenAI mengamati sejumlah kemampuan muncul yang menarik saat dilatih dalam skala besar. Misalnya, cara menyimulasikan beberapa aspek dari orang, hewan, dan lingkungan dari dunia fisik. Cuplikan video yang dihasilkan menunjukkan bahwa Sora dapat menghasilkan pergeseran kamera yang dinamis dan sangat halus saat memindai, melacak, atau memperbesar serta menunjukkan tingkat pemahaman 3D yang nyata.
Baca Juga: Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis
Lihat Juga :