Inovatif, OpenAI Kembangkan Fitur Ubah Teks ke Video Realistis
Sabtu, 17 Februari 2024 - 09:19 WIB
loading...
A
A
A
Salah satu hal yang mungkin membedakan Sora terletak padakemampuannya untuk menginterpretasikan prompt panjang hingga mencapai 135 kata. Video sampel yang dibagikan oleh OpenAI pekan lalu menunjukkan bahwa Sora dapat menciptakan berbagai karakter dan adegan, mulai dari orang-orangan dan hewan-hewan, monster-monster berbulu, hingga pemandangan kota, lanskap, taman zen bahkan New York City yang tenggelam di bawah air.
Hal ini berkat sebagian dari karya terdahulu OpenAI dengan model-model Dall-E dan GPT-nya. Generator teks-ke-gambar Dall-E 3 dirilis pada bulan September 2023 sebagai langkah besar dari Dall-E 2 dari 2022, selain model AI terbaru OpenAI, GPT-4 Turbo yang dirilis padaNovember lalu.
Secara khusus, Sora mengadopsi teknik rekapsulasi Dall-E 3, yang diklaim OpenAI menghasilkan deskripsi yang sangat deskriptif untuk data latihan visual.
"Sora mampu menghasilkan adegan kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail akurat dari subjek dan latar belakang," tulis pos tersebut. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada dalam dunia fisik," tulis OpenAI.
Baca Juga: OpenAI Resmi Luncurkan ChatGPT-4, Diklaim Setara dengan Manusia Superjenius
Video sampel yang dibagikan oleh OpenAI memang terlihat sangat realistis - kecuali mungkin ketika wajah manusia muncul dari dekat atau ketika makhluk-makhluk laut sedang berenang sehingga mungkin kesulitan untuk membedakan mana yang nyata dan mana yang tidak.
Hal ini berkat sebagian dari karya terdahulu OpenAI dengan model-model Dall-E dan GPT-nya. Generator teks-ke-gambar Dall-E 3 dirilis pada bulan September 2023 sebagai langkah besar dari Dall-E 2 dari 2022, selain model AI terbaru OpenAI, GPT-4 Turbo yang dirilis padaNovember lalu.
Secara khusus, Sora mengadopsi teknik rekapsulasi Dall-E 3, yang diklaim OpenAI menghasilkan deskripsi yang sangat deskriptif untuk data latihan visual.
"Sora mampu menghasilkan adegan kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail akurat dari subjek dan latar belakang," tulis pos tersebut. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada dalam dunia fisik," tulis OpenAI.
Baca Juga: OpenAI Resmi Luncurkan ChatGPT-4, Diklaim Setara dengan Manusia Superjenius
Video sampel yang dibagikan oleh OpenAI memang terlihat sangat realistis - kecuali mungkin ketika wajah manusia muncul dari dekat atau ketika makhluk-makhluk laut sedang berenang sehingga mungkin kesulitan untuk membedakan mana yang nyata dan mana yang tidak.
Lihat Juga :