Microsoft Kembangkan AI Mirip Suara Manusia hingga Tak Bisa Dibedakan
Kamis, 11 Juli 2024 - 16:57 WIB
Microsoft Kembangkan AI Mirip Suara Manusia. FOTO/ DAILY
JAKARTA - Microsoft telah membuat kemajuan besar dalam kecerdasan buatan dengan mengembangkan alat yang dapat mengkloning suara manusia dengan tingkat realisme yang tak tertandingi. Namun, karena potensi penyalahgunaan yang tinggi, perusahaan memutuskan untuk tidak merilisnya ke publik.
BACA JUGA - Andalkan Mobile AI, Samsung Umumkan Pre Order Galaxy AI
Seperti dilansir dari The Sun, teknologi ini, bernama VALL-E 2, adalah model text-to-speech yang mampu meniru suara seseorang hanya dengan sampel audio singkat. Kemampuannya yang luar biasa ini dicapai melalui pembelajaran zero-shot, di mana AI dilatih untuk memahami konsep tanpa contoh eksplisit.
Para peneliti di Microsoft Research mengklaim bahwa VALL-E 2 adalah yang pertama dalam jenisnya yang mencapai "kesetaraan manusia" dalam hal kualitas suara, melampaui tolok ukur yang ditetapkan sebelumnya. Hal ini merupakan langkah signifikan dari pendahulunya, VALL-E, yang diluncurkan pada Januari 2023.
Salah satu keunggulan utama VALL-E 2 adalah kemampuannya menghasilkan kalimat yang kompleks dan bernuansa, bukan hanya frasa pendek. Hal ini dimungkinkan dengan menggabungkan dua teknik inovatif: Pengambilan Sampel Sadar Pengulangan dan Pemodelan Kode yang Dikelompokkan.
Meskipun memiliki potensi luar biasa untuk aplikasi seperti pendidikan, hiburan, dan aksesibilitas, Microsoft menyadari risiko penyalahgunaan teknologi ini.
BACA JUGA - Andalkan Mobile AI, Samsung Umumkan Pre Order Galaxy AI
Seperti dilansir dari The Sun, teknologi ini, bernama VALL-E 2, adalah model text-to-speech yang mampu meniru suara seseorang hanya dengan sampel audio singkat. Kemampuannya yang luar biasa ini dicapai melalui pembelajaran zero-shot, di mana AI dilatih untuk memahami konsep tanpa contoh eksplisit.
Para peneliti di Microsoft Research mengklaim bahwa VALL-E 2 adalah yang pertama dalam jenisnya yang mencapai "kesetaraan manusia" dalam hal kualitas suara, melampaui tolok ukur yang ditetapkan sebelumnya. Hal ini merupakan langkah signifikan dari pendahulunya, VALL-E, yang diluncurkan pada Januari 2023.
Salah satu keunggulan utama VALL-E 2 adalah kemampuannya menghasilkan kalimat yang kompleks dan bernuansa, bukan hanya frasa pendek. Hal ini dimungkinkan dengan menggabungkan dua teknik inovatif: Pengambilan Sampel Sadar Pengulangan dan Pemodelan Kode yang Dikelompokkan.
Meskipun memiliki potensi luar biasa untuk aplikasi seperti pendidikan, hiburan, dan aksesibilitas, Microsoft menyadari risiko penyalahgunaan teknologi ini.
Lihat Juga :