Samsung Ungkap Pentingnya Data Lokal dalam Pengembangan AI untuk Galaxy S24
Jum'at, 10 Mei 2024 - 20:49 WIB
loading...
A
A
A
Tim SRIN yang menambahkan dukungan Bahasa Indonesia di Galaxy AI. “Pengembangan bahasa lokal harus didasarkan pada pemahaman dan ilmu pengetahuan, sehingga penambahan bahasa ke Galaxy AI dimulai dengan merencanakan informasi yang dibutuhkan oleh tim kami secara legal dan etis,” bebernya.
Proses yang Rumit
Untuk menjalankan fitur Live Translate di Galaxy AI, misalnya, cukup rumit. Ada 3 proses yang dijalankan. Yakni pengenalan ucapan otomatis (automatic speech recognition/ASR), mesin terjemahan (neural machine translation/NMT), dan teks-ke-suara (text-to-speech/TTS).
“Masing-masing proses tersebut memerlukan kumpulan informasi yang unik,” ungkapnya.
Automatic Speech Recognition, misalnya, butuh rekaman suara yang mencakup beragam situasi di berbagai kondisi, setiap rekaman dilengkapi transkripsi teks yang akurat.
“Sifat bahasa yang dinamis dan selalu berubah juga harus dipertimbangkan. Kita perlu terus memperbarui bahasa slang terbaru dan cara penggunaannya. Kami banyak temukan dari media sosial!,” tambah Muchlisin Adi Saputra, pemimpin tim ASR.
Selain data yang diperoleh secara legal dari pihak ketiga, tim ASR harus pergi ke kafe atau lingkungan kerja untuk merekam suara sendiri. “Gunanya untuk bisa menangkap suara-suara autentik yang unik dari kehidupan sehari-hari, seperti orang yang sedang memanggil atau ketikan keyboard,” beber Muchlisin.
Ternyata, dalam pengembangannya, Neural Machine Training juga membutuhkan data untuk melatih terjemahan.
Proses yang Rumit
![Samsung Ungkap Pentingnya Data Lokal dalam Pengembangan AI untuk Galaxy S24]()
Untuk menjalankan fitur Live Translate di Galaxy AI, misalnya, cukup rumit. Ada 3 proses yang dijalankan. Yakni pengenalan ucapan otomatis (automatic speech recognition/ASR), mesin terjemahan (neural machine translation/NMT), dan teks-ke-suara (text-to-speech/TTS).
“Masing-masing proses tersebut memerlukan kumpulan informasi yang unik,” ungkapnya.
Automatic Speech Recognition, misalnya, butuh rekaman suara yang mencakup beragam situasi di berbagai kondisi, setiap rekaman dilengkapi transkripsi teks yang akurat.
“Sifat bahasa yang dinamis dan selalu berubah juga harus dipertimbangkan. Kita perlu terus memperbarui bahasa slang terbaru dan cara penggunaannya. Kami banyak temukan dari media sosial!,” tambah Muchlisin Adi Saputra, pemimpin tim ASR.
Selain data yang diperoleh secara legal dari pihak ketiga, tim ASR harus pergi ke kafe atau lingkungan kerja untuk merekam suara sendiri. “Gunanya untuk bisa menangkap suara-suara autentik yang unik dari kehidupan sehari-hari, seperti orang yang sedang memanggil atau ketikan keyboard,” beber Muchlisin.
Ternyata, dalam pengembangannya, Neural Machine Training juga membutuhkan data untuk melatih terjemahan.
Lihat Juga :