Google dan UGM Membuat Mesin Text-to-Speech untuk Bahasa Jawa
A
A
A
JAKARTA - Google mengumumkan bahwa Project Unison akan bekerja sama dengan Fakultas Ilmu Budaya Universitas Gadjah Mada (UGM) dalam mengumpulkan rekaman tuturan bahasa Jawa untuk membuat model bahasa yang lebih baik bagi orang Indonesia yang menggunakan produk-produk Google.
Selama beberapa minggu ke depan, rekaman audio penutur Bahasa Jawa di Yogyakarta akan digabungkan guna membuat suara berbahasa Jawa untuk ponsel Android. Hal ini akan memungkinkan penutur Bahasa Jawa menggunakan masukan suara (voice input) pada ponsel dan juga mendengarkan ponsel membacakan kembali teks dalam Bahasa Jawa (text-to-speech).
Dengan demikian, 80 juta penutur Bahasa Jawa di Indonesia akan dapat berinteraksi dengan ponsel cerdas mereka secara lebih alami dan mendorong mereka untuk lebih mengembangkan budaya Jawa di Internet.
Project Unison adalah proyek penelitian Google untuk membuat suara text-to-speech dengan lebih cepat, murah dan efisien untuk bahasa dengan sumber daya terbatas. Di masa lalu, membuat suara text-to-speech (TTS) yang cukup layak untuk bahasa dengan sumber daya terbatas sulit dilakukan, bukan hanya karena biaya yang tinggi tapi juga karena besarnya data audio yang dibutuhkan. Namun, kemajuan teknologi belakangan ini dalam pembelajaran mesin telah memungkinkan Google membuat model suara dengan data yang sangat terbatas.
Google kini dapat mengumpulkan sampel suara hanya dengan perangkat seharga 2,000 dolar AS (komputer, mikrofon, USB converter, dan preamplifier). Tim di Google telah menyelesaikan proyek serupa dalam Bahasa Bengali (dengan 210 juta penutur) dan menambahkan opsi text-to-speech dalam Bahasa Bengali di ponsel Android.
Mulai awal Mei, Fakultas Ilmu Budaya (FIB) UGM akan menyediakan ruangan dan peserta pengumpulan data suara. Google juga akan bekerja sama dengan Universitas Reykjavik untuk Bahasa dengan Sumber Daya Terbatas dalam usaha untuk memasukkan lebih banyak bahasa ke online dan membuat alat yang tersedia melalui sumber terbuka (open source) untuk mendukung penelitian dan pengembangan.
Selama berada di UGM, peneliti Google akan mengajarkan pengembang lokal dan mahasiswa cara menggunakan teknologi dan data Google yang dapat diakses secara terbuka, dan mengajak banyak orang dari berbagai penjuru Indonesia untuk mengikuti lokakarya teknik.
Data suara berbahasa Jawa yang akan dikumpulkan dalam beberapa minggu ke depan dapat diakses secara terbuka, sehingga pengembang maupun peneliti di kampus-kampus di Indonesia nantinya dapat mengembangkan teknologi berbahasa Jawa sendiri.
Selama beberapa minggu ke depan, rekaman audio penutur Bahasa Jawa di Yogyakarta akan digabungkan guna membuat suara berbahasa Jawa untuk ponsel Android. Hal ini akan memungkinkan penutur Bahasa Jawa menggunakan masukan suara (voice input) pada ponsel dan juga mendengarkan ponsel membacakan kembali teks dalam Bahasa Jawa (text-to-speech).
Dengan demikian, 80 juta penutur Bahasa Jawa di Indonesia akan dapat berinteraksi dengan ponsel cerdas mereka secara lebih alami dan mendorong mereka untuk lebih mengembangkan budaya Jawa di Internet.
Project Unison adalah proyek penelitian Google untuk membuat suara text-to-speech dengan lebih cepat, murah dan efisien untuk bahasa dengan sumber daya terbatas. Di masa lalu, membuat suara text-to-speech (TTS) yang cukup layak untuk bahasa dengan sumber daya terbatas sulit dilakukan, bukan hanya karena biaya yang tinggi tapi juga karena besarnya data audio yang dibutuhkan. Namun, kemajuan teknologi belakangan ini dalam pembelajaran mesin telah memungkinkan Google membuat model suara dengan data yang sangat terbatas.
Google kini dapat mengumpulkan sampel suara hanya dengan perangkat seharga 2,000 dolar AS (komputer, mikrofon, USB converter, dan preamplifier). Tim di Google telah menyelesaikan proyek serupa dalam Bahasa Bengali (dengan 210 juta penutur) dan menambahkan opsi text-to-speech dalam Bahasa Bengali di ponsel Android.
Mulai awal Mei, Fakultas Ilmu Budaya (FIB) UGM akan menyediakan ruangan dan peserta pengumpulan data suara. Google juga akan bekerja sama dengan Universitas Reykjavik untuk Bahasa dengan Sumber Daya Terbatas dalam usaha untuk memasukkan lebih banyak bahasa ke online dan membuat alat yang tersedia melalui sumber terbuka (open source) untuk mendukung penelitian dan pengembangan.
Selama berada di UGM, peneliti Google akan mengajarkan pengembang lokal dan mahasiswa cara menggunakan teknologi dan data Google yang dapat diakses secara terbuka, dan mengajak banyak orang dari berbagai penjuru Indonesia untuk mengikuti lokakarya teknik.
Data suara berbahasa Jawa yang akan dikumpulkan dalam beberapa minggu ke depan dapat diakses secara terbuka, sehingga pengembang maupun peneliti di kampus-kampus di Indonesia nantinya dapat mengembangkan teknologi berbahasa Jawa sendiri.
(dol)