Kecerdasan Buatan Bisa Pelajari Pola Bahasa Manusia
loading...
A
A
A
JAKARTA - Bahasa manusia terkenal rumit, dan para ahli bahasa telah mengatakan bahwa tidak mungkin mengajarkan mesin untik bisa menganalisis bahasa serta tutur kata seperti yang dilakukan oleh manusia.
Tetapi para peneliti di MIT, Cornell University, dan McGill University telah mematahkan anggapan ini. Mereka mendemonstrasikan sistem kecerdasan buatan (AI) yang dapat mempelajari aturan dan pola bahasa manusia.
Para peneliti melatih dan menguji model menggunakan masalah dari buku teks linguistik yang menampilkan 58 bahasa yang berbeda. Setiap masalah memiliki seperangkat kata dan perubahan bentuk kata yang sesuai.
Model tersebut mampu menghasilkan seperangkat aturan yang benar untuk menggambarkan perubahan bentuk kata tersebut untuk 60 persen masalah. Dan menariknya ini dilakukan hanya dengan menggunakan kumpulan data kecil.
"Salah satu motivasi dari pekerjaan ini adalah keinginan kami untuk mempelajari sistem yang mempelajari model kumpulan data yang direpresentasikan dengan cara yang dapat dipahami manusia," kata Kevin Ellis '14, PhD '20, Asisten Profesor iImu Komputer di Cornell University.
"Alih-alih mempelajari bobot, dapatkah model mempelajari ekspresi atau aturan? Dan kami ingin melihat apakah kami dapat membangun sistem ini sehingga sistem ini dapat mempelajari seluruh rangkaian data yang saling terkait, untuk membuat sistem belajar sedikit tentang cara memodelkan masing-masing dengan lebih baik,” lanjutnya.
Untuk membangun model yang dapat mempelajari seperangkat aturan untuk merangkai kata, yang disebut tata bahasa, para peneliti menggunakan teknik pembelajaran mesin yang dikenal sebagai Pembelajaran Program Bayesia.
Dengan teknik tersebut, model memecahkan masalah dengan menulis program komputer. Dalam hal ini, program adalah tata bahasa yang menurut model merupakan penjelasan yang paling mungkin dari kata-kata dan makna dalam masalah linguistik
Mereka membangun model menggunakan Sketch, program synthesizer populer yang dikembangkan di MIT oleh Solar-Lezama. Tetapi Sketch membutuhkan banyak waktu untuk mempertimbangkan program yang paling mungkin.
Untuk menyiasatinya, para peneliti meminta model bekerja satu per satu, menulis program kecil untuk menjelaskan beberapa data, kemudian menulis program yang lebih besar yang memodifikasi program kecil itu untuk mencakup lebih banyak data, dan seterusnya.
Ketika mereka menguji model menggunakan 70 masalah buku teks, mereka dapat menemukan tata bahasa yang cocok dengan seluruh rangkaian kata dalam masalah dalam 60 persen kasus, dan cocok dengan sebagian besar perubahan bentuk kata dalam 79 persen masalah.
Para peneliti juga mencoba pra-pemrograman model dengan beberapa pengetahuan yang seharusnya dipelajari jika mengambil kursus linguistik, dan menunjukkan bahwa itu bisa menyelesaikan semua masalah dengan lebih baik.
Tak lupa para peneliti juga melakukan tes yang menunjukkan bahwa model tersebut mampu mempelajari beberapa pola umum aturan fonologis yang dapat diterapkan di semua masalah.
“Salah satu hal yang paling mengejutkan adalah kami dapat belajar lintas bahasa, tetapi tampaknya tidak membuat perbedaan besar. Itu menunjukkan dua hal. Mungkin kita membutuhkan metode yang lebih baik untuk belajar melintasi masalah," ungkap Ellis.
"Dan mungkin, jika kami tidak dapat menemukan metode tersebut, pekerjaan ini dapat membantu kami menyelidiki berbagai ide yang kami miliki tentang pengetahuan apa yang harus dibagikan untuk mengatasi masalah," tambahnya.
Di masa depan, para peneliti ingin menggunakan model mereka untuk menemukan solusi tak terduga untuk masalah di domain lain. Mereka juga dapat menerapkan teknik ini ke lebih banyak situasi di mana pengetahuan tingkat tinggi dapat diterapkan di seluruh kumpulan data yang saling terkait.
Misalnya, mungkin mereka dapat mengembangkan sistem untuk menyimpulkan persamaan diferensial dari kumpulan data tentang gerakan objek yang berbeda.
Tetapi para peneliti di MIT, Cornell University, dan McGill University telah mematahkan anggapan ini. Mereka mendemonstrasikan sistem kecerdasan buatan (AI) yang dapat mempelajari aturan dan pola bahasa manusia.
Baca Juga
Para peneliti melatih dan menguji model menggunakan masalah dari buku teks linguistik yang menampilkan 58 bahasa yang berbeda. Setiap masalah memiliki seperangkat kata dan perubahan bentuk kata yang sesuai.
Model tersebut mampu menghasilkan seperangkat aturan yang benar untuk menggambarkan perubahan bentuk kata tersebut untuk 60 persen masalah. Dan menariknya ini dilakukan hanya dengan menggunakan kumpulan data kecil.
"Salah satu motivasi dari pekerjaan ini adalah keinginan kami untuk mempelajari sistem yang mempelajari model kumpulan data yang direpresentasikan dengan cara yang dapat dipahami manusia," kata Kevin Ellis '14, PhD '20, Asisten Profesor iImu Komputer di Cornell University.
"Alih-alih mempelajari bobot, dapatkah model mempelajari ekspresi atau aturan? Dan kami ingin melihat apakah kami dapat membangun sistem ini sehingga sistem ini dapat mempelajari seluruh rangkaian data yang saling terkait, untuk membuat sistem belajar sedikit tentang cara memodelkan masing-masing dengan lebih baik,” lanjutnya.
Untuk membangun model yang dapat mempelajari seperangkat aturan untuk merangkai kata, yang disebut tata bahasa, para peneliti menggunakan teknik pembelajaran mesin yang dikenal sebagai Pembelajaran Program Bayesia.
Dengan teknik tersebut, model memecahkan masalah dengan menulis program komputer. Dalam hal ini, program adalah tata bahasa yang menurut model merupakan penjelasan yang paling mungkin dari kata-kata dan makna dalam masalah linguistik
Mereka membangun model menggunakan Sketch, program synthesizer populer yang dikembangkan di MIT oleh Solar-Lezama. Tetapi Sketch membutuhkan banyak waktu untuk mempertimbangkan program yang paling mungkin.
Untuk menyiasatinya, para peneliti meminta model bekerja satu per satu, menulis program kecil untuk menjelaskan beberapa data, kemudian menulis program yang lebih besar yang memodifikasi program kecil itu untuk mencakup lebih banyak data, dan seterusnya.
Ketika mereka menguji model menggunakan 70 masalah buku teks, mereka dapat menemukan tata bahasa yang cocok dengan seluruh rangkaian kata dalam masalah dalam 60 persen kasus, dan cocok dengan sebagian besar perubahan bentuk kata dalam 79 persen masalah.
Para peneliti juga mencoba pra-pemrograman model dengan beberapa pengetahuan yang seharusnya dipelajari jika mengambil kursus linguistik, dan menunjukkan bahwa itu bisa menyelesaikan semua masalah dengan lebih baik.
Tak lupa para peneliti juga melakukan tes yang menunjukkan bahwa model tersebut mampu mempelajari beberapa pola umum aturan fonologis yang dapat diterapkan di semua masalah.
“Salah satu hal yang paling mengejutkan adalah kami dapat belajar lintas bahasa, tetapi tampaknya tidak membuat perbedaan besar. Itu menunjukkan dua hal. Mungkin kita membutuhkan metode yang lebih baik untuk belajar melintasi masalah," ungkap Ellis.
"Dan mungkin, jika kami tidak dapat menemukan metode tersebut, pekerjaan ini dapat membantu kami menyelidiki berbagai ide yang kami miliki tentang pengetahuan apa yang harus dibagikan untuk mengatasi masalah," tambahnya.
Di masa depan, para peneliti ingin menggunakan model mereka untuk menemukan solusi tak terduga untuk masalah di domain lain. Mereka juga dapat menerapkan teknik ini ke lebih banyak situasi di mana pengetahuan tingkat tinggi dapat diterapkan di seluruh kumpulan data yang saling terkait.
Misalnya, mungkin mereka dapat mengembangkan sistem untuk menyimpulkan persamaan diferensial dari kumpulan data tentang gerakan objek yang berbeda.
(wbs)