Tak Perlu ke Tukang Servis, Apple Kini Dapat Perbaiki Bug dengan AI
Minggu, 19 Oktober 2025 - 19:45 WIB
loading...
A
A
A
Studi kedua membahas tentang bagaimana AI dapat menyederhanakan waktu para engineer dalam mngotomatisasi seluruh proses pengujian. Para peniliti mengembangkan sistem yang memanfaatkan LLM dan Agen AI otonom.
Sistem ini dirancang untuk menghasilkan dan mengelola artefak pengujian, mulai dari rencana hingga laporan validasi, secara otomatis. Hasil Studi ini dinilai menjanjikan dengan peningkatan akurasi pengujian dari 65 persen menjadi 94,8 persen.
Penelitian ketiga yang disebut SWE-Gym, sebuah platform latihan bagi agen AI agar mampu membaca, mengedit, dan memverifikasi kode nyata. Platform ini dibangun menggunakan 2.438 tugas Python dunia nyata dari repositori sumber terbuka.
Agen yang dilatih menggunakan SWE-Gym berhasil menyelesaikan 72,5 persen tugas dengan benar melampaui tolok ukur sebelumnya lebih dari 20 poin persentase.
Namun, varian Lite memiliki keterbatasan dalam hal skala dan kompleksitas tugas, sehingga efektivitasnya di skenario besar belum optimal.
Sistem ini dirancang untuk menghasilkan dan mengelola artefak pengujian, mulai dari rencana hingga laporan validasi, secara otomatis. Hasil Studi ini dinilai menjanjikan dengan peningkatan akurasi pengujian dari 65 persen menjadi 94,8 persen.
Penelitian ketiga yang disebut SWE-Gym, sebuah platform latihan bagi agen AI agar mampu membaca, mengedit, dan memverifikasi kode nyata. Platform ini dibangun menggunakan 2.438 tugas Python dunia nyata dari repositori sumber terbuka.
Agen yang dilatih menggunakan SWE-Gym berhasil menyelesaikan 72,5 persen tugas dengan benar melampaui tolok ukur sebelumnya lebih dari 20 poin persentase.
Namun, varian Lite memiliki keterbatasan dalam hal skala dan kompleksitas tugas, sehingga efektivitasnya di skenario besar belum optimal.
(wbs)
Lihat Juga :