OpenAI Luncurkan o1: Model AI yang Dapat Bernalar Seperti Manusia

A A A

"Model ini jelas lebih baik dalam menyelesaikan tes matematika AP daripada saya, dan saya mengambil jurusan matematika di perguruan tinggi," kata kepala petugas penelitian OpenAI, Bob McGrew. Dia mengatakan OpenAI juga menguji o1 terhadap ujian kualifikasi untuk Olimpiade Matematika Internasional, dan sementara GPT-4o hanya menyelesaikan 13 persen masalah dengan benar, o1 mendapat skor 83 persen.

Dalam kontes pemrograman online yang dikenal sebagai kompetisi Codeforces, model baru ini mencapai persentil ke-89 peserta, dan OpenAI mengklaim pembaruan model berikutnya ini akan berkinerja "mirip dengan mahasiswa PhD pada tugas benchmark yang menantang dalam fisika, kimia, dan biologi."

Keterbatasan o1

Pada saat yang sama, o1 tidak sehebat GPT-4o di banyak bidang. Model ini tidak bekerja sebaik pada pengetahuan faktual tentang dunia. Model ini juga tidak memiliki kemampuan untuk menjelajahi web atau memproses file dan gambar. Namun, perusahaan percaya bahwa model ini mewakili kelas kemampuan baru. Model ini diberi nama o1 untuk menunjukkan "mengatur ulang penghitung kembali ke 1."

Kenapa Dirancang Seperti Manusia?

Namun model ini tidak berpikir, dan tentu saja bukan manusia. Jadi, mengapa mendesainnya agar tampak seperti itu?

OpenAI tidak percaya dalam menyamakan pemikiran model AI dengan pemikiran manusia, menurut Tworek. Tetapi antarmuka ini dimaksudkan untuk menunjukkan bagaimana model menghabiskan lebih banyak waktu untuk memproses dan menggali lebih dalam untuk memecahkan masalah.

Baca Juga: Apple dan NVIDIA Berebut Ingin Menyatu dengan OpenAI

Saat ini OpenAI dilaporkan ingin meningkatkan lebih banyak pendanaan dengan valuasi USD150 miliar.

Bagi para peneliti AI, memecahkan penalaran adalah langkah penting berikutnya menuju kecerdasan tingkat manusia. Pemikirannya adalah, jika sebuah model mampu melakukan lebih dari sekadar pengenalan pola, ia dapat membuka terobosan di bidang-bidang seperti kedokteran dan teknik. Namun untuk saat ini, kemampuan penalaran o1 relatif lambat, tidak seperti agen, dan mahal untuk digunakan olehpengembang.

(dan)

Halaman :

Baca Selengkapnya

Lihat Juga :