OpenAI Luncurkan o1: Model AI yang Dapat Bernalar Seperti Manusia

Sabtu, 14 September 2024 - 08:00 WIB
loading...
OpenAI Luncurkan o1:...
OpenAI terus menambah layanan terbaru mereka lewat o1. Foto: OpenAI
A A A
JAKARTA - OpenAI baru saja merilis model baru bernama o1. AI ini diklaim mampu “bernalar”, karena dilatih untuk menjawab pertanyaan lebih kompleks, bahkan lebih cepat daripada yang bisa dilakukan manusia. Bahkan, o1 bisa mengkoreksi dirinya sendiri.

Model ini dirilis bersama dengan o1-mini, versi lebih kecil dan lebih murah. o1 sendiri sebenarnya sama dengan Strawberry yang belakangan banyak dibicarakan.

Bagi OpenAI, o1 mewakili langkah menuju tujuan lebih luas, yaitu kecerdasan buatan yang mirip manusia.

Model ini diklaim dapat melakukan pekerjaan lebih baik dalam menulis kode dan memecahkan masalah multi-langkah daripada model sebelumnya. Meski demikian, model ini juga lebih mahal dan lebih lambat untuk digunakan daripada GPT-4o.

Pengguna ChatGPT Plus dan Team sudah mendapatkan akses ke o1-preview dan o1-mini, sementara pengguna Enterprise dan Edu akan mendapatkan akses awal minggu depan.

OpenAI mengatakan pihaknya berencana untuk membawa akses o1-mini ke semua pengguna gratis ChatGPT tetapi belum menetapkan tanggal rilis.

Akses pengembang ke o1 sangat mahal: Dalam API, o1-preview adalah USD15 per 1 juta token input, atau potongan teks yang diuraikan oleh model, dan USD60 per 1 juta token output. Sebagai perbandingan, GPT-4o berharga USD5 per 1 juta token input dan USD15 per 1 juta token output.

Pelatihan di Balik o1

Pelatihan di balik o1 secara fundamental berbeda dari pendahulunya, kata pemimpin penelitian OpenAI, Jerry Tworek. Dia mengatakan, o1 telah dilatih menggunakan algoritma pengoptimalan yang sama sekali baru dan kumpulan data pelatihan baru yang khusus disesuaikan untuknya.

OpenAI mengajarkan model GPT sebelumnya untuk meniru pola dari data pelatihannya. Dengan o1, OpenAI melatih model untuk memecahkan masalah sendiri menggunakan teknik yang dikenal sebagai pembelajaran penguatan, yang mengajarkan sistem melalui penghargaan dan hukuman.

Kemudian menggunakan "rantai pemikiran" untuk memproses pertanyaan, mirip dengan cara manusia memproses masalah dengan menjalaninya langkah demi langkah.

Hasil Pelatihan Baru

Sebagai hasil dari metodologi pelatihan baru ini, OpenAI mengatakan bahwa model tersebut akan lebih akurat.

Hal utama yang membedakan model baru ini dari GPT-4o adalah kemampuannya untuk mengatasi masalah kompleks, seperti pengkodean dan matematika, jauh lebih baik daripada pendahulunya sekaligus juga menjelaskan alasannya, menurut OpenAI.
Halaman :
Dapatkan berita terkini dan kejutan menarik dari SINDOnews.com, Klik Disini untuk mendaftarkan diri anda sekarang juga!
Baca Berita Terkait Lainnya
Copyright ©2024 SINDOnews.com
All Rights Reserved
read/ rendering in 0.3052 seconds (0.1#10.140)