Biaya Pelatihan DeepSeek R1 18 Kali Lebih Murah Dibandingkan Model AI Lainnya

DeepSeek R1. FOTO/ CNC

A A A

MOBIL TERBARU - Awak tahun ini, model DeepSeek R1 menjadi viral di media sosial karena kemampuannya yang tinggi meskipun diproduksi oleh perusahaan China yang kurang dikenal.

Biaya pelatihan model DeepSeek R1 sebenarnya hanya USD294.000 menggunakan 512 chip NVIDIA H800, jauh lebih rendah daripada perkiraan awal dan model AI lainnya karena teknik pembelajaran penguatan coba-coba.

Model ini tidak sepenuhnya bergantung pada data yang diberikan oleh manusia, melainkan memperoleh jawabannya sendiri melalui eksperimen, tetapi sulit untuk menjelaskan proses berpikirnya secara detail.

DeepSeek R1 terlalu rumit untuk dipahami manusia biasa, tidak seperti model seperti ChatGPT dan Gemini yang dapat menjelaskan cara kerjanya lebih jelas.

Saat itu, sebuah laporan muncul bahwa biaya pelatihan model ini sekitar USD5,58 juta, yang jauh lebih murah daripada biaya model AI lainnya dan menggunakan chip NVIDIA. Akibatnya, saham NVIDIA turun sementara.

Pagi ini, terungkap bahwa biaya pelatihan DeepSeek R1 sebenarnya hanya USD294.000 dan menggunakan 512 chip NVIDIA H800.

Rahasia ini terungkap dalam sebuah makalah penelitian yang diterbitkan di jurnal Nature. Biaya pelatihan R1 lebih rendah karena menggunakan teknik pembelajaran penguatan coba-coba.

Model diberi skor jika berhasil menemukan jawabannya sendiri melalui coba-coba.
Model lain menggunakan data yang disediakan oleh manusia untuk belajar memecahkan masalah tertentu. Hal ini membutuhkan lebih banyak waktu dan biaya.

Namun, kelemahan model ini adalah sulitnya menjelaskan cara berpikirnya untuk mendapatkan jawaban.

Model ini terlalu rumit dan panjang untuk dipahami kebanyakan manusia. Kebanyakan model AI seperti ChatGPT dan Gemini dapat menjelaskan cara kerja matematika, misalnya, dengan cara yang lebih sederhana.

(wbs)

Lihat Juga :