DeepSeek Dapatkan Chip Nvidia Dituding dari Singapura
Minggu, 09 Februari 2025 - 11:02 WIB
loading...
A
A
A
Namun, sebelumnya mereka menyatakan bahwa model V3 mereka—dengan 671 miliar parameter—dilatih hanya dalam dua bulan menggunakan 2.048 unit GPU Nvidia H800, dengan total penggunaan 2,8 juta jam GPU.
Sebagai perbandingan, Meta membutuhkan 30,8 juta jam GPU untuk melatih model Llama 3 yang memiliki 405 miliar parameter, menggunakan 16.384 unit H100 selama 54 hari.
Efisiensi tinggi dari model R1 menimbulkan spekulasi bahwa DeepSeek menggunakan kluster yang lebih kuat dibandingkan dengan yang digunakan untuk model V3.
Hal ini semakin memperkuat dugaan bahwa perusahaan tersebut memperoleh GPU Nvidia yang terkena pembatasan secara tidak langsung melalui pihak ketiga di Singapura.
Sebagai perbandingan, Meta membutuhkan 30,8 juta jam GPU untuk melatih model Llama 3 yang memiliki 405 miliar parameter, menggunakan 16.384 unit H100 selama 54 hari.
Efisiensi tinggi dari model R1 menimbulkan spekulasi bahwa DeepSeek menggunakan kluster yang lebih kuat dibandingkan dengan yang digunakan untuk model V3.
Hal ini semakin memperkuat dugaan bahwa perusahaan tersebut memperoleh GPU Nvidia yang terkena pembatasan secara tidak langsung melalui pihak ketiga di Singapura.
(wbs)
Lihat Juga :