Alibaba Qwen Diluncurkan, AI dengan Kecerdasan Melebihi DeepSeek
Kamis, 30 Januari 2025 - 11:17 WIB
loading...
A
A
A
Menurut data yang dirilis oleh Alibaba Cloud lewat WeChat, Qwen 2.5 Max berhasil mengalahkan performa model-model populer seperti Llama dari Meta dan DeepSeek V3 dalam berbagai tes.
Bahkan, model ini juga disebut-sebut lebih unggul dari beberapa produk OpenAI dan Anthropic dalam metrik evaluasi tertentu. Salah satu benchmark yang paling mencolok adalah performanya di Arena Hard , LiveBench , LiveCodeBench , dan GPQA-Diamond , di mana Qwen 2.5 Max berhasil melampaui DeepSeek V3.
Alibaba juga menjelaskan bahwa Qwen 2.5 Max adalah model MoE (Mixture of Experts) skala besar yang dilatih menggunakan dataset masif.
Proses pelatihan ini diperkuat dengan teknik SFT (Supervised Fine-Tuning) dan RLHF (Reinforcement Learning from Human Feedback), yang membuatnya semakin canggih dan kompetitif.
Bahkan, model ini juga disebut-sebut lebih unggul dari beberapa produk OpenAI dan Anthropic dalam metrik evaluasi tertentu. Salah satu benchmark yang paling mencolok adalah performanya di Arena Hard , LiveBench , LiveCodeBench , dan GPQA-Diamond , di mana Qwen 2.5 Max berhasil melampaui DeepSeek V3.
Alibaba juga menjelaskan bahwa Qwen 2.5 Max adalah model MoE (Mixture of Experts) skala besar yang dilatih menggunakan dataset masif.
Proses pelatihan ini diperkuat dengan teknik SFT (Supervised Fine-Tuning) dan RLHF (Reinforcement Learning from Human Feedback), yang membuatnya semakin canggih dan kompetitif.
(wbs)
Lihat Juga :