
DEEPSEEK meluncurkan model AI penalaran R1 untuk kinerja sejumlah tolok ukur matematika dan pengodean. Pengembang Australia yang mengembangkan evaluasi AI, Sam Paech dalam unggahan di platform X, Paech menyampaikan bahwa pilihan kata dan gaya respons model DeepSeek R1-0528 memiliki kemiripan dengan keluaran Gemini Google Gemini 2.5 Pro, dikutip dari Antara , Rabu, 4 Juni 2025
Apa Itu Deepseek R1-0528?
Dikutip dari laporan Tech Chrunch , pembaruan yang dirilis sejak 29 Mei 2025, R1-0528 menunjukkan performa dalam berbagai uji kemampuan seperti pengodean, matematika, dan pengetahuan umum.
Adapun DeepSeek menyediakan versi yang lebih kecil dan ringan, yakni DeepSeek-R1-0528-Qwen3-8B. Meski berukuran kecil, model ini tetap menunjukkan performa yang mengesankan. DeepSeek mengeklaim AI ini mampu mengungguli model lain dengan ukuran sebanding dalam beberapa pengujian.
DeepSeek-R1-0528-Qwen3-8B dibangun menggunakan model Qwen3-8B milik Alibaba yang dirilis pada Mei 2025 sebagai dasar pengembangannya. Model ini dianggap bisa melampaui Google Gemini 2.5 Flash dalam AIME 2025. Model ini juga diklaim hampir menyamai kinerja Phi 4 Reasoning Plus milik Microsoft dalam uji keterampilan matematika lainnya, yakni HMMT.
Secara umum, model seperti DeepSeek-R1-0528-Qwen3-8B jauh lebih hemat dalam penggunaan daya komputasi. Menurut platform cloud NodeShift, model Qwen3-8B hanya membutuhkan GPU dengan kapasitas RAM antara 40 gigabita (GB) hingga 80GB untuk dijalankan, misalnya GPU Nvidia H100. Sebagai perbandingan, versi penuh dari R1 terbaru membutuhkan sekitar selusin GPU dengan RAM 80GB.
DeepSeek melatih DeepSeek-R1-0528-Qwen3-8B menggunakan teks-teks yang dihasilkan oleh model R1 terbaru. Halaman khusus disediakan di platform pengembang AI Hugging Face. DeepSeek menjelaskan bahwa model ini dirancang untuk dua tujuan utama yaitu riset akademis terkait model penalaran dan pengembangan industri yang berfokus pada model skala kecil.
Uji Patokan DeepSeek-R1-0528
Dalam uji tolok ukur standar ( benchmark) versi terbaru DeepSeek-R1-0528 mencapai akurasi 87,5 persen pada uji AIME 2025, menurut kutipan Panduan Tom Ini adalah peningkatan yang signifikan dari model sebelumnya yang hanya 70 persen. Performanya meningkat. patokan Pengodean LiveCodeBench, dari 63,5 persen menjadi 73,3 persen. Di bidang tes Humanity’s Last Exam dari 8,5 persen menjadi 17,7 persen.
No comments
Post a Comment
Punya pertanyaan, saran, atau kritik seputar topik ini? Yuk, tulis di kolom komentar, aku tunggu tanggapanmu!