Bilim Teknoloji

Çinli yapay zeka şirketi DeepSeek, iki yeni açık kaynak modelini tanıttı!

Çinli yapay zeka şirketi DeepSeek, akıl yürütmeye odaklanan iki yeni açık kaynak modelini tanıttı. DeepSeek-V3.2 ve V3.2-Speciale modellerinin, matematik ve kodlama değerlendirmelerinde OpenAI’ın GPT-5’i ve Google’ın Gemini 3 Pro’su ile başa baş sonuçlar verdiği belirtiliyor.

Çinli yapay zeka şirketi DeepSeek, akıl yürütmeye odaklanan iki yeni modelini tanıtarak, Çin’den çıkan açık kaynak sistemlerin artık matematik ve kodlama değerlendirmelerinde ABD’nin önde gelen yapay zeka geliştiricilerinin performansına yetiştiğini ve bazı durumlarda geçtiğini gösterdi.

Hangzhou merkezli şirket, 1 Aralık’ta DeepSeek-V3.2’yi ve daha gelişmiş olan DeepSeek-V3.2-Speciale’yi duyurdu.

DeepSeek’e göre, her iki açık kaynak sürüm de OpenAI’ın GPT-5’i ve Google’ın Gemini 3 Pro’su ile aynı seviyede akıl yürütme sonuçları sunuyor.

Speciale versiyonu, Uluslararası Matematik Olimpiyatı, Çin Matematik Olimpiyatı, ICPC Dünya Finalleri ve 2025 Uluslararası Bilişim Olimpiyatı olmak üzere dört büyük yarışmada altın standart performansına ulaştı.

MATEMATİK TESTİNDE GPT-5 VE GEMİNİ’Yİ GERİDE BIRAKTI

2025 Amerikan Matematik Olimpiyatı Davet Sınavı’nda (AIME) DeepSeek-V3.2-Speciale, yüzde 96.0’lık bir puan aldı.

Bu sonuç, GPT-5 High’ın yüzde 94.6’lık ve Gemini 3 Pro’nun yüzde 95.0’lık puanının üzerinde.

Model, kodlama yeterliliği için önemli bir kıstas olan SWE Verified testinde ise yüzde 73.1 sonuç elde etti, ancak bu puan Gemini 3 Pro’nun yüzde 76.2’lik skorunun gerisinde kaldı.

ÇİN’İN AÇIK KAYNAK HAMLESİ GÜÇLENİYOR

Bu gelişme, Çin’in açık kaynak inovasyon yoluyla ABD’nin yapay zeka liderliğine meydan okuma çabasında bir adım daha anlamına geliyor.

2023 yılında Liang Wenfeng tarafından kurulan ve kantitatif hedge fonu High-Flyer tarafından desteklenen DeepSeek, Silikon Vadisi’nin özel mülk sistemleriyle rekabet edebilecek yüksek performanslı ve düşük maliyetli yapay zeka sistemleri üreticisi olarak konumlanıyor.

Bloomberg ise DeepSeek-V3.2’nin, eylül ayında tanıtılan önceki V3.2-Exp modelinin halefi olduğunu belirtti. Yeni modee artık DeepSeek’in uygulaması, web sitesi ve API’sinden erişilebiliyor.

Standart V3.2, güçlü verimlilikle GPT-5 seviyesinde yetenek sunan “günlük kullanım modeli” olarak tasarlanırken, V3.2-Speciale versiyonu ise son derece karmaşık problemlerde maksimum akıl yürütme gücü için optimize edildi.

AÇIK KAYNAK İNDİRMELERİNDE ÇİN ÖNE GEÇTİ

Son bulgular, Çin’in açık kaynak yapay zeka modeli indirmelerinde ABD’yi geride bıraktığını gösteriyor.

MIT ve Hugging Face tarafından yapılan araştırma, Çin modellerinin artık küresel indirmelerin yüzde 17’sini oluşturduğunu, Amerikan modellerinin payının ise yüzde 15.8 olduğunu ortaya koydu.

Analistler, bu değişimi Çin’in hızlı sürüm döngülerine ve daha az gelişmiş donanımlarda iyi çalışan hafif, erişilebilir modellere verdiği öneme bağlıyor.

Bu yaklaşım kısmen, ABD’nin yüksek kaliteli yapay zeka çiplerine yönelik ihracat kısıtlamalarıyla şekillendi.

ÇİN İÇİNDEKİ REKABET HIZLANIYOR

Diğer yandan, Çin’in yapay zeka endüstrisi de giderek daha rekabetçi hale geliyor. Alibaba ve Baidu gibi diğer büyük oyuncular da kendi sistemlerini hızla geliştiriyor.

Alibaba’nın Qwen 3 modeli, geçtiğimiz günlerde AIME 2025’te ve diğer birkaç matematik testinde mükemmel sonuçlar elde etti.

Stanford’un 2025 Yapay Zeka Endeksi Raporu’na göre ise Çin, küresel yapay zeka ile ilgili patent başvurularının yaklaşık yüzde 70’inden sorumlu.

“AJANLAR İÇİN İNŞA EDİLEN AKIL YÜRÜTME ÖNCELİKLİ MODELLER”

DeepSeek’in teknik dokümantasyonu, V3.2 ailesini “ajanlar için inşa edilen akıl yürütme öncelikli modeller” olarak nitelendiriyor.

Modeller, 1800 farklı ortamda 85 binden fazla zor görevin sentezlendiği yeni bir eğitim metodolojisi ile destekleniyor.

Şirket ayrıca, V3.2’nin akıl yürütmeyi doğrudan araç kullanım iş akışlarına gömen ilk model olduğunu belirtiyor.

Bu özellik, modelin kod yürütücüler veya arama yardımcıları gibi harici araçları kullanırken akıl yürütme ve akıl yürütme dışı modlar arasında geçiş yapabilmesini sağlıyor.

15 Aralık’a kadar yalnızca API üzerinden erişilebilir olacak V3.2-Speciale modeli, daha fazla işlem kaynağı gerektiriyor ancak DeepSeek’in “tamamen maksimize edilmiş akıl yürütme kapasitesi” olarak adlandırdığı performansı sunmak üzere tasarlandı.

Her iki varyant da, uzun girdileri işlemenin hesaplama maliyetini kabaca yüzde 50-70 oranında düşürmeyi amaçlayan bir teknik olan DeepSeek Seyrek Dikkat yöntemini içeriyor.