DeepSeek-R2 geliyor: GPT-5’ten daha mı güzel olacak?

Okuma süresi: 1dk, 25sn

Çin merkezli yapay zeka teşebbüsü DeepSeek, kısa mühlet içinde piyasaya sürmeyi planladığı yeni büyük lisan modeli (LLM) DeepSeek-R2 ile tekrar gündeme geldi.

DAHA GENİŞ MANTIKSAL DÜŞÜNME

Huawei’nin Ascend 910B çip kümesiyle çalışan modelin 15-30 Ağustos ortasında tanıtılması bekleniyor. 512 PetaFLOPS süreç gücüne ulaşan sistem, evvelki R1 modeline nazaran daha gelişmiş mantıksal düşünme, cevap verme ve misyon verimliliği sunacak. Şirket, maliyet aktifliği, açık kaynak yapısı ve verimliliği müdafaayı hedefliyor.

NVIDIA PAYLARINDA TARİHİ BEDEL KAYBONA YOL AÇMIŞTI

DeepSeek, ocak ayında tanıttığı R1 modeliyle ABD teknoloji dünyasında şok tesiri yaratmıştı. Apple’ın ABD uygulama mağazasında en çok indirilen fiyatsız uygulama olan DeepSeek-R1, geliştirme maliyeti olarak sadece 5,6 milyon dolar harcandığını tez ederek OpenAI’nin milyarlarca dolarlık GPT modellerine rakip olmuştu. Bu durum, Nvidia paylarında tarihin en büyük tek günlük paha kaybına yol açmıştı.

ABD’DE GÜVENLİK ENDİŞELERİ

R1’in başarısı, “büyüğün her vakit daha güzel olduğu” anlayışını sorgulatmış, daha küçük lakin verimli modellerin de yüksek performans sunabileceğini göstermişti. Lakin şirket, Çin’deki bilgi merkezleri ve Pekin idaresiyle mümkün kontakları nedeniyle ABD’de güvenlik telaşlarıyla karşı karşıya kalmıştı.

Uzmanlara nazaran DeepSeek, R2 ile yine global rekabete dahil olmak istese de yüksek performanslı çip tedarikinde yaşanan ıstıraplar ve hem ABD hem de Çin’de artan rekabet, şirketin ivmesini sürdürmesini zorlaştırıyor.

Kaynak : {sitename