DeepSeek şirkəti V4 modelini təqdim etdi və bu addım süni intellekt dünyasında ciddi sarsıntıya səbəb oldu. 1,6 trilyon parametrə sahib olan bu model, Mixture of Experts (MoE) arxitekturası ilə qurulub və 49 milyard aktiv parametr, 1 milyon tokenlik kontekst pəncərəsi ilə fərqlənir.
DeepSeek V4-ün Texniki Gücü
V4 Pro modeli 33 trilyon tokenlə öyrədilib. Agentlik kod benchmark-larında, MMLU Pro, GPQA Diamond və SWE-bench Verified testlərində OpenAI-nin GPT-5.5 və Anthropic-in Opus 4.7 modellərinə çox yaxın nəticələr göstərir. V4 Flash versiyası isə 284 milyard ümumi parametr, 13 milyard aktiv parametrlə sürətli işləmə üçün optimallaşdırılıb. Hər iki model fərqli ölçü seqmentlərini hədəf alır: V4 Pro ən mürəkkəb tapşırıqlar üçün, V4 Flash gündəlik iş yükləri üçün nəzərdə tutulub.
ABŞ-ın Süni İntellekt Üstünlüyünə Təsiri
Analitiklər bu buraxılışın ABŞ üçün strateji risk daşıdığını vurğulayır. Əksər biznes tətbiqləri üçün ən yüksək frontier modelə ehtiyac olmadığı nəzərə alındıqda, DeepSeek V4-ün qiymət-performans nisbəti Çin şirkətlərinin qlobal bazarda öz mövqelərini gücləndirməsinə imkan yaradır. Bu, Microsoft, Google və digər Amerikan texnologiya nəhənglərinin süni intellekt üzərindəki dominant mövqeyini ciddi şəkildə sorğulayır. Xəbərlər süni intellekt yarışının yeni fazaya keçdiyini göstərir.
Mənbə: habr.com



