Icma.az
close
up
RU
Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK

Icma.az, Lent az saytından verilən məlumata əsaslanaraq xəbər yayır.

 Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonrakı hadisələr barədə daha çox məlumat almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:79
embedMənbə:https://lent.az
archiveBu xəbər 28 Dekabr 2024 13:54 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Paşinyan: Ermənistan və Azərbaycan ərazi bütövlüyü məsələsini həll edib

18 Avqust 2025 19:09see220

Britaniya həmin siyahını İrana verdi: Bu müsəlman ölkəsinin adı var!

19 Avqust 2025 00:40see186

Vətən sərhədlərində gözlərini qırpmadan keşik çəkənlər... Azərbaycan Sərhəd Mühafizəsi 106 yaşında

19 Avqust 2025 00:40see148

Vüqar Əhmədovun vazkeçilməz 10 manatlıq şirkəti Bu dəfə 2,3 milyonluq müqavilə bağlayıb

18 Avqust 2025 20:36see136

Azərbaycan dilində danışmıram? Özüm bilərəm Günel VİDEO

19 Avqust 2025 09:02see131

Pandemiya ilə bağlı yazılan cərimələr gələn il qüvvədən düşür HÜQUQŞÜNAS FOTO

18 Avqust 2025 15:33see125

Peskovun qızı istirahət görüntülərini paylaşdı FOTO

18 Avqust 2025 19:33see125

“Ata yurdumda uşaqlıq xatirələrimi yada salıram” DEPUTAT

18 Avqust 2025 08:25see125

Ukrayna Luqansk sərhədlərində 5 minə yaxın əsgərini itirib

18 Avqust 2025 08:08see125

Nəsillərə örnək olan qüdrətli poeziya Bəxtiyar Vahabzadə 100

19 Avqust 2025 21:02see122

İnsanın beyin hüceyrələri siçanları depressiyadan sağaldıb...

18 Avqust 2025 23:43see122

İqtisadçı: “Subsidiyaların hədəfə çatması üçün ciddi nəzarət mexanizmləri lazımdır”

18 Avqust 2025 14:34see121

Starlink in işində nasazlıq yarandı

19 Avqust 2025 02:37see120

Ukraynadakı müharibəni sona çatdıra bilərik NATO Baş katibi

19 Avqust 2025 00:04see120

İmişli də ən azı bir yüzfaizli qol imkanını əldən verdi Aslan Kərimov debütantlardan nə gözləyir?

19 Avqust 2025 02:36see117

Burak Yılmaz Super Liqa klubunda

19 Avqust 2025 00:05see117

Ədalətsiz 907 ci düzəlişin ləğvi Azərbaycanla ABŞ arasında qurulan strateji tərəfdaşlığın növbəti göstəricisidir ŞƏRH

18 Avqust 2025 08:37see117

Qarabağ ın Budapeşt zəfəri Video

20 Avqust 2025 02:51see117

Debütündə parlayan serb

18 Avqust 2025 14:01see117

Bakıda torpaq bahalaşıb VİDEO

20 Avqust 2025 00:29see115
newsSon xəbərlər
Günün ən son və aktual hadisələri