Icma.az
close
up
RU
Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK

Icma.az, Lent az saytından verilən məlumata əsaslanaraq xəbər yayır.

 Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonrakı hadisələr barədə daha çox məlumat almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:87
embedMənbə:https://lent.az
archiveBu xəbər 28 Dekabr 2024 13:54 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Gürcüstanda etiraz dalğası çevrilişin elementlərini meydana gətirə bilər ŞƏRH

07 Oktyabr 2025 18:20see289

Namiq Qaraçuxurludan səmimi status FOTO

06 Oktyabr 2025 17:58see214

Adnanın həbsindən sonra onların da başı dərddə Böyük əməliyyat başlayır?

06 Oktyabr 2025 20:34see158

Azərbaycan bu toplantıdan ən çox faydalananlardan biri olacaq

07 Oktyabr 2025 10:36see155

TDT baş katibi elan etdi: Qəbələdə bu format təsis ediləcək

07 Oktyabr 2025 01:20see154

Bakı yenidən qurulur Söküntü olacaq

08 Oktyabr 2025 00:14see148

Villasını bu qiymətə satır Foto

06 Oktyabr 2025 21:22see147

Yıxılaraq xəsarət alan yazıçı vəfat etdi

07 Oktyabr 2025 02:03see145

Türkiyənin müdafiə sənayesində tarixi sıçrayış: NATO standartlarını geridə qoyan Altay

07 Oktyabr 2025 01:13see135

Keşiş olmaq istəyirdi, QOVULDU: məşhur rejissorun həyatı haqqında yeni film

06 Oktyabr 2025 17:42see134

Yeni qlobal gücə doğru inamlı addımlar Şərh

06 Oktyabr 2025 16:52see133

Azərbaycandan qaça bilmiş separatçı general “FSB“ generalıyla əməkdaşlıq edərək onun Paşinyanın yerinə namizədliyini dəstəkləyəcək... “CivilNet“

07 Oktyabr 2025 18:36see133

Şəmkirdə 40 yaşlı qadın öldü Əri saxlanıldı

06 Oktyabr 2025 21:11see132

Makron “dron divarı”na qarşı çıxdı

07 Oktyabr 2025 01:48see130

Manat əmanəti hansı bankda sərfəli deyil? ADLAR

07 Oktyabr 2025 23:52see129

Azərbaycan şahmatçılarının 2025 ci il şahmat üzrə Dünya Kubokundakı rəqibləri bəlli olub

07 Oktyabr 2025 02:31see129

Mütəxəssisdən xəbərdarlıq: Qrip peyvəndi ağır fəsadların qarşısını alır

06 Oktyabr 2025 17:46see126

Makron pis vəziyyətə düşdü Parlamenti buraxır

08 Oktyabr 2025 06:15see126

Mavi İşığ ın 600 min vergi borcu var

06 Oktyabr 2025 23:50see125

Qərbi Azərbaycan Xronikası: Ruslar Cənubi Qafqaza daxil olandan sonra xalqımız dəfələrlə deportasiya olunub

07 Oktyabr 2025 02:00see123
newsSon xəbərlər
Günün ən son və aktual hadisələri