Icma.az
close
up
RU
Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK

Icma.az, Lent az saytından verilən məlumata əsaslanaraq xəbər yayır.

 Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonrakı hadisələr barədə daha çox məlumat almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:70
embedMənbə:https://lent.az
archiveBu xəbər 28 Dekabr 2024 13:54 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Qadınlar hansı kişiləri daha çox sevirlər: dolğun, yoxsa arıq və əzələli olanları?

04 İyul 2025 00:45see128

Qəzzada 60 gün...

03 İyul 2025 08:15see126

Makron digər Aİ liderlərini qabaqlamağa tələsir

03 İyul 2025 07:52see125

ABŞ 100 ə yaxın ölkəyə 10% rüsum tətbiq edəcək

04 İyul 2025 01:23see122

Pezeşkian: Azərbaycan türkcəsində təhsil milli və beynəlxalq öhdəlikdir

04 İyul 2025 01:48see122

A Seriyasının debütantı yeni baş məşqçi ilə anlaşdı

02 İyul 2025 21:50see121

"Qurdlar vadisi"nin məşhur aktyoru vəfat etdi

03 İyul 2025 01:43see121

Ersin Tatar: Türk dünyası sülh və müstəqilliyi birgə qorumalıdır

02 İyul 2025 23:22see121

2000 ci illərin mikro şortları yenidən modaya dönəcək...

03 İyul 2025 01:09see120

Bu yola yeni kamera quraşdırılıb: Belə edənləri çəkir VİDEO

03 İyul 2025 20:35see120

İki qəsəbədə qaz təchizatı dayandırılacaq

03 İyul 2025 09:12see120

Meladzenin Yurmala konsertində qalmaqal olub

03 İyul 2025 08:23see118

Abşeron rayonunda güclü yanğın Onlarla hektar ərazi alov içindədir (VİDEO) KONKRET

02 İyul 2025 23:48see118

İzmir meriyasının keçmiş müxalifət işçiləri korrupsiya ittihamı ilə saxlanılıb

03 İyul 2025 07:40see118

Kiyev bombalanır: Yaşayış binalarında yanğınlar, dağıntılar

04 İyul 2025 03:23see117

31 il ötdü...

03 İyul 2025 07:57see117

Merkel Trampın əl sıxmaqdan imtina etməsi ilə bağlı qalmaqalın təfərrüatını açıqladı

04 İyul 2025 04:35see117

Qalatasaray İnter in qapıçısıçı istəyir

03 İyul 2025 00:32see116

Almaniya Talibanla razılığa gəlmək niyyətindədir

03 İyul 2025 11:51see115

Bu ölkədə kökəlməyə qarşı cərimələr başlanır

03 İyul 2025 07:51see113
newsSon xəbərlər
Günün ən son və aktual hadisələri