Icma.az
close
up
RU
Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK

Icma.az, Lent az saytından verilən məlumata əsaslanaraq xəbər yayır.

 Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonrakı hadisələr barədə daha çox məlumat almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:93
embedMənbə:https://lent.az
archiveBu xəbər 28 Dekabr 2024 13:54 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Zelenski ABŞ nin 28 bəndlik sülh planını ləyaqətsiz adlandırdı Xalqa çağırış

22 Noyabr 2025 00:03see210

Vilayət Eyvazovdan bəylə gəlinə sürpriz FOTOLAR

23 Noyabr 2025 14:12see202

Mingəçevirdə 17 yaşlı yeniyetmə öldürüldü Saxlanılanın 14 yaşı var

22 Noyabr 2025 23:58see184

Sadıqovvari tənqid və.. nəticə?

23 Noyabr 2025 10:47see172

Tramp: Ukrayna ABŞ ın sülh planını noyabrın 27 nə qədər qəbul etməlidir

21 Noyabr 2025 20:29see139

Anomal hava ilə bağlı XƏBƏRDARLIQ Bu şəxslər xüsusi risk altındadır

22 Noyabr 2025 13:21see133

Arne Slot “Liverpul”un qış transferləri barədə: “Hazırda düşündüyüm son şey odur”

22 Noyabr 2025 01:05see131

Sığınacaqda dünyasını dəyişən uşaq: Məsuliyyəti kim daşıyır? Hüquqi MÜZAKİRƏ

21 Noyabr 2025 23:40see128

“Bu gün tanış olmuşduq, xəbər gəldi ki, rəhmətə gedib…” Foto

22 Noyabr 2025 10:49see128

Supermenin ilk komiksinin nüsxəsi rekord qiymətə satıldı

22 Noyabr 2025 01:26see127

Misir telekanalında Azərbaycan musiqisi haqqında veriliş yayımlanıb

22 Noyabr 2025 01:42see127

Zirə autsayderə qarşı

22 Noyabr 2025 09:31see127

Gündə neçə banan yemək olar? Faydaları

23 Noyabr 2025 06:06see125

“Napoli” “Qarabağ”la oyun ərəfəsində qələbə qazanıb

23 Noyabr 2025 01:38see124

Yağın ucuz olduğu ölkələrdən böyük həcmdə idxal edirlər, öz etiketini vurub yerli istehsal məhsulu kimi satırlar

22 Noyabr 2025 00:58see124

Suitilərin əvvəllər məlum olmayan davranış xüsusiyyəti aşkar edilib...

21 Noyabr 2025 23:38see120

Çin rabitə peykini orbitə çıxardı

22 Noyabr 2025 01:38see119

Kürdəmir sakini saxta kredit vədinin qurbanı oldu (VİDEO)

21 Noyabr 2025 19:12see119

Almaniyada Ukrayna ilə bağlı Təhlükəsizlik Şurasının iclası keçirilib

23 Noyabr 2025 06:10see119

La Liqa: Barselona Kamp Nou ya qələbə ilə dönür

23 Noyabr 2025 02:12see118
newsSon xəbərlər
Günün ən son və aktual hadisələri