Icma.az
close
up
RU
Çindən süni intellekt sahəsində sensasion YENİLİK

Çindən süni intellekt sahəsində sensasion YENİLİK

Icma.az, Lent az saytından verilən məlumata əsaslanaraq xəbər yayır.

 Çinin süni intellekt sahəsində fəaliyyət göstərən startapı DeepSeek, sensasion bir açıqlama edərək, aparıcı süni intellekt şirkətlərinin modellərinə bənzər bir modeli 11 dəfə daha az hesablama gücü ilə hazırladıqlarını elan edib.

Lent.az xəbər verir ki, DeepSeek-in təqdim etdiyi məlumatlara görə, OpenAI, Meta və Anthropic kimi nəhənglərin modellərinə bənzər DeepSeek-V3 adlı dil modeli cəmi 2 ay ərzində 2.048 Nvidia H800 GPU-sundan ibarət bir qrup vasitəsilə 671 milyard parametr üzərində öyrədilib. Bu, təxminən 2.8 milyon GPU saatı deməkdir. Müqayisə üçün, Meta-nın 405 milyard parametrə malik Llama 3 modelini 54 gün ərzində 16.384 H100 GPU istifadə edərək öyrətməsi üçün 11 dəfə daha çox hesablama gücü (30.8 milyon GPU saatı) tələb olunub.

DeepSeek, qabaqcıl əlaqə xətti (pipeline) alqoritmləri, optimallaşdırılmış rabitə çərçivəsi və FP8 aşağı dəqiqlikli hesablama üsulundan istifadə edərək bu cür miqyaslı modellər üçün adətən tələb olunan hesablama və yaddaş ehtiyaclarını əhəmiyyətli dərəcədə azaltdığını iddia edir. Şirkət, DeepSeek-V3 modelinin hesablama tələblərini azaltmaq üçün onlarla optimizasiya texnikası tətbiq etdiyini vurğulasa da, bir neçə əsas texnologiya bu nəticələrin əldə olunmasında həlledici rol oynayıb. DeepSeek, DualPipe adlı alqoritmdən istifadə edərək həm hesablama, həm də rabitə mərhələlərində effektivliyi artırdığını bildirir. Bu alqoritm, xüsusilə MoE arxitekturasının tələb etdiyi qovşaqlararası ekspert paralelliyi üçün təlim darboğazlarını minimuma endirib. Beləliklə, sıfıra yaxın rabitə yükü ilə 14.8 trilyon simvolun işlənməsi mümkün olub.

Bundan əlavə, DeepSeek rabitə zamanı istifadə olunan qovşaqların sayını hər simvol üçün maksimum 4 qovşaqla məhdudlaşdırıb. Bu yanaşma trafiki azaldıb və rabitənin hesablama ilə effektiv şəkildə üst-üstə düşməsinə imkan verib. Performans baxımından, şirkət DeepSeek-V3 MoE modelinin bəzi göstəricilər üzrə GPT-4x, Claude-3.5-Sonnet və LLama-3.1 modelləri ilə müqayisə edilə bilən, bəzən isə onları ötüb, keçən nəticələr verdiyini bildirir. Lakin bu iddiaların müstəqil tədqiqatçılar tərəfindən təsdiqlənməsinə ehtiyac var. Şirkət modeli və onun parametrlərini açıq mənbə kimi təqdim edib, buna görə də yaxın vaxtlarda müqayisəli testlərin aparılması gözlənilir.

DeepSeek-V3 modeli parametrlərin sayı və ya məntiqi düşünmə qabiliyyətləri baxımından GPT-4 və ya Llama-3 kimi qabaqcıl modellərdən geri qalsa da, məhdud resurslarla yüksək səviyyəli bir MoE modelinin hazırlanmasının mümkün olduğunu nümayiş etdirir. Təbii ki, bu, çoxlu optimizasiya və aşağı səviyyəli proqramlaşdırma tələb edir, lakin nəticələr olduqca ümidverici görünür. DeepSeek komandası, DeepSeek-V3 modelinin tətbiqinin inkişaf etmiş avadanlıqla yanaşı, prefilling və dekodlaşdırma mərhələlərini bir-birindən ayıran xüsusi paylama strategiyası tələb etdiyini, bunun isə resurs çatışmazlığı səbəbindən kiçik şirkətlər üçün əlçatmaz ola biləcəyini etiraf edir.

Sonrakı hadisələr barədə daha çox məlumat almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:45
embedMənbə:https://lent.az
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Dövlət rüsumlarını ödəmək daha da asanlaşdı Video

01 Aprel 2025 10:32see196

Qadınlar səyahətə niyə tək gedirlər? Heyrətləndirən səbəb

02 Aprel 2025 01:13see184

NTD nin prezidenti: “Mövsümdə heç kim bizi ciddi qəbul etmirdi”

01 Aprel 2025 10:33see138

Çinlilər qədim insanın üzünü bərpa ediblər…

02 Aprel 2025 00:57see137

Həkim daimi şirniyyata olan həvəsin səbəblərini açıqladı

01 Aprel 2025 10:35see135

Valeh Məhərrəmli vəfat etdi

02 Aprel 2025 00:50see131

Bu, bəşəriyyətə qarşı törədilmiş ən böyük cinayətdir Deputat

01 Aprel 2025 10:32see126

AZAL ın qəzaya uğrayan təyyarəsi haqqında sənədli film hazırlanıb VİDEO

01 Aprel 2025 10:31see124

Şəhid anası vəfat etdi FOTOLAR

01 Aprel 2025 10:34see119

Almaniya Kuboku: 2 ci Bundesliqa klubu Bayer Leverkuzen i finala buraxmadı

02 Aprel 2025 02:26see118

Çar “zombi ordusu” hazırlayır Qonşular, ayılın!

01 Aprel 2025 10:20see117

Adil Əliyevin məhkəməyə verdiyi qazi saxlanıldı KONKRET

01 Aprel 2025 16:32see116

Günün qoroskopu: Enerjiniz yüksək olacaq

02 Aprel 2025 00:02see114

Azərbaycanda ən çox 585 əyarlı qızıl alınır Assosiasiya sədri

02 Aprel 2025 13:53see114

Almaniya polisi dünyada ən böyük uşaq pornoqrafiyası saytını aradan qaldırıb

03 Aprel 2025 03:13see113

ABŞ nin tariflərinə cavab olaraq Aİ daxili bazarı gücləndirmək niyyətindədir

02 Aprel 2025 02:49see112

Ermənistanda jurnalistlərlə qalmaqal yaradan deputat mandatından imtina etdiyini deyib

01 Aprel 2025 10:31see111

Erməni lobbisinə sızan məşhur türk aktirsa: Ankaraya hansı məlumatları ötürüb?

03 Aprel 2025 03:05see107

Xalqımıza qarşı törədilən bu qanlı faciələr uzun müddət Sovet dövründə gizlədilmişdir Deputat

01 Aprel 2025 10:26see107

Vüsalə Əbu Dabidə geyimi ilə diqqət çəkdi

03 Aprel 2025 03:21see107
newsSon xəbərlər
Günün ən son və aktual hadisələri