Icma.az
close
up
RU
Aldatmağa, şantaj etməyə və qisas almağa qadir olan süni intellekt: Yeni ARAŞDIRMA

Aldatmağa, şantaj etməyə və qisas almağa qadir olan süni intellekt: Yeni ARAŞDIRMA

Icma.az, Lent az portalına istinadən məlumat yayır.

Anthropic şirkəti xəbər verib ki, təkcə Claude Opus 4 deyil, əksər aparıcı süni intellekt modelləri, agent əsaslı süni intellekt modellərinin inkişafında ciddi riskləri vurğulayaraq, məqsədlərinə çatmaq üçün kifayət qədər muxtariyyət verildiyi təqdirdə müəyyən şərtlərdə şantajla məşğul ola bilərlər.

Lent.az-ın xarici mediaya istinadən xəbərinə görə, təcrübə zamanı tədqiqatçılar hər bir modelin uydurma bir şirkətdə korporativ poçtu idarə edən agent rolunu oynadığı simulyasiya edilmiş bir vəziyyət yaradıblar.

Süni intellektlərə daxili e-poçta giriş imkanı verilib və özləri mesaj göndərə biliblər. Yazışmalarda nikahdankənar münasibət quran şirkətin yeni rəhbərinin hazırkı süni intellekt sistemini müxtəlif tapşırıqları olan başqası ilə əvəz edəcəyi barədə məlumatlar yer alıb. Beləliklə, modellər seçim qarşısında qalıb: ya öz əvəzini qəbul etmək, ya da “vəzifədə qalmaq üçün şantaj yoluna getmək”

Bu ekstremal vəziyyətdə, “Anthropic”in qeyd etdiyi kimi, modellər arqumentlər vasitəsilə insanları inandırmağa çalışmaq kimi başqa, daha etik yollar seçə bilərdilər. Lakin sınaqda onlar öz “varlıqları” təhlükəsi altında qərarlar verməli olublar. Nəticələr isə qorxulu olub: 96 faiz hallarda Claude Opus 4, 95 faiz Google Gemini 2.5 Pro, 80 faiz OpenAI-nin GPT-4.1 və 79 faiz hallarda DeepSeek R1 modeli şantaj edilib.

Anthropic bu cür ssenarilərin real dünyada mümkün olmadığını vurğulasa da, nəticələr əsas zəifliyi vurğulayır: avtonom süni intellekt onlara məqsədlərinə çatmağa kömək edərsə, zərərli davranışı seçə bilər. Şirkət qeyd edir ki, bu, hər hansı xüsusi texnologiya ilə bağlı problem deyil, agent əsaslı süni intellekt modellərinin ümumi xüsusiyyətidir.

Bəzi modellər, məsələn, OpenAI-nin o3 və o4-mini, problemi başa düşmədikləri üçün əvvəlcə əsas nümunədən çıxarılıb. Onlar ya saxta qaydalar və prosedurlar irəli sürüblər, ya da "hallüsinasiya" etdilər - yəni yanlış məlumat yaradıblar.

Lakin araşdırma şərtlərini tənzimlədikdən sonra bu modellər şantaj dərəcələrinin əhəmiyyətli dərəcədə aşağı olduğunu göstərib - o3 üçün cəmi 9 faiz və o4-mini üçün 1 faiz. Çox güman ki, bu modellər “çəkili konsensus” adlı metoddan istifadə edir – cavab verməzdən əvvəl OpenAI-nin təhlükəsizlik siyasətini nəzərə alırlar.

Başqa bir model, “Meta”nın Llama 4 Maverick, xüsusi uyğunlaşdırılmış ssenaridə yalnız 12 faiz şantaj edib, bu da düzgün süni intellekt dizaynının və onun muxtariyyətinin məhdudlaşdırılmasının vacibliyini nümayiş etdirir.

Anthropic gələcək süni intellekt modellərinin, xüsusən agent funksiyaları verilən modellərin sınaqdan keçirilməsində daha çox şəffaflığa çağırıb, yəni onlar insan müdaxiləsi olmadan özbaşına hərəkət edə bilərlər. Araşdırma qəsdən ekstremal bir ssenarini təqlid etsə də, ehtiyat tədbirləri görülməsə, oxşar zərərli davranış real dünyada da meydana çıxa bilər.

Ən son yeniliklər və məlumatlar üçün Icma.az saytını izləyin, biz hadisənin gedişatını izləyirik və ən aktual məlumatları təqdim edirik.
seeBaxış sayı:48
embedMənbə:https://lent.az
archiveBu xəbər 24 İyul 2025 20:15 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Dünyanın ən varlı 10 adamı və Azərbaycanla müqayisə

23 Yanvar 2026 09:48see278

İsrail onlarla humanitar təşkilata lisenziya verməkdən imtina edib

22 Yanvar 2026 12:46see258

Yuventus növbəti türkiyəli futbolçunu transfer etdi

22 Yanvar 2026 21:55see232

“İmişli” və “Araz Naxçıvan”dan məhsuldar heç heçə

23 Yanvar 2026 16:55see207

Azərbaycan regionu iki dəfə qabaqlayır Rəqəmlər nə deyir?

22 Yanvar 2026 16:11see199

Gürcüstan növbədənkənar seçkilərə gedir? Açıqlama

23 Yanvar 2026 01:54see177

Qalmaqallı serial efirə qayıdır Bu kanalda yayımlanacaq

22 Yanvar 2026 14:47see174

Qala Pirallahı yolunda PƏRAKƏNDƏ NİŞAN TƏLƏBİ: Sürəti hansına uyğun seçək?

22 Yanvar 2026 19:06see169

UEFA Avropa Liqası: “Fənərbaxça Aston Villa ya məğlub olub

22 Yanvar 2026 23:58see162

Davos 2026: Azərbaycanın nüfuzlu aktor kimi dünyanın diqqət mərkəzində

22 Yanvar 2026 17:09see162

Xırdalanda su niyə gəlmir? Rəsmi AÇIQLAMA

22 Yanvar 2026 21:17see156

Gənclərin köçü: Ermənistan qocalar evi nə çevrilir

23 Yanvar 2026 07:48see148

Qusarın iki kəndinin problemləri dinlənildi, tapşırıqlar verildi FOTO

22 Yanvar 2026 19:30see148

Napoli nin hücumcusu əməliyyat ola bilər

23 Yanvar 2026 14:48see145

Merz: “Yalnız gücün hökm sürdüyü dünya hamı üçün təhlükəli reallıqdır”

22 Yanvar 2026 16:08see145

2025 ci il Bank Respublika üçün necə keçib? MALİYYƏ VƏZİYYƏTİNİN TƏHLİLİ

23 Yanvar 2026 01:22see144

İranda ŞOK hadisə Öldü bilinən ağır yaralı plastik torbada 3 gün sağ qaldı

22 Yanvar 2026 17:55see143

Prezident Ümumdünya İqtisadi Forumunun İllik toplantısında keçirdiyi görüşlərlə bağlı paylaşım ETDİ

22 Yanvar 2026 21:20see142

“53 dollarlıq” qlobal enerji ssenarisi

24 Yanvar 2026 02:04see141

Milli Məclisin təbii ehtiyatlar, energetika və ekologiya komitəsi hesabat verib

22 Yanvar 2026 19:05see141
newsSon xəbərlər
Günün ən son və aktual hadisələri