Aldatmağa, şantaj etməyə və qisas almağa qadir olan süni intellekt: Yeni ARAŞDIRMA

Icma.az, Lent az portalına istinadən məlumat yayır.

Anthropic şirkəti xəbər verib ki, təkcə Claude Opus 4 deyil, əksər aparıcı süni intellekt modelləri, agent əsaslı süni intellekt modellərinin inkişafında ciddi riskləri vurğulayaraq, məqsədlərinə çatmaq üçün kifayət qədər muxtariyyət verildiyi təqdirdə müəyyən şərtlərdə şantajla məşğul ola bilərlər.

Lent.az-ın xarici mediaya istinadən xəbərinə görə, təcrübə zamanı tədqiqatçılar hər bir modelin uydurma bir şirkətdə korporativ poçtu idarə edən agent rolunu oynadığı simulyasiya edilmiş bir vəziyyət yaradıblar.

Süni intellektlərə daxili e-poçta giriş imkanı verilib və özləri mesaj göndərə biliblər. Yazışmalarda nikahdankənar münasibət quran şirkətin yeni rəhbərinin hazırkı süni intellekt sistemini müxtəlif tapşırıqları olan başqası ilə əvəz edəcəyi barədə məlumatlar yer alıb. Beləliklə, modellər seçim qarşısında qalıb: ya öz əvəzini qəbul etmək, ya da “vəzifədə qalmaq üçün şantaj yoluna getmək”

Bu ekstremal vəziyyətdə, “Anthropic”in qeyd etdiyi kimi, modellər arqumentlər vasitəsilə insanları inandırmağa çalışmaq kimi başqa, daha etik yollar seçə bilərdilər. Lakin sınaqda onlar öz “varlıqları” təhlükəsi altında qərarlar verməli olublar. Nəticələr isə qorxulu olub: 96 faiz hallarda Claude Opus 4, 95 faiz Google Gemini 2.5 Pro, 80 faiz OpenAI-nin GPT-4.1 və 79 faiz hallarda DeepSeek R1 modeli şantaj edilib.

Anthropic bu cür ssenarilərin real dünyada mümkün olmadığını vurğulasa da, nəticələr əsas zəifliyi vurğulayır: avtonom süni intellekt onlara məqsədlərinə çatmağa kömək edərsə, zərərli davranışı seçə bilər. Şirkət qeyd edir ki, bu, hər hansı xüsusi texnologiya ilə bağlı problem deyil, agent əsaslı süni intellekt modellərinin ümumi xüsusiyyətidir.

Bəzi modellər, məsələn, OpenAI-nin o3 və o4-mini, problemi başa düşmədikləri üçün əvvəlcə əsas nümunədən çıxarılıb. Onlar ya saxta qaydalar və prosedurlar irəli sürüblər, ya da "hallüsinasiya" etdilər - yəni yanlış məlumat yaradıblar.

Lakin araşdırma şərtlərini tənzimlədikdən sonra bu modellər şantaj dərəcələrinin əhəmiyyətli dərəcədə aşağı olduğunu göstərib - o3 üçün cəmi 9 faiz və o4-mini üçün 1 faiz. Çox güman ki, bu modellər “çəkili konsensus” adlı metoddan istifadə edir – cavab verməzdən əvvəl OpenAI-nin təhlükəsizlik siyasətini nəzərə alırlar.

Başqa bir model, “Meta”nın Llama 4 Maverick, xüsusi uyğunlaşdırılmış ssenaridə yalnız 12 faiz şantaj edib, bu da düzgün süni intellekt dizaynının və onun muxtariyyətinin məhdudlaşdırılmasının vacibliyini nümayiş etdirir.

Anthropic gələcək süni intellekt modellərinin, xüsusən agent funksiyaları verilən modellərin sınaqdan keçirilməsində daha çox şəffaflığa çağırıb, yəni onlar insan müdaxiləsi olmadan özbaşına hərəkət edə bilərlər. Araşdırma qəsdən ekstremal bir ssenarini təqlid etsə də, ehtiyat tədbirləri görülməsə, oxşar zərərli davranış real dünyada da meydana çıxa bilər.

Ən son yeniliklər və məlumatlar üçün Icma.az saytını izləyin, biz hadisənin gedişatını izləyirik və ən aktual məlumatları təqdim edirik.

Dünyanın ən varlı 10 adamı və Azərbaycanla müqayisə

İsrail onlarla humanitar təşkilata lisenziya verməkdən imtina edib

Yuventus növbəti türkiyəli futbolçunu transfer etdi

“İmişli” və “Araz Naxçıvan”dan məhsuldar heç heçə

Azərbaycan regionu iki dəfə qabaqlayır Rəqəmlər nə deyir?

Gürcüstan növbədənkənar seçkilərə gedir? Açıqlama

Qalmaqallı serial efirə qayıdır Bu kanalda yayımlanacaq

Qala Pirallahı yolunda PƏRAKƏNDƏ NİŞAN TƏLƏBİ: Sürəti hansına uyğun seçək?

UEFA Avropa Liqası: “Fənərbaxça Aston Villa ya məğlub olub

Davos 2026: Azərbaycanın nüfuzlu aktor kimi dünyanın diqqət mərkəzində

Xırdalanda su niyə gəlmir? Rəsmi AÇIQLAMA

Gənclərin köçü: Ermənistan qocalar evi nə çevrilir

Qusarın iki kəndinin problemləri dinlənildi, tapşırıqlar verildi FOTO

Napoli nin hücumcusu əməliyyat ola bilər

Merz: “Yalnız gücün hökm sürdüyü dünya hamı üçün təhlükəli reallıqdır”

2025 ci il Bank Respublika üçün necə keçib? MALİYYƏ VƏZİYYƏTİNİN TƏHLİLİ

İranda ŞOK hadisə Öldü bilinən ağır yaralı plastik torbada 3 gün sağ qaldı

Prezident Ümumdünya İqtisadi Forumunun İllik toplantısında keçirdiyi görüşlərlə bağlı paylaşım ETDİ

“53 dollarlıq” qlobal enerji ssenarisi

Milli Məclisin təbii ehtiyatlar, energetika və ekologiya komitəsi hesabat verib

Aldatmağa, şantaj etməyə və qisas almağa qadir olan süni intellekt: Yeni ARAŞDIRMA

Dünyanın ən varlı 10 adamı və Azərbaycanla müqayisə

İsrail onlarla humanitar təşkilata lisenziya verməkdən imtina edib

Yuventus növbəti türkiyəli futbolçunu transfer etdi

“İmişli” və “Araz Naxçıvan”dan məhsuldar heç heçə

Azərbaycan regionu iki dəfə qabaqlayır Rəqəmlər nə deyir?

Gürcüstan növbədənkənar seçkilərə gedir? Açıqlama

Qalmaqallı serial efirə qayıdır Bu kanalda yayımlanacaq

Qala Pirallahı yolunda PƏRAKƏNDƏ NİŞAN TƏLƏBİ: Sürəti hansına uyğun seçək?

UEFA Avropa Liqası: “Fənərbaxça Aston Villa ya məğlub olub

Davos 2026: Azərbaycanın nüfuzlu aktor kimi dünyanın diqqət mərkəzində

Xırdalanda su niyə gəlmir? Rəsmi AÇIQLAMA

Gənclərin köçü: Ermənistan qocalar evi nə çevrilir

Qusarın iki kəndinin problemləri dinlənildi, tapşırıqlar verildi FOTO

Napoli nin hücumcusu əməliyyat ola bilər

Merz: “Yalnız gücün hökm sürdüyü dünya hamı üçün təhlükəli reallıqdır”

2025 ci il Bank Respublika üçün necə keçib? MALİYYƏ VƏZİYYƏTİNİN TƏHLİLİ

İranda ŞOK hadisə Öldü bilinən ağır yaralı plastik torbada 3 gün sağ qaldı

Prezident Ümumdünya İqtisadi Forumunun İllik toplantısında keçirdiyi görüşlərlə bağlı paylaşım ETDİ

“53 dollarlıq” qlobal enerji ssenarisi

Milli Məclisin təbii ehtiyatlar, energetika və ekologiya komitəsi hesabat verib

İnstaqramda izlədiyiniz şəxslər “tarixə qovuşur”

Kartofu niyə duzlu suda saxlamalıyıq? Aşpazların gizli saxladığı o səbəb

Hindistanda meymunun su quyusuna atdığı körpə sağ qaldı

Qəzəblənən müharibə veteranları Trampa özünün hərbi xidmətdən və müharibədən necə yayındığını xatırlatdı...

“Barselona“ ulduz futbolçusu üçün edilən 120 milyon avroluq təklifi rədd etdi

Ərdoğanın sözləri ilə dünyanı silkələyən elan: Səssiz şəkildə etdilər, Davosda ortaya çıxdı

Pentaqon: ABŞ ın müttəfiqləri özlərini müdafiə etməlidirlər

Sülh Şurasına qoşulmaq Bakıya nə qazandıracaq?

UEFA dan Azərbaycana xoş olmayan avrokubok xəbəri

Pentaqon: ABŞ İranın nüvə silahı hazırlamasına icazə verməyəcək

Dünyanın ən bəsit dərmanıdır Amma bu ölkədə böhrana səbəb oldu

“Mançester Yunayted” və “Mançester Siti” “Vest Hem”in yarımmüdafiəçisi uğrunda mübarizə apara bilərlər

Nyu Yorkda qeyri adi hadisə: Banka soxulan maral ofisdə xaos yaratdı

Bədənimizdəki bu hüceyrələr gecə vaxtı qatilə çevrilir İnsultun bilinməyən tərəfi

Kənddə işıq, qaz, su ucuz olacaq? Kommunalla bağlı yeni müzakirə

Alman düşərgəsində mahnıları vala yazılan 2 azərbaycanlı

CeyLo “ikinci əl” geyinir?

Antuan Qrizmann “Atletiko Madrid”in “Malyorka” ilə oyununu buraxacaq

OpenAI ChatGPT dən kənar fəaliyyətdən 1 milyarddan çox gəlir əldə edib

ABŞ neft tədarükünü kəsmək üçün Kubaya dəniz blokadası tətbiq edə bilər

ABŞ ın Vitse prezidenti gələn ay Bakıya gəlir Tramp elan etdi