Icma.az
close
up
RU
Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

Icma.az xəbər verir, Qaynarinfo saytına əsaslanaraq.

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

Qaynarinfo xəbər verir ki, "Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.

Aydın

Ən son xəbərləri və yenilikləri almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:97
embedMənbə:https://qaynarinfo.az
archiveBu xəbər 23 May 2025 23:58 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Abbas Arakçıya göndərilmiş rəsmi dəvət ləğv edildi

16 Yanvar 2026 20:13see249

Balıq ovlamaq istəyənlərin NƏZƏRİNƏ Nazirlik kvotanı açıqladı

16 Yanvar 2026 17:05see189

Qadın sahibkarlar üçün sosial dəstək mexanizmləri mövcuddur ŞƏRH EDİLDİ

16 Yanvar 2026 11:22see175

Alimlərdən maqnit qasırğaları ilə bağlı narahatedici proqnoz

17 Yanvar 2026 05:26see173

İslandiya 52 ci Amerika ştatı olacaq? Səfirdən şok açıqlama

16 Yanvar 2026 17:16see173

Bakıya köçən “Güllü Erhan” paylaşımı ilə diqqət çəkdi Foto

16 Yanvar 2026 05:49see166

“Kapital Bank”ın 2 ilə həll edə bilmədiyi sadə problem

16 Yanvar 2026 16:17see160

Aya getmək istəyənlərə şad xəbər 250 mindən rezervasiya başladı

16 Yanvar 2026 04:41see159

Trampın məqsədi İran xalqına kömək etmək yox, ölkənin neftini ələ keçirməkdir POLİTOLOQ

16 Yanvar 2026 22:39see151

Serenay Sarıkayanın 425 minlik kürkü

16 Yanvar 2026 01:16see150

“Güzəştli ipoteka kreditlərinə tələbat yüksək, ayrılan maliyyə resursu məhdudur“ EKSPERT DANIŞDI

16 Yanvar 2026 15:15see149

Doğuşla Xoşqədəm məhkəmədə qalib gəldi Show Tv təzminat ödəyəcək

16 Yanvar 2026 13:24see143

YAP Səbail rayon təşkilatında 20 Yanvar Ümumxalq Hüzn Günü qeyd olunub

16 Yanvar 2026 18:40see142

Ağ evin mətbuat katibi jurnalisti tənqid hədəfinə çevirib

16 Yanvar 2026 08:46see142

Süni intellekt iqtisadi bərabərsizliyi artıracaq

16 Yanvar 2026 15:55see140

13 illik vəzifəsindən uzaqlaşdırılan sədr və yerinə gətirilən Cəlilovun DOSYELƏRİ

16 Yanvar 2026 17:48see139

Uşaq qidasında qiymət oyunu ARAŞDIRMA

16 Yanvar 2026 15:15see137

Hakerlər Bluetooth vasitəsilə insanları izləyə bilərlər XƏBƏRDARLIQ

17 Yanvar 2026 03:14see135

NASA 2030 cu ilə qədər Ay səthində nüvə reaktoru quracaq

16 Yanvar 2026 05:39see134

Keçmiş icra başçısı Qoca Səmədovun oğlu 46 yaşlı kişini GÜLLƏLƏDİ

16 Yanvar 2026 15:33see129
newsSon xəbərlər
Günün ən son və aktual hadisələri