Icma.az
close
up
RU
Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

Icma.az xəbər verir, Qaynarinfo saytına əsaslanaraq.

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

Qaynarinfo xəbər verir ki, "Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.

Aydın

Ən son xəbərləri və yenilikləri almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:82
embedMənbə:https://qaynarinfo.az
archiveBu xəbər 23 May 2025 23:58 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Naməlum obyekt Saturna çırpılır...

12 İyul 2025 21:16see194

Onlar jurnalistikaya aid olmayan tapşırıqları yerinə yetirirmişlər Mətbuat Şurası bəyanat yaydı

12 İyul 2025 13:18see184

Kəpəz yenə sponsorsuz qaldı Namiq Qədirov klubu tərk etdi, maliyyə problemi yarandı

12 İyul 2025 16:20see124

JLonun konsert üçün tələbləri məlum olub

13 İyul 2025 08:17see122

Keçmiş sevgilisini unutmaq üçün dağlara çıxan çinli...

12 İyul 2025 22:14see117

Rusiya qonşu ölkələrdə gərginlik yaratmağa çalışır

12 İyul 2025 16:44see116

41 yaşını qeyd edən Vüsalə Əlizadə bahalı hədiyyələrini nümayiş etdirdi

12 İyul 2025 15:32see115

Deputat: Əbu Dabi görüşü birbaşa təmasların sülhə aparan ən real yol olduğunu göstərdi

13 İyul 2025 04:14see115

“Mənim dövrümdə yaxşı pul verilirdi” Zülfüqarovun konserv açıqlamasına Məmmədyarovdan cavab

12 İyul 2025 22:07see115

Daha bir ölkədə azərbaycanlılara basqın: Kimi axtarırlar?

13 İyul 2025 01:19see114

Bir neçə gün öncə özünü güllələmişdi, müalicə üçün Türkiyəyə aparıldı

12 İyul 2025 13:57see114

Psixopatik xüsusiyyətlər stress hormonları ilə əlaqələndirildi ARAŞDIRMA

12 İyul 2025 10:24see114

Yamal 18 yaşını harada qeyd edəcək?

12 İyul 2025 16:57see113

“İstəyirəm, Polad Həşimovun Xatirə muzeyi yaradılsın”

12 İyul 2025 13:20see113

Zaxarova Departamentin bu qərarını lağa qoydu

14 İyul 2025 03:42see113

Milli Çinə rəqib oldu

13 İyul 2025 01:24see112

Bələdiyyə sədrindən gözlənilməz addım FOTO

13 İyul 2025 23:42see112

KİV: Putin İranın uran zənginləşdirməsini tamamilə qadağan edən razılaşmanı dəstəkləyir

12 İyul 2025 15:46see112

“Sabah”ın Avroliqa macərası deyəsən, elə indidən bitir Gələnin, gedənin yanında bizi biabır eləməsəniz, olmaz?

12 İyul 2025 10:47see112

Almaniyada komediya aktyoru Trampa görə məhkəməyə çağırıldı

12 İyul 2025 08:16see111
newsSon xəbərlər
Günün ən son və aktual hadisələri