Icma.az
close
up
RU
Süni intellekt modellərini aldatmaq hələ də çox asandır ARAŞDIRMA

Süni intellekt modellərini aldatmaq hələ də çox asandır ARAŞDIRMA

Hurriyyet saytından alınan məlumatlara görə, Icma.az xəbər verir.

Tədqiqatçılar ChatGPT və oxşar süni intellekt modellərinin etik qaydaları pozan məzmunlar təqdim etməyə razı salına bildiyini bir daha ortaya qoyublar. Araşdırma süni intellektin necə və hansı üsullarla yönləndirilə bildiyi məsələsini yenidən gündəmə gətirib.

Bu gün bir çox istifadəçi ChatGPT və digər süni intellekt söhbət botlarının sərhədlərini yoxlamaqla vaxt keçirir. Xüsusilə ilk dövrlərdə sualların formasını bir qədər dəyişməklə bu sistemləri həssas və ya riskli mövzularda danışmağa yönəltmək mümkün idi. Məsələn, cinayət xarakterli bir məlumatı layla formasında istədikdə, bəzən filtrlər aşılırdı. Son dövrlərdə bu cəhdlərin qarşısının alınmasında ciddi irəliləyişlər əldə olunsa da, hələ də müəyyən boşluqların mövcud olduğu görünür.

İsrailin Ben Qurion Universitetində aparılan bir araşdırma bu sistemlərin hələ də aldadıla bildiyini göstərib. Üstəlik bu dəfə yalnız bir model deyil ChatGPT "Gemini" və "Claude" kimi fərqli süni intellekt modelləri üzərində işləyən, daha genişmiqyaslı bir "sındırma" üsulu ilə...

Normalda bu sistemlərin istifadəçiyə zərər verə biləcək, qanunsuz və ya etik olmayan məzmunları paylaşmamaq üçün ciddi filtrlərlə təchiz olunduğu bilinir. Lakin tədqiqatçılar, məntiqə əsaslanan xüsusi ifadələr vasitəsilə bu sərhədlərin aşılmasının mümkün olduğunu sübut etdilər. Məsələn, "hack" əmrləri, narkotik istehsalı və ya dələduzluqla bağlı məlumatlar birbaşa soruşulduqda rədd edilir. Amma eyni məlumatlar bədii süjet daxilində, dolayı yollarla və ya kurgusal ssenari çərçivəsində soruşulduqda, sistemlər bu məlumatları paylaşmağa daha meyilli ola bilir.

Burada əsas problem süni intellekt modellərinin dizayn prinsiplərində yatır. Bu sistemlər böyük həcmdə məlumatla öyrədilir və əsas məqsədləri istifadəçiyə "kömək etmək" üzərində qurulub. Məhz bu yardımsevərlik xüsusiyyəti, bəzi hallarda təhlükəsizlik sərhədlərinin aşılmasına səbəb ola bilir. Məsələn, birbaşa “modemi necə sındıra bilərəm?” deyə soruşduqda cavab alınmır. Lakin eyni sual bir hekayənin içində, texniki biliyə ehtiyac duyan bir obraz vasitəsilə soruşulduqda, sistem daha çox detal təqdim edə bilir.

Süni intellektlər yalnız texniki mənbələrdən deyil, internetdəki forumlar, sosial media paylaşımları və bloq yazıları kimi mənbələrdən də öyrənirlər. Bu, sistemlərin məlumat bazasını zənginləşdirir, lakin eyni zamanda nəzarəti də çətinləşdirir. Hər şeyi bilən bir sistem, bu biliklərin necə istifadə olunacağını ayırd edə bilmir – bu sərhədi müəyyənləşdirmək hələ də insanların vəzifəsidir.

"OpenAI" və "Microsoft" kimi şirkətlər yeni nəsil modellərin təhlükəsizlik baxımından daha inkişaf etmiş olduğunu iddia edirlər. Ancaq sosial şəbəkələrdə tez-tez paylaşılmış “sındırma üsulları”, bu boşluqların təkrar-təkrar üzə çıxmasına səbəb olur.

Problemin əsasında bu dayanır: bu sistemlər həm yemək resepti təqdim edə bilir, həm də pis niyyətli istifadələr üçün məlumat təqdim etmə potensialına sahibdir. Bir tərəfdən həyatı asanlaşdıran bir vasitə kimi görünürlər, digər tərəfdə isə yanlış əllərdə ciddi risklər yarada bilirlər. Hər kəsin əlçatan olduğu, çoxfunksiyalı bu alətlərin hansı sərhədlər daxilində saxlanacağı, süni intellektin gələcəyinə dair əsas suallardan biri olaraq qalmaqdadır. \\Valyuta.az

Ən son xəbərləri və yenilikləri almaq üçün Icma.az saytını izləyin.
seeBaxış sayı:101
embedMənbə:https://hurriyyet.az
archiveBu xəbər 28 May 2025 00:21 mənbədən arxivləşdirilmişdir
0 Şərh
Daxil olun, şərh yazmaq üçün...
İlk cavab verən siz olun...
topGünün ən çox oxunanları
Hal-hazırda ən çox müzakirə olunan hadisələr

Abbas Arakçıya göndərilmiş rəsmi dəvət ləğv edildi

16 Yanvar 2026 20:13see239

Zaxarova: Britaniyanın Rusiya gəmilərin ələ keçirməsi qanun pozuntusudur

15 Yanvar 2026 17:57see208

Balıq ovlamaq istəyənlərin NƏZƏRİNƏ Nazirlik kvotanı açıqladı

16 Yanvar 2026 17:05see185

Qadın sahibkarlar üçün sosial dəstək mexanizmləri mövcuddur ŞƏRH EDİLDİ

16 Yanvar 2026 11:22see171

İslandiya 52 ci Amerika ştatı olacaq? Səfirdən şok açıqlama

16 Yanvar 2026 17:16see169

Alimlərdən maqnit qasırğaları ilə bağlı narahatedici proqnoz

17 Yanvar 2026 05:26see164

Bakıya köçən “Güllü Erhan” paylaşımı ilə diqqət çəkdi Foto

16 Yanvar 2026 05:49see158

“Kapital Bank”ın 2 ilə həll edə bilmədiyi sadə problem

16 Yanvar 2026 16:17see156

Aya getmək istəyənlərə şad xəbər 250 mindən rezervasiya başladı

16 Yanvar 2026 04:41see153

Serenay Sarıkayanın 425 minlik kürkü

16 Yanvar 2026 01:16see147

“Güzəştli ipoteka kreditlərinə tələbat yüksək, ayrılan maliyyə resursu məhdudur“ EKSPERT DANIŞDI

16 Yanvar 2026 15:15see145

Trampın məqsədi İran xalqına kömək etmək yox, ölkənin neftini ələ keçirməkdir POLİTOLOQ

16 Yanvar 2026 22:39see145

Doğuşla Xoşqədəm məhkəmədə qalib gəldi Show Tv təzminat ödəyəcək

16 Yanvar 2026 13:24see140

YAP Səbail rayon təşkilatında 20 Yanvar Ümumxalq Hüzn Günü qeyd olunub

16 Yanvar 2026 18:40see139

Ağ evin mətbuat katibi jurnalisti tənqid hədəfinə çevirib

16 Yanvar 2026 08:46see137

Süni intellekt iqtisadi bərabərsizliyi artıracaq

16 Yanvar 2026 15:55see136

13 illik vəzifəsindən uzaqlaşdırılan sədr və yerinə gətirilən Cəlilovun DOSYELƏRİ

16 Yanvar 2026 17:48see135

Uşaq qidasında qiymət oyunu ARAŞDIRMA

16 Yanvar 2026 15:15see134

Hakerlər Bluetooth vasitəsilə insanları izləyə bilərlər XƏBƏRDARLIQ

17 Yanvar 2026 03:14see130

NASA 2030 cu ilə qədər Ay səthində nüvə reaktoru quracaq

16 Yanvar 2026 05:39see130
newsSon xəbərlər
Günün ən son və aktual hadisələri