Süni intellektdə yeni təhlükə: Zəhərli süni intellekt
Icma.az, Bizimyol portalından verilən məlumatlara əsaslanaraq xəbər verir.
Bizimyol.info xəbər verir ki, İngiltərənin Süni İntellekt Təhlükəsizlik İnstitutu, Alan Turing İnstitutu və "Anthropic"in birgə araşdırmasına görə, milyonlarla verilən məlumatın yer aldığı bir təlim dəstinə yalnız 250 zərərli fayl əlavə etmək, bir modeli gizlicə "zəhərləyə" və ya mənfi yöndə manipulyasiya etmək üçün kifayət edir.
Süni intellektin zəhərlənməsi, bir modelə bilərəkdən yanlış məlumatların öyrədilməsi deməkdir. Məqsəd, modelin davranışını pozmaq, səhv nəticələr çıxartmasına səbəb olmaq və ya gizli pis niyyətli əmrlər yerləşdirməkdir.
Məsələn, bir hücum edən şəxs təlim məlumatlarına gözə çarpmayacaq şəkildə xüsusi bir "qıcıqlandırıcı" söz əlavə edir. Model, bu sözlə qarşılaşdıqda, avtomatik olaraq hücum edən şəxsin istədiyi şəkildə cavab verir. Bu üsul “arxa qapı” (backdoor) hücumu olaraq bilinir.
Bəzi hücumlar modelin ümumi fəaliyyətini zəiflətməyi hədəfləyir. Bu metod “mövzu yönləndirilməsi” (topic steering) adlanır. Hücumçular, məsələn, "xərçəngi müalicə edir" kimi yanlış məlumatları minlərlə saxta sayt vasitəsilə yayaraq modelin bu məlumatı doğru kimi öyrənməsini təmin edə bilirlər.
Araşdırmalar, bu cür verilən məlumatlarla zəhərlənmənin real dünyada tətbiq oluna biləcəyini və ciddi nəticələrə yol aça biləcəyini göstərir. Yanvar ayında aparılan bir təcrübədə, yalnız təlim məlumatlarının 0.001%-inin yanlış məlumatlarla dəyişdirilməsi, modelin tibbi sahələrdə səhv cavablar vermə ehtimalını artırdı.
Bəzi sənətçilər isə süni intellekt modellərinin icazəsiz olaraq öz məzmunlarını toplamasına qarşı, öz əsərlərinə “zəhər” əlavə edirlər. Beləliklə, bu məzmunları istifadə edən modellər, zədələnmiş və ya işə yaramayan nəticələr verir.
Ekspertlərə görə, bu vəziyyət, süni intellekt texnologiyasının xarici göründüyü qədər möhkəm olmadığını sübut edir. “Zəhərli” modellər, gələcəkdə həm yanlış məlumatların yayılması, həm də kibertəhlükəsizlik boşluqları baxımından ən ciddi təhdidlərdən biri ola bilər.
Qadir, Bizimyol.info

