Süni intellekt chatbotu Turinq testindən keçdi: Bəs indi nə olacaq?
Bizimyol saytından alınan məlumatlara görə, Icma.az xəbər verir.
Bizimyol.info "trthaber"ə istinadən xəbər verir ki, San Dieqo Kaliforniya Universitetindən iki tədqiqatçı tərəfindən aparılan və hələ də ekspert rəyi üçün təqdim edilməmiş araşdırmada dörd böyük dil modeli (LLM) Turing testinə məruz qalıb.
Sınaq nəticəsində "OpenAI" tərəfindən hazırlanmış "GPT-4.5" modeli iştirakçılar tərəfindən 70 faizdən yuxarı nisbətdə insanlardan fərqlənə bilməyib.
Turing testi nədir?
İngilis riyaziyyatçısı və kompüter alimi Alan Turinq tərəfindən 1950-ci ildə təklif edilən Turing testi, maşının insan kimi düşünüb-düşünmədiyini anlamaq məqsədi daşıyan təcrübə kimi tanınır.
Testdə insan sorğu-sual edən biri insan, digəri isə süni intellekt olan iki həmsöhbətlə yazılı şəkildə ünsiyyət qurur və hansının insan olduğunu ayırd etməyə çalışır.
Əgər sorğu aparan şəxs bu fərqi ayırd edə bilmirsə, testdən keçən sistem “insan kimi intellektə” malik sayılır.
Araşdırmada nə tapıldı?
Mart ayında nəşr olunan ilkin araşdırmada "ELIZA", "GPT-4o", "LLaMa-3.1-405B" və "GPT-4.5" adlı dörd süni intellekt modeli sınaqdan keçirilib. 284 iştirakçıdan ibarət eksperimental qrupda hər bir fərd eyni vaxtda biri insan, digəri isə süni intellekt olan iki “şahid”lə beş dəqiqəlik yazışmalar aparıb.
Nəticələrə görə, iştirakçılar 73 faizini "GPT-4.5"i insanla səhv salıblar. "LLaMa-3.1-405B" üçün bu nisbət yüzdə 56 olaraq ölçülsə də, "ELIZA" və "GPT-4o" modelləri müvafiq olaraq yalnız yüzdə 23 və 21 faiz insanlarla səhv salınıb.
Turing testinin tənqidləri
Turing testi illərlə süni intellektin “intellektini” ölçmək üçün istifadə edilən simvolik vasitə olsa da, elmi ictimaiyyətdə onun etibarlılığı ilə bağlı tam konsensus yoxdur.
Testin dörd əsas tənqidi diqqəti cəlb edir:
Davranış və düşüncə arasındakı fərq: Bəzi ekspertlər testin yalnız xarici davranışı ölçdüyünü və faktiki düşünmə qabiliyyətini əks etdirmədiyini iddia edirlər.
Beyin maşındırmı?: Türinqin beynin mexaniki strukturlarla izah oluna biləcəyi yanaşması bəzi elm adamları tərəfindən qəbul edilmir.
Əməliyyat fərqi: Kompüterlər və insanlar fərqli şəkildə işlədikləri üçün bu proseslərin eyni nəticələrə çatsalar da müqayisə edilə bilməyəcəyi ifadə edilir.
Testin əhatə dairəsi: Tək bir davranışın qiymətləndirilməsinin ümumi zəkanın ölçülməsi üçün kifayət etməyəcəyi fikri önə çıxır.
O, doğrudanmı insan kimi düşünür?
Tədqiqatın müəllifləri "GPT-4.5"in sınaqdan keçdiyini etiraf edirlər, lakin bunun sistemin insan intellektinə malik olması demək olmadığını vurğulayırlar. Buradakı süni intellektin ancaq “insan kimi görünməyə” müvəffəq olduğu bildirilir.
Tədqiqatın qısa müddəti və müəyyən "şəxsiyyətləri" götürən modellər kimi dəyişənlərin test nəticələrinə təsir edə biləcəyi də ifadə edilir.
Mütəxəssislərin fikrincə, "GPT-4.5" hələlik insanlar qədər ağıllı deyil. Lakin onun bəzi situasiyalarda insanları inandıra biləcək təqlid qabiliyyətinin olması danılmaz faktdır.
Qadir, Bizimyol.info


