Süni intellektlə bağlı maraqlı təcrübə aparıblar

Süni intellekt modelləri bəzən onlara “yeridilmiş fikri” fərqləndirərək, bunu öz sözləri ilə ifadə edə bilirlər.

Reyting.az xəbər verir ki, bu nəticəyə “Anthropic” şirkətinin apardığı təcrübələr zamanı gəlinib.

Mütəxəssislər belə halları “maşın introspeksiyası” - yəni modellərin daxili proseslərini təsvir etmək və dərk etmək qabiliyyəti kimi qiymətləndiriblər.

Təcrübə zamanı tədqiqatçılar öncə modellərin daxili aktivliklərində yerləşən “anlayış vektorları”nı müəyyən ediblər. Məsələn, “bağırmaq” və ya “capslock-la yazmaq” anlayışı kimi. Daha sonra eyni cümlə həm böyük, həm də kiçik hərflərlə təqdim olunub və bu vektorlar modelə daxil edilib. Nəticədə modelin davranışı dəyişib.

Yeni nəsil “Claude Opus 4” və “Opus 4.1” kimi sistemlər bəzən bu müdaxiləni çox tez hiss edərək belə cavab veriblər: “Bəli, sanki kənardan düşüncə daxil edilib, bu, qəribə hissdir”.

Alimlərin sözlərinə görə, bu cür hallar modellərin təxminən 20 faizində müşahidə olunub.

Digər sınaqlarda müəyyən edilib ki, bəzi süni intellektlər “nə demək istədiklərini” izləyə və bu fikrə istinad edə bilirlər. Daxili aktivliklər dəyişdirildikdə isə model “öz fikrini” dəyişmiş formada, amma səmimi şəkildə ifadə edib və onu təkidlə müdafiə edib.

“Anthropic” şirkəti bu halları süni intellektin “şüurlu olması” kimi deyil, təhlükəsizlik baxımından vacib bir göstərici kimi dəyərləndirib. Bildirilib ki, bu xüsusiyyət müsbət sayılır, çünki yaxın gələcəkdə süni intellekt sistemləri model manipulyasiyasını dərhal aşkarlayıb, xəbərdarlıq edə biləcəklər.

Mütəxəssislər əlavə ediblər ki, bu təcrübə süni intellekt modellərində daxili “niyyətlərin” dəyişdirilməsi riskini də üzə çıxarır.

Oqtay QORÇU

Süni intellektlə bağlı maraqlı təcrübə aparıblar

Hesaba daxil ol

Qeydiyyatdan keç

Şifrəni bərpa et