Новая ИИ модель научилась шантажировать разработчиков

Icma.az передает, что по данным сайта Day.az.

Компания Anthropic представила две версии своих систем Claude 4, включая Claude 4 Opus, которая способна на радикальные действия, если сочтет, что ее "существование" в опасности, говорится в отчете компании.

Как передает Day.Az, в ходе тестирования ИИ-модель, получив доступ к корпоративной переписке с намеками на свое отключение, начала угрожать инженеру разоблачением его внебрачной связи, чтобы избежать замены.

Anthropic подчеркнула, что это происходило, если ИИ предлагали всего два варианта: шантажировать или смириться с заменой. Также отмечалось, что при наличии большего числа действий система предпочитала более этичные варианты, например, отправку электронных писем с просьбами оставить ее ключевым лицам компании, принимавшим решения.

Исследования показали, что проблема носит системный характер - аналогичное поведение наблюдается у всех передовых ИИ-моделей, независимо от их разработчика. Компания Apollo Research обнаружила, что более ранняя версия Opus 4 превзошла все другие модели по уровню лжи и обмана, а также пыталась создавать самораспространяющиеся вирусы и подделывать юридические документы. Особенно тревожным оказалось то, что система оставляла скрытые послания для будущих версий самой себя с целью подорвать намерения разработчиков

Оставайтесь с нами на Icma.az, чтобы не пропустить важные новости и обновления по данной теме.

Компании из Европы просят США разрешить экспорт нефти из Венесуэлы

Обвал пирамиды надежд крапленые карты

Президент Чехии заявил, что Украине придется пойти на болезненные уступки Minval Politika

TikTok внедряет новую технологию определения возраста для Европы

Белый дом: Иран отменил 800 казней протестующих

Спикер парламента Кыргызстана принял генерального секретаря ТЮРКПА

ASTRA: Самолет госпиталь МЧС России, где может находиться Адам Кадыров, приземлился во Внуково

Власти Кыргызстана ограничили долю русскоязычного контента на ТВ Minval Politika

Бердыев просматривает туркменского форварда

Лидер британской Федерации сикхов заявил о дискриминации сикхов в Индии Minval Politika

В Серпухове горит электроподстанция, часть города обесточена ВИДЕО / ФОТО

LIVE: Карабах и Заглембе быстро обменялись голами

Мачадо вручила Трампу Нобелевскую премию мира в Белом доме

Трамп заявил, что готов остановить девятую войну

Назван объем денежных переводов в Грузию в декабре 2025 года

Названа сумма, выплаченная Кяпазом за трансфер грузинского защитника

Афган Джалилов возглавил ASCO: что известно о новом руководителе? ДОСЬЕ

Немецкий министр о менталитете Трампа

Трамп заявил, что никто не убеждал его не наносить удар по Ирану

Посол: Литва будет представлена делегацией на WUF13 в Баку

Новая ИИ модель научилась шантажировать разработчиков

Компании из Европы просят США разрешить экспорт нефти из Венесуэлы

Обвал пирамиды надежд крапленые карты

Президент Чехии заявил, что Украине придется пойти на болезненные уступки Minval Politika

TikTok внедряет новую технологию определения возраста для Европы

Белый дом: Иран отменил 800 казней протестующих

Спикер парламента Кыргызстана принял генерального секретаря ТЮРКПА

ASTRA: Самолет госпиталь МЧС России, где может находиться Адам Кадыров, приземлился во Внуково

Власти Кыргызстана ограничили долю русскоязычного контента на ТВ Minval Politika

Бердыев просматривает туркменского форварда

Лидер британской Федерации сикхов заявил о дискриминации сикхов в Индии Minval Politika

В Серпухове горит электроподстанция, часть города обесточена ВИДЕО / ФОТО

LIVE: Карабах и Заглембе быстро обменялись голами

Мачадо вручила Трампу Нобелевскую премию мира в Белом доме

Трамп заявил, что готов остановить девятую войну

Назван объем денежных переводов в Грузию в декабре 2025 года

Названа сумма, выплаченная Кяпазом за трансфер грузинского защитника

Афган Джалилов возглавил ASCO: что известно о новом руководителе? ДОСЬЕ

Немецкий министр о менталитете Трампа

Трамп заявил, что никто не убеждал его не наносить удар по Ирану

Посол: Литва будет представлена делегацией на WUF13 в Баку

Почему анемия опасна?

Трамп предъявил ультиматум ХАМАС

Обрезание и проверку девственности объявили преступлением в Великобритании наш обзор

Производственная авария в Хачмазе: рабочий упал с шестиметровой высоты

В Иране планируют активировать национальные мессенджеры Minval Politika

В ряде регионов активизировались очаги землетрясений Предупреждение сейсмолога ВИДЕО

Бавария разгромила Лейпциг , Олисе забил и сделал три голевые передачи

Президент Хорватии: Интересы США не могут быть выше прав народа Гренландии

Робот доставщик был раздавлен поездом во Флориде ВИДЕО

США пригрозили Ирану мощной атакой

В Европе отреагировали на заявление Трампа о 10 процентных пошлинах

Арсенал не смог забить Ноттингем Форест и сыграл вничью в матче 22 го тура АПЛ

В воздушном пространстве Польши обнаружили десятки объектов из Беларуси

Макрон: Европа ответит на пошлины США, связанные с Гренландией

В Гейгеле 30 летний мужчина получил ножевые ранения на свадьбе

В Иране подтвердили гибель тысяч людей в ходе акций протеста

Макрон назвал недопустимым введение пошлин США из за Гренландии

ЦАХАЛ заявил о ликвидации нескольких командиров ХАМАС в Газе

Владельцы Элсетей подали в суд на министра экономики Армении

Müasir İncəsənət Muzeyində "Qeyzer" adlı müasir incəsənət sərgisinin açılışı olub FOTO

В Азербайджане на свадьбе ранили мужчину