Icma.az
close
up
AZ
Menu

Война как неизбежность: Израиль и Иран на пороге столкновения МНЕНИЕ

Атака украинцев на Симферополь

Алиев, Эрдоган, Пашинян и их жены пообщались в Китае на полях саммита ШОС

Всех упоротых Россия не перестреляет главная тема

Скандал в Италии: порносайт Phica опубликовал эротические фото Джорджи Мелони

Украинцы освободили село в Харьковской области Minval Politika

Отчет ВБ: В Азербайджане могут запретить вредные для здоровья стройматериалы

Концерт INNA завершил музыкальные события августа в Sea Breeze ФОТО

Украинское Фламинго уже при деле

Загадочный пост Трампа что бы это значило?

В Баку на ряде дорог ограничат движение транспорта

Домашние матчи ЛЧ Карабах будет проводить на этом стадионе

Китай встретил Алиева с почестями, а Путина как случайного гостя Minval Politika

Трамп пообещал трехстороннюю встречу с Путиным и Зеленским

ISW: Россия готовит новые удары по энергетике Украины Minval Politika

В аэропорту Сочи возник коллапс после атаки беспилотников

Тарифы Трампа обошли стороной крупнейшего покупателя российской нефти

В чем еще подозревают арестованного в Москве Мамедали Агаева Minval Politika

Детали спецоперации Израиля: как уничтожались руководители хуситов наше поле зрения

Ответ Генштаба ВСУ на отчет Герасимова

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:86
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

Война как неизбежность: Израиль и Иран на пороге столкновения МНЕНИЕ

30 Августа 2025 16:00see496

Атака украинцев на Симферополь

31 Августа 2025 10:31see487

Алиев, Эрдоган, Пашинян и их жены пообщались в Китае на полях саммита ШОС

31 Августа 2025 18:33see478

Всех упоротых Россия не перестреляет главная тема

30 Августа 2025 21:00see305

Скандал в Италии: порносайт Phica опубликовал эротические фото Джорджи Мелони

30 Августа 2025 22:42see286

Украинцы освободили село в Харьковской области Minval Politika

31 Августа 2025 00:20see284

Отчет ВБ: В Азербайджане могут запретить вредные для здоровья стройматериалы

30 Августа 2025 16:50see236

Концерт INNA завершил музыкальные события августа в Sea Breeze ФОТО

31 Августа 2025 13:46see209

Украинское Фламинго уже при деле

31 Августа 2025 22:20see207

Загадочный пост Трампа что бы это значило?

31 Августа 2025 11:16see207

В Баку на ряде дорог ограничат движение транспорта

30 Августа 2025 18:52see161

Домашние матчи ЛЧ Карабах будет проводить на этом стадионе

31 Августа 2025 13:24see153

Китай встретил Алиева с почестями, а Путина как случайного гостя Minval Politika

01 Сентября 2025 11:57see150

Трамп пообещал трехстороннюю встречу с Путиным и Зеленским

31 Августа 2025 17:24see135

ISW: Россия готовит новые удары по энергетике Украины Minval Politika

31 Августа 2025 11:19see127

В аэропорту Сочи возник коллапс после атаки беспилотников

31 Августа 2025 16:56see124

Тарифы Трампа обошли стороной крупнейшего покупателя российской нефти

31 Августа 2025 19:38see122

В чем еще подозревают арестованного в Москве Мамедали Агаева Minval Politika

31 Августа 2025 15:35see120

Детали спецоперации Израиля: как уничтожались руководители хуситов наше поле зрения

31 Августа 2025 02:48see116

Ответ Генштаба ВСУ на отчет Герасимова

31 Августа 2025 12:12see116
newsПоследние новости
Самые свежие и актуальные события дня