Icma.az
close
up
AZ
Menu

Украинские дроны поразили полигон РФ, с которого запускаются ракеты Орешник

Власти Кыргызстана ограничили долю русскоязычного контента на ТВ Minval Politika

Президент Чехии заявил, что Украине придется пойти на болезненные уступки Minval Politika

ASTRA: Самолет госпиталь МЧС России, где может находиться Адам Кадыров, приземлился во Внуково

В Дейр Хафире и Мескене сняли флаги PKK/SDG: сирийская армия восстановила контроль ВИДЕО

В Серпухове горит электроподстанция, часть города обесточена ВИДЕО / ФОТО

Внешний госдолг Грузии достиг 9,29 млрд долларов

LIVE: Карабах и Заглембе быстро обменялись голами

В Женеве состоялся международный дипломатический брифинг в связи с WUF13

Трамп заявил, что готов остановить девятую войну

Посол: Литва будет представлена делегацией на WUF13 в Баку

Афган Джалилов возглавил ASCO: что известно о новом руководителе? ДОСЬЕ

Названа сумма, выплаченная Кяпазом за трансфер грузинского защитника

Мюнхенская конференция отменила приглашение главе МИД Ирана

Трамп заявил, что никто не убеждал его не наносить удар по Ирану

Нелегкая прогулка : Куба заявила о сбитом вертолете США в Каракасе

Белый дом: Представитель ПНА Али Шаат возглавит комитет по управлению Газой

Закрытые двери Давоса: Россию снова не зовут

Пользователи из разных стран сообщили о сбое в соцсети X

Украина и Британия будут производить 1000 дронов Octopus в месяц

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:110
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

Украинские дроны поразили полигон РФ, с которого запускаются ракеты Орешник

17 Января 2026 20:58see257

Власти Кыргызстана ограничили долю русскоязычного контента на ТВ Minval Politika

16 Января 2026 16:58see232

Президент Чехии заявил, что Украине придется пойти на болезненные уступки Minval Politika

16 Января 2026 18:57see224

ASTRA: Самолет госпиталь МЧС России, где может находиться Адам Кадыров, приземлился во Внуково

17 Января 2026 09:42see223

В Дейр Хафире и Мескене сняли флаги PKK/SDG: сирийская армия восстановила контроль ВИДЕО

17 Января 2026 14:21see212

В Серпухове горит электроподстанция, часть города обесточена ВИДЕО / ФОТО

17 Января 2026 09:42see211

Внешний госдолг Грузии достиг 9,29 млрд долларов

16 Января 2026 22:13see202

LIVE: Карабах и Заглембе быстро обменялись голами

16 Января 2026 19:16see195

В Женеве состоялся международный дипломатический брифинг в связи с WUF13

16 Января 2026 20:31see191

Трамп заявил, что готов остановить девятую войну

17 Января 2026 00:43see176

Посол: Литва будет представлена делегацией на WUF13 в Баку

16 Января 2026 16:19see170

Афган Джалилов возглавил ASCO: что известно о новом руководителе? ДОСЬЕ

16 Января 2026 18:21see166

Названа сумма, выплаченная Кяпазом за трансфер грузинского защитника

16 Января 2026 22:41see162

Мюнхенская конференция отменила приглашение главе МИД Ирана

16 Января 2026 20:18see160

Трамп заявил, что никто не убеждал его не наносить удар по Ирану

16 Января 2026 23:55see156

Нелегкая прогулка : Куба заявила о сбитом вертолете США в Каракасе

17 Января 2026 00:57see155

Белый дом: Представитель ПНА Али Шаат возглавит комитет по управлению Газой

17 Января 2026 04:13see148

Закрытые двери Давоса: Россию снова не зовут

16 Января 2026 19:13see148

Пользователи из разных стран сообщили о сбое в соцсети X

16 Января 2026 21:17see147

Украина и Британия будут производить 1000 дронов Octopus в месяц

16 Января 2026 21:13see143
newsПоследние новости
Самые свежие и актуальные события дня