Icma.az
close
up
AZ
Menu

РФ ночью атаковала Запорожье и Днепропетровскую область: повреждены здания, возникли пожары ВИДЕО

В Турции убит один из организаторов погрома в аэропорту Махачкалы

Россия запускает беспилотники у границ НАТО

СМИ: В Турции убит объявленный Россией в розыск владелец Telegram канала Утро Дагестан Фото

Мадагаскар взорвался: армия смела старый порядок и открыла ворота новой Африке АНАЛИЗ от Baku Network

Житель Челябинской области России пытался провезти 100 кг клещей из Баку Minval Politika

Встреча Трампа и Путина обернулась кошмаром для Евросоюза

Удар Израиля разозлил Трампа

Трамп на русских больше не клюет горячая тема

Зеленский рассказал о соглашении с США по ракетам Tomahawk”

Скончался Нурулла Сираджов, пострадавший в авиакатастрофе AZAL недалеко от Актау Minval Politika

Трамп заявил об уничтожении большой подводной лодки с наркотиками

В Баку ограбили сотрудника Минфина

Китайская компания скопировала iPhone

Германия ставит на Турцию. А Эрдоган диктует повестку новая геополитика

Танкер взорвался у берегов Йемена

Торговая стратегия Белого дома меняется: что будет с импортными пошлинами?

Рамиз Мехдиев анатомия неблагодарности и предательства: кто входил в его план?

Не смешите мои Томагавки ! главная тема

У экс чиновников Грузии конфисковали миллионы

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:92
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

РФ ночью атаковала Запорожье и Днепропетровскую область: повреждены здания, возникли пожары ВИДЕО

18 Октября 2025 12:23see270

В Турции убит один из организаторов погрома в аэропорту Махачкалы

18 Октября 2025 10:21see256

Россия запускает беспилотники у границ НАТО

18 Октября 2025 18:23see202

СМИ: В Турции убит объявленный Россией в розыск владелец Telegram канала Утро Дагестан Фото

18 Октября 2025 09:21see190

Мадагаскар взорвался: армия смела старый порядок и открыла ворота новой Африке АНАЛИЗ от Baku Network

18 Октября 2025 18:35see187

Житель Челябинской области России пытался провезти 100 кг клещей из Баку Minval Politika

18 Октября 2025 00:42see179

Встреча Трампа и Путина обернулась кошмаром для Евросоюза

18 Октября 2025 21:13see177

Удар Израиля разозлил Трампа

18 Октября 2025 13:55see169

Трамп на русских больше не клюет горячая тема

18 Октября 2025 02:04see166

Зеленский рассказал о соглашении с США по ракетам Tomahawk”

18 Октября 2025 02:21see160

Скончался Нурулла Сираджов, пострадавший в авиакатастрофе AZAL недалеко от Актау Minval Politika

18 Октября 2025 13:30see154

Трамп заявил об уничтожении большой подводной лодки с наркотиками

18 Октября 2025 23:26see149

В Баку ограбили сотрудника Минфина

17 Октября 2025 23:27see146

Китайская компания скопировала iPhone

18 Октября 2025 02:16see144

Германия ставит на Турцию. А Эрдоган диктует повестку новая геополитика

19 Октября 2025 00:10see143

Танкер взорвался у берегов Йемена

18 Октября 2025 18:55see137

Торговая стратегия Белого дома меняется: что будет с импортными пошлинами?

18 Октября 2025 10:35see136

Рамиз Мехдиев анатомия неблагодарности и предательства: кто входил в его план?

18 Октября 2025 20:23see132

Не смешите мои Томагавки ! главная тема

18 Октября 2025 12:42see131

У экс чиновников Грузии конфисковали миллионы

18 Октября 2025 18:07see127
newsПоследние новости
Самые свежие и актуальные события дня