Icma.az
close
up
AZ
Menu

РФ ночью атаковала Запорожье и Днепропетровскую область: повреждены здания, возникли пожары ВИДЕО

В Турции убит один из организаторов погрома в аэропорту Махачкалы

Россия запускает беспилотники у границ НАТО

СМИ: В Турции убит объявленный Россией в розыск владелец Telegram канала Утро Дагестан Фото

Мадагаскар взорвался: армия смела старый порядок и открыла ворота новой Африке АНАЛИЗ от Baku Network

Встреча Трампа и Путина обернулась кошмаром для Евросоюза

Удар Израиля разозлил Трампа

Внешний госдолг Грузии продолжает расти

Скончался Нурулла Сираджов, пострадавший в авиакатастрофе AZAL недалеко от Актау Minval Politika

Трамп заявил об уничтожении большой подводной лодки с наркотиками

Германия ставит на Турцию. А Эрдоган диктует повестку новая геополитика

Танкер взорвался у берегов Йемена

Торговая стратегия Белого дома меняется: что будет с импортными пошлинами?

Осторожно, Яваш! наша корреспонденция

Рамиз Мехдиев анатомия неблагодарности и предательства: кто входил в его план?

Не смешите мои Томагавки ! главная тема

Орбан: Венгрия может сыграть ключевую роль в урегулировании конфликта в Украине

У экс чиновников Грузии конфисковали миллионы

Рашад Садыхов объяснил первое поражение за полгода

Axios: Стармер предложил разработать с США мирное соглашение для Украины

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:93
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

РФ ночью атаковала Запорожье и Днепропетровскую область: повреждены здания, возникли пожары ВИДЕО

18 Октября 2025 12:23see283

В Турции убит один из организаторов погрома в аэропорту Махачкалы

18 Октября 2025 10:21see267

Россия запускает беспилотники у границ НАТО

18 Октября 2025 18:23see207

СМИ: В Турции убит объявленный Россией в розыск владелец Telegram канала Утро Дагестан Фото

18 Октября 2025 09:21see201

Мадагаскар взорвался: армия смела старый порядок и открыла ворота новой Африке АНАЛИЗ от Baku Network

18 Октября 2025 18:35see192

Встреча Трампа и Путина обернулась кошмаром для Евросоюза

18 Октября 2025 21:13see190

Удар Израиля разозлил Трампа

18 Октября 2025 13:55see179

Внешний госдолг Грузии продолжает расти

18 Октября 2025 09:41see160

Скончался Нурулла Сираджов, пострадавший в авиакатастрофе AZAL недалеко от Актау Minval Politika

18 Октября 2025 13:30see158

Трамп заявил об уничтожении большой подводной лодки с наркотиками

18 Октября 2025 23:26see155

Германия ставит на Турцию. А Эрдоган диктует повестку новая геополитика

19 Октября 2025 00:10see153

Танкер взорвался у берегов Йемена

18 Октября 2025 18:55see147

Торговая стратегия Белого дома меняется: что будет с импортными пошлинами?

18 Октября 2025 10:35see143

Осторожно, Яваш! наша корреспонденция

19 Октября 2025 15:09see142

Рамиз Мехдиев анатомия неблагодарности и предательства: кто входил в его план?

18 Октября 2025 20:23see137

Не смешите мои Томагавки ! главная тема

18 Октября 2025 12:42see137

Орбан: Венгрия может сыграть ключевую роль в урегулировании конфликта в Украине

18 Октября 2025 18:02see135

У экс чиновников Грузии конфисковали миллионы

18 Октября 2025 18:07see133

Рашад Садыхов объяснил первое поражение за полгода

19 Октября 2025 18:57see130

Axios: Стармер предложил разработать с США мирное соглашение для Украины

18 Октября 2025 08:48see128
newsПоследние новости
Самые свежие и актуальные события дня