Icma.az
close
up
AZ
Menu

В Египте представили бронированную платформу для запуска БПЛА

Метро и автобусы Баку могут перейти на новую модель оплаты Как это будет работать, объяснил эксперт

Сколько будут отдыхать азербайджанцы в 2026 году?

WSJ: Украина могла атаковать почти десяток танкеров российского теневого флота

Дополнительные проценты за снятие наличных что говорит регулятор?

Курбан Бердыев, уважайте милли

Наполи может поконкурировать с Боруссией за вратаря Карабаха

Срочные трудовые договоры в Азербайджане: кого коснутся изменения?

В России снова взорвали Дружбу

США намерены вернуть России миллиарды

Фильм иранского режиссера Джафара Панахи удостоился трех наград премии Gotham Awards

Трамп: Будем бить и по суше

Рейтинг самых влиятельных людей культуры и искусства 2025 года по версии New York Magazine ФОТО

Зеленский о трех ключевых темах для Украины

ВСУ атаковали территорию полка Ахмат в Чечне ВИДЕО

Эти граждане смогут выйти на пенсию раньше и выбрать более высокий размер пенсии ПОДРОБНОСТИ

Госсекретарь США назвал ключевой пункт спора в переговорах по Украине

Герой СВО убил сослуживца и таксиста: он их принял за украинцев

Проект энергокабеля из Азербайджана вошёл в приоритетный список ЕС

Путин не пойдет на уступки

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:100
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

В Египте представили бронированную платформу для запуска БПЛА

03 Декабря 2025 08:25see231

Метро и автобусы Баку могут перейти на новую модель оплаты Как это будет работать, объяснил эксперт

02 Декабря 2025 11:57see209

Сколько будут отдыхать азербайджанцы в 2026 году?

02 Декабря 2025 17:38see197

WSJ: Украина могла атаковать почти десяток танкеров российского теневого флота

03 Декабря 2025 15:17see192

Дополнительные проценты за снятие наличных что говорит регулятор?

03 Декабря 2025 11:16see186

Курбан Бердыев, уважайте милли

03 Декабря 2025 11:37see180

Наполи может поконкурировать с Боруссией за вратаря Карабаха

02 Декабря 2025 13:08see179

Срочные трудовые договоры в Азербайджане: кого коснутся изменения?

03 Декабря 2025 13:15see176

В России снова взорвали Дружбу

03 Декабря 2025 14:29see167

США намерены вернуть России миллиарды

02 Декабря 2025 12:44see162

Фильм иранского режиссера Джафара Панахи удостоился трех наград премии Gotham Awards

03 Декабря 2025 16:15see160

Трамп: Будем бить и по суше

03 Декабря 2025 00:16see155

Рейтинг самых влиятельных людей культуры и искусства 2025 года по версии New York Magazine ФОТО

02 Декабря 2025 10:34see151

Зеленский о трех ключевых темах для Украины

03 Декабря 2025 00:46see149

ВСУ атаковали территорию полка Ахмат в Чечне ВИДЕО

02 Декабря 2025 10:50see147

Эти граждане смогут выйти на пенсию раньше и выбрать более высокий размер пенсии ПОДРОБНОСТИ

02 Декабря 2025 09:45see147

Госсекретарь США назвал ключевой пункт спора в переговорах по Украине

03 Декабря 2025 08:02see143

Герой СВО убил сослуживца и таксиста: он их принял за украинцев

02 Декабря 2025 23:48see140

Проект энергокабеля из Азербайджана вошёл в приоритетный список ЕС

02 Декабря 2025 10:31see132

Путин не пойдет на уступки

03 Декабря 2025 00:50see131
newsПоследние новости
Самые свежие и актуальные события дня