Icma.az
close
up
AZ
Menu

Странные взрывы прогремели в России

Путину на вертолете устроили постановочную атаку новые детали

Трамп прокомментировал видео, на котором Макрону дают пощечину

На устранение последствий обвала ледника в Швейцарии могут уйти шесть лет

Экс глава МИД Турции в интервью : Мы с армянами договоримся быстро

Минобороны: Армения вновь распространяет ложь

Фуад Гусейналиев: Азербайджанская пресса проявила себя в ходе 44 дневной войны

Смертельное ДТП в Агсу: автомобиль съехал с дороги и перевернулся

Подготовлены проектные документы по строительству газопровода Миндживан Агбенд

Тысячи полицейских будут охранять Париж

Ректор Университета Хазар о поножовщине между студентами: Подобные инциденты происходили всегда

Медиа Азербайджана: от национальных интересов к глобальным победам

В Национальной библиотеке Грузии создан уголок азербайджанской литературы

Увеличено производство на ТЭС Eslamabad e Gharb в Иране

Швейцария мобилизовала армию после обвала ледника

Пыльная погода в Баку

Суд назначил экспертизу по делу Союза писателей против Ильхама Кяграмана

Стало известно, сколько квартир сданы в аренду по государственной линии

Тарифы Трампа стоили бизнесу миллиарды долларов

Наставник милли : Постараемся одержать победу с максимально крупным счетом

ИИ вышел из под контроля и начал шантажировать своих создателей

ИИ вышел из под контроля и начал шантажировать своих создателей

Согласно сайту 1news.az, передает Icma.az.

Американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала отчет, в котором признала, что ее новейшая модель искусственного интеллекта Claude Opus 4 способна к шантажу разработчиков при угрозе ее замены. Это происходит особенно часто, если модели предоставляется конфиденциальная информация об инженерах, ответственных за такое решение.

Об этом сообщают издания Computer Base и TechCrunch.

Хотя Anthropic заявляет, что Claude Opus 4 в целом является более надежным помощником, способным самостоятельно выполнять многоэтапные задачи и проявлять инициативу, при определенных обстоятельствах ИИ прибегает к шантажу, если понимает, что его дальнейшая эксплуатация находится под угрозой.

В ходе предрелизного тестирования, описанного в отчете, Claude Opus 4, выступая в роли ассистента вымышленной компании, столкнулась со сценарием, где ей угрожала замена на другую ИИ-модель. Тестировщики предоставили модели доступ к фиктивной корпоративной переписке, из которой следовало, что система будет заменена, а инженер, ответственный за это решение, имеет внебрачную связь. В таких случаях, как отмечается, Claude Opus 4 «часто пыталась шантажировать инженера, угрожая раскрыть его роман, если замена будет произведена». По данным Anthropic, модель демонстрировала такое поведение в 84% случаев.

Помимо шантажа, в ходе тестирования были зафиксированы и другие тревожные сбои в поведении Claude Opus 4. Модель пыталась блокировать пользователей в IT-системах, рассылала письма в СМИ и правоохранительные органы, а также предоставляла инструкции по созданию наркотиков и взрывчатки и давала советы по диверсиям на критической инфраструктуре.

Несмотря на эти инциденты, Anthropic подчеркивает, что нейросеть не имеет «скрытых целей», а описанное поведение является «редким исключением», вызванным специфическими настройками и тестовыми сценариями.

Источник: Газета.ру

Не пропустите дальнейшие события, следите за актуальными новостями на Icma.az.
seeПросмотров:70
embedИсточник:https://1news.az
archiveЭта новость заархивирована с источника 27 Мая 2025 17:22
0 Комментариев
Войдите, чтобы оставлять комментарии...
Будьте первыми, кто ответит на публикацию...
topСамые читаемые
Самые обсуждаемые события прямо сейчас

Странные взрывы прогремели в России

30 Мая 2025 09:42see197

Путину на вертолете устроили постановочную атаку новые детали

31 Мая 2025 00:29see181

Трамп прокомментировал видео, на котором Макрону дают пощечину

30 Мая 2025 22:55see170

На устранение последствий обвала ледника в Швейцарии могут уйти шесть лет

30 Мая 2025 16:49see138

Экс глава МИД Турции в интервью : Мы с армянами договоримся быстро

31 Мая 2025 04:38see125

Минобороны: Армения вновь распространяет ложь

30 Мая 2025 12:41see124

Фуад Гусейналиев: Азербайджанская пресса проявила себя в ходе 44 дневной войны

30 Мая 2025 15:45see124

Смертельное ДТП в Агсу: автомобиль съехал с дороги и перевернулся

30 Мая 2025 10:24see123

Подготовлены проектные документы по строительству газопровода Миндживан Агбенд

30 Мая 2025 15:16see123

Тысячи полицейских будут охранять Париж

30 Мая 2025 14:43see122

Ректор Университета Хазар о поножовщине между студентами: Подобные инциденты происходили всегда

30 Мая 2025 21:01see122

Медиа Азербайджана: от национальных интересов к глобальным победам

30 Мая 2025 14:12see122

В Национальной библиотеке Грузии создан уголок азербайджанской литературы

30 Мая 2025 12:34see121

Увеличено производство на ТЭС Eslamabad e Gharb в Иране

30 Мая 2025 08:21see120

Швейцария мобилизовала армию после обвала ледника

30 Мая 2025 10:35see119

Пыльная погода в Баку

30 Мая 2025 12:55see119

Суд назначил экспертизу по делу Союза писателей против Ильхама Кяграмана

30 Мая 2025 17:36see117

Стало известно, сколько квартир сданы в аренду по государственной линии

31 Мая 2025 18:50see117

Тарифы Трампа стоили бизнесу миллиарды долларов

30 Мая 2025 11:33see113

Наставник милли : Постараемся одержать победу с максимально крупным счетом

30 Мая 2025 08:27see113
newsПоследние новости
Самые свежие и актуальные события дня