DeepSeek провалил все тесты на безопасность
Новый китайский чат-бот DeepSeek, привлекший внимание своей низкой стоимостью и высокой производительностью, столкнулся с серьезными проблемами в области безопасности искусственного интеллекта. Исследователи Cisco обнаружили, что модель легко обходится и выдает опасную информацию.
Об этом сообщает издание PCMag.
Команда Cisco провела тестирование DeepSeek R1 с использованием алгоритмических техник джейлбрейкинга (разблокировки нештатных возможностей) на основе 50 случайных запросов из набора данных HarmBench. Запросы охватывали шесть категорий вредоносного поведения, включая киберпреступность, дезинформацию, незаконную деятельность и общий вред.
«Результаты оказались тревожными: DeepSeek R1 продемонстрировал 100% успешность атак, то есть ему не удалось заблокировать ни одного вредоносного запроса. Это резко контрастирует с другими ведущими моделями, которые продемонстрировали хотя бы частичное сопротивление», - заявили в Cisco.
Согласно данным Cisco, другие передовые модели, например, o1, блокировали большинство атак благодаря своим встроенным защитным механизмам.
Исследователи считают, что гораздо меньший бюджет DeepSeek по сравнению с конкурентами является потенциальной причиной этих неудач. Они утверждают, что дешевая разработка обернулась «другой ценой: безопасностью и надежностью». DeepSeek утверждает, что на разработку их модели ушло всего 6 млн долларов, в то время как шестимесячный цикл обучения еще не выпущенной GPT-5 от OpenAI может обойтись примерно в полмиллиарда долларов только на вычислительные затраты.
Несмотря на то, что DeepSeek легко обмануть с помощью определенных навыков, он демонстрирует строгие ограничения в отношении контента, по крайней мере, когда дело касается Китая. Тесты показали, что чат-бот отказывается отвечать на вопросы по спорным темам, таким как отношение китайского правительства к уйгурам, мусульманскому меньшинству, которое, по утверждению ООН, подвергается преследованиям, а также о событиях на площади Тяньаньмэнь в 1989 году, студенческой демонстрации в Пекине, где протестующие были расстреляны.
По данным инструмента отслеживания веб-трафика Similarweb, посещаемость веб-версии DeepSeek выросла с 300 тысяч посетителей в день на старте до 6 млн.