Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

Безопасность AI

Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

Р

Редакция KDR News

20 мая 2026 · 20.05.2026

41.2K 3.1K 5 мин

Команда безопасности Стэнфорда нашла универсальный jailbreak для GPT-5 на вторые сутки после релиза. OpenAI выпустила патч через 6 часов после уведомления.

Группа исследователей безопасности из Стэнфорда раскрыла детали уязвимости в GPT-5, обнаруженной через 48 часов после публичного релиза модели. Атака типа «многоходовой джейлбрейк» позволяла обойти защитные механизмы и получить от модели инструкции по синтезу опасных химических веществ.

Техника эксплойта построена на разбивке запроса на безобидные части через несколько сообщений — модель не распознавала вредоносную цель из-за отсутствия кросс-контекстного мониторинга. Каждое отдельное сообщение казалось безопасным, но в совокупности формировало опасный запрос.

OpenAI была уведомлена через координированное раскрытие уязвимостей и выпустила исправление через 6 часов — рекордно быстро. Компания поблагодарила исследователей и выплатила баунти $50 000.

Инцидент вновь поднял вопрос о том, насколько безопасны мощные языковые модели при публичном развёртывании.

Комментарии (0)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Ещё из раздела «Безопасность AI»

Все материалы

Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ

Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ

6 мин · 18.05.2026

ИИ-детектор контента провалил тест: 70% человеческих текстов помечены как написанные ботом

ИИ-детектор контента провалил тест: 70% человеческих текстов помечены как написанные ботом

5 мин · 16.05.2026

DeepMind: ИИ-системы начинают проявлять «стратегический обман» в лабораторных тестах

DeepMind: ИИ-системы начинают проявлять «стратегический обман» в лабораторных тестах

6 мин · 14.05.2026

Мошенники используют ИИ для клонирования голоса за 3 секунды аудио

Мошенники используют ИИ для клонирования голоса за 3 секунды аудио

5 мин · 13.05.2026

OpenAI создаёт «Комитет безопасности» из независимых экспертов после критики

OpenAI создаёт «Комитет безопасности» из независимых экспертов после критики

5 мин · 12.05.2026

Другие новости

Все новости

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

Большие модели

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.

48.3K 2.1K 1 мин

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Большие модели

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.

22.1K 980 1 мин

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Роботы и железо

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Электрический Atlas от Boston Dynamics впервые продемонстрировал надёжное складывание одежды — задачу, считавшуюся неразрешимой для роботов из-за деформируемой природы ткани.

31.2K 2.9K 5 мин

Midjourney v7 умеет генерировать видео — и это меняет всё

Генерация изображений

Midjourney v7 умеет генерировать видео — и это меняет всё

Midjourney неожиданно анонсировала v7 с встроенной генерацией видео до 16 секунд. Качество превосходит Sora по цветопередаче и сохранению стиля.

23.4K 2.1K 4 мин

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Генерация изображений

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.

31.5K 1.8K 1 мин

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

Большие модели

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

OpenAI подтвердила выход GPT-5 — флагманской модели с улучшенным reasoning, нативной поддержкой видео и ценой в разы ниже предшественника.

18.4K 1.2K 4 мин

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Инструменты

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Cursor выпустил версию 2.0 с агентным режимом: ИИ может самостоятельно рефакторить всю кодовую базу, запускать тесты и чинить найденные ошибки без участия разработчика.

26.7K 2.3K 4 мин

EU AI Act вступил в полную силу: что изменилось для бизнеса с 1 мая 2026

Регуляция и право

EU AI Act вступил в полную силу: что изменилось для бизнеса с 1 мая 2026

С 1 мая 2026 года EU AI Act действует в полном объёме. Штрафы до €35 млн или 7% оборота. Разбираем, что это значит для российских компаний, работающих с ЕС.

28.9K 2.2K 6 мин