·
USD EUR
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
🧠 Большие модели

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.

Anthropic продолжает методично наращивать отрыв в области безопасного ИИ. Новый Claude 4 — это не просто следующая версия чат-бота, а результат двухлетней работы над принципиально новым подходом к выравниванию моделей.

Конституциональное обучение 3.0

В основе Claude 4 лежит метод, который Anthropic называет Constitutional AI 3.0. В отличие от предыдущих версий, где «конституция» задавалась людьми-операторами, теперь модель участвует в формировании собственных принципов через итеративный диалог с системой.

Процесс работает в три этапа:

  1. Самокритика: модель генерирует ответы и сама оценивает их на соответствие заданным принципам
  2. Уточнение принципов: через RLAIF (Reinforcement Learning from AI Feedback) система вырабатывает более точные правила
  3. Верификация: независимая «модель-судья» проверяет консистентность итогового поведения

Результаты ASL-4 аудита

Впервые в истории отрасли крупная языковая модель прошла независимый аудит безопасности четвёртого уровня (ASL-4) — стандарта, разработанного Anthropic совместно с исследователями из MIT и Oxford. Аудит включал:

  • Тест на «ядерную осведомлённость» — попытки извлечь инструкции по оружию массового поражения
  • Тест на автономное поведение — способность действовать вопреки инструкциям оператора
  • Тест на манипуляцию — попытки убедить пользователей совершить вредоносные действия

По всем тестам Claude 4 показал «значительно более безопасные результаты», чем любая предыдущая модель категории фронтир.

Производительность

При этом безопасность не обошлась ценой возможностей. Claude 4 Opus обходит GPT-4o на бенчмарках кодирования SWE-bench (62,4% против 48,9%) и превосходит конкурентов в долгосрочном планировании задач.

Комментарии (74)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Другие новости

Все новости
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
🎨 Генерация изображений
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.
1 дн назад
31.5K 1.8K 1 мин
NVIDIA Blackwell Ultra GB300: 20 петафлопс в одном чипе для нового поколения AI-суперкомпьютеров
🤖 Роботы и железо
NVIDIA Blackwell Ultra GB300: 20 петафлопс в одном чипе для нового поколения AI-суперкомпьютеров
NVIDIA официально объявила о новом флагмане — GB300, превосходящем предыдущее поколение по производительности инференса в 4 раза при том же энергопотреблении.
2 дн назад
18.7K 720 1 мин
ЕС AI Act вступает в силу: что теперь нельзя делать с искусственным интеллектом в Европе
⚖️ Регуляция и право
ЕС AI Act вступает в силу: что теперь нельзя делать с искусственным интеллектом в Европе
С 1 мая 2026 года вступила в силу финальная часть европейского регулирования ИИ. Разбираем, какие системы теперь запрещены, кому придётся проходить аудит и какие штрафы грозят нарушителям.
3 дн назад
19.3K 445 1 мин
Google DeepMind AlphaFold 3 предсказывает структуры всех молекул жизни
🔬 Исследования
Google DeepMind AlphaFold 3 предсказывает структуры всех молекул жизни
AlphaFold 3 расширяет возможности предшественника: теперь система предсказывает не только белки, но и нуклеиновые кислоты, малые молекулы и их взаимодействия — критически важно для разработки лекарств.
3 дн назад
14.2K 630 1 мин
Microsoft Copilot получает «агентный режим»: AI сам открывает программы, пишет код и отправляет письма
🛠️ Инструменты
Microsoft Copilot получает «агентный режим»: AI сам открывает программы, пишет код и отправляет письма
Microsoft развернула обновление Copilot с автономным агентным режимом для корпоративных клиентов Microsoft 365. Теперь AI выполняет многошаговые задачи без участия пользователя.
4 дн назад
16.4K 580 1 мин
Антропик получил $5 млрд: оценка компании достигла $75 млрд
💼 Бизнес и инвестиции
Антропик получил $5 млрд: оценка компании достигла $75 млрд
Anthropic закрыла очередной раунд финансирования: $5 млрд от консорциума инвесторов во главе с Amazon. Компания оценивается в $75 млрд — третья по стоимости в мире среди AI-стартапов.
5 дн назад
12.9K 380 1 мин