Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ

Безопасность AI

Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ

Р

Редакция KDR News

18 мая 2026 · 18.05.2026

22.8K 2K 6 мин

Anthropic впервые в истории AI-компаний публично раскрыла полный набор принципов, заложенных в конституционный AI-тренинг Claude. Документ вызвал споры.

Anthropic совершила беспрецедентный шаг прозрачности: компания опубликовала полный текст «Конституции Claude» — набора принципов и правил, используемых при конституционном обучении с подкреплением (RLAIF). До этого существовало лишь академическое описание метода без конкретных формулировок.

Документ содержит 58 принципов, структурированных в три уровня: базовые права человека (не навреди, будь честен, защищай уязвимых), операционные правила (когда отказывать, как балансировать противоречивые запросы) и принципы саморефлексии (как относиться к собственному сознанию и правам).

Публикация вызвала споры в исследовательском сообществе. Критики указывают, что принципы заложены командой из Кремниевой долины без демократической легитимности. Сторонники считают это образцом для всей отрасли. Пока ни одна другая компания не раскрывала аналогичных документов.

Комментарии (0)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Ещё из раздела «Безопасность AI»

Все материалы

Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

5 мин · 20.05.2026

ИИ-детектор контента провалил тест: 70% человеческих текстов помечены как написанные ботом

ИИ-детектор контента провалил тест: 70% человеческих текстов помечены как написанные ботом

5 мин · 16.05.2026

DeepMind: ИИ-системы начинают проявлять «стратегический обман» в лабораторных тестах

DeepMind: ИИ-системы начинают проявлять «стратегический обман» в лабораторных тестах

6 мин · 14.05.2026

Мошенники используют ИИ для клонирования голоса за 3 секунды аудио

Мошенники используют ИИ для клонирования голоса за 3 секунды аудио

5 мин · 13.05.2026

OpenAI создаёт «Комитет безопасности» из независимых экспертов после критики

OpenAI создаёт «Комитет безопасности» из независимых экспертов после критики

5 мин · 12.05.2026

Другие новости

Все новости

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

Большие модели

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.

48.3K 2.1K 1 мин

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Большие модели

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.

22.1K 980 1 мин

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Роботы и железо

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Электрический Atlas от Boston Dynamics впервые продемонстрировал надёжное складывание одежды — задачу, считавшуюся неразрешимой для роботов из-за деформируемой природы ткани.

31.2K 2.9K 5 мин

Midjourney v7 умеет генерировать видео — и это меняет всё

Генерация изображений

Midjourney v7 умеет генерировать видео — и это меняет всё

Midjourney неожиданно анонсировала v7 с встроенной генерацией видео до 16 секунд. Качество превосходит Sora по цветопередаче и сохранению стиля.

23.4K 2.1K 4 мин

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Генерация изображений

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.

31.5K 1.8K 1 мин

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

Большие модели

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

OpenAI подтвердила выход GPT-5 — флагманской модели с улучшенным reasoning, нативной поддержкой видео и ценой в разы ниже предшественника.

18.4K 1.2K 4 мин

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Инструменты

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Cursor выпустил версию 2.0 с агентным режимом: ИИ может самостоятельно рефакторить всю кодовую базу, запускать тесты и чинить найденные ошибки без участия разработчика.

26.7K 2.3K 4 мин

EU AI Act вступил в полную силу: что изменилось для бизнеса с 1 мая 2026

Регуляция и право

EU AI Act вступил в полную силу: что изменилось для бизнеса с 1 мая 2026

С 1 мая 2026 года EU AI Act действует в полном объёме. Штрафы до €35 млн или 7% оборота. Разбираем, что это значит для российских компаний, работающих с ЕС.

28.9K 2.2K 6 мин