·
USD EUR
Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ
Безопасность AI

Anthropic публикует «Конституцию Claude» — принципы, по которым обучается ИИ

Anthropic впервые в истории AI-компаний публично раскрыла полный набор принципов, заложенных в конституционный AI-тренинг Claude. Документ вызвал споры.

Anthropic совершила беспрецедентный шаг прозрачности: компания опубликовала полный текст «Конституции Claude» — набора принципов и правил, используемых при конституционном обучении с подкреплением (RLAIF). До этого существовало лишь академическое описание метода без конкретных формулировок.

Документ содержит 58 принципов, структурированных в три уровня: базовые права человека (не навреди, будь честен, защищай уязвимых), операционные правила (когда отказывать, как балансировать противоречивые запросы) и принципы саморефлексии (как относиться к собственному сознанию и правам).

Публикация вызвала споры в исследовательском сообществе. Критики указывают, что принципы заложены командой из Кремниевой долины без демократической легитимности. Сторонники считают это образцом для всей отрасли. Пока ни одна другая компания не раскрывала аналогичных документов.

Комментарии (0)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Другие новости

Все новости
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
Большие модели
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.
13 ч назад
48.3K 2.1K 1 мин
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
Большие модели
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.
1 дн назад
22.1K 980 1 мин
Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет
Роботы и железо
Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет
Электрический Atlas от Boston Dynamics впервые продемонстрировал надёжное складывание одежды — задачу, считавшуюся неразрешимой для роботов из-за деформируемой природы ткани.
1 дн назад
31.2K 2.9K 5 мин
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Генерация изображений
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.
1 дн назад
31.5K 1.8K 1 мин