·
USD EUR
Scaling laws больше не работают: почему следующее поколение ИИ требует новых подходов
Исследования

Scaling laws больше не работают: почему следующее поколение ИИ требует новых подходов

Новое исследование показывает: возврат от увеличения размера модели и объёма данных начинает снижаться. Эпоха «просто добавь данных» подходит к концу.

Несколько независимых исследовательских групп одновременно опубликовали схожие выводы: классические scaling laws Кайплана-Чинчиллы начинают давать сбои при экстраполяции на текущие масштабы. Увеличение размера модели и объёма обучающих данных всё меньше конвертируется в улучшение качества.

Эмпирические данные указывают на «плато»: GPT-5 и Claude 4 Opus заметно мощнее предшественников, но разрыв уже не такой драматический, как между GPT-3 и GPT-4. Дальнейшее масштабирование по прежним рецептам становится неэффективным.

Исследователи видят выход в нескольких направлениях: специализированное обучение на синтетических данных (synthetic data), улучшение алгоритмов обучения (а не объёма данных), архитектурные инновации (SSM, MoE, test-time compute), более умное использование inference (o1-style reasoning).

Это переломный момент: следующий скачок в AI потребует не денег на вычисления, а интеллектуального прорыва.

Комментарии (0)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Другие новости

Все новости
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
Большие модели
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.
14 ч назад
48.3K 2.1K 1 мин
Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ
Безопасность AI
Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ
Команда безопасности Стэнфорда нашла универсальный jailbreak для GPT-5 на вторые сутки после релиза. OpenAI выпустила патч через 6 часов после уведомления.
1 дн назад
41.2K 3.1K 5 мин
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
Большие модели
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.
1 дн назад
22.1K 980 1 мин
Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет
Роботы и железо
Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет
Электрический Atlas от Boston Dynamics впервые продемонстрировал надёжное складывание одежды — задачу, считавшуюся неразрешимой для роботов из-за деформируемой природы ткани.
1 дн назад
31.2K 2.9K 5 мин
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Генерация изображений
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.
1 дн назад
31.5K 1.8K 1 мин