RAG мёртв, да здравствует долгий контекст? Исследование Google сравнивает подходы

Исследования

RAG мёртв, да здравствует долгий контекст? Исследование Google сравнивает подходы

А

Александр Громов

15 мая 2026 · 15.05.2026

9.8K 520 1 мин arXiv

Google опубликовала масштабное исследование: при контекстном окне 1M+ токенов RAG уступает прямой передаче документов по точности, но выигрывает по стоимости. Когда использовать что?

С появлением моделей с контекстным окном в миллион токенов и больше в AI-сообществе разгорелась дискуссия: нужен ли ещё RAG (Retrieval-Augmented Generation), или лучше просто «скормить» модели всю базу знаний целиком?

Что исследовали

Команда Google DeepMind сравнила три подхода на 12 корпоративных датасетах объёмом от 100 до 10 000 документов:

RAG: векторный поиск + передача топ-K фрагментов
Long Context (LC): все документы в контексте сразу (модель Gemini 1.5 Pro, 1M токенов)
Гибрид: RAG для первичного отбора + LC для финального ответа

Результаты

Метрика	RAG	Long Context	Гибрид
Точность ответов	71%	84%	89%
Стоимость на запрос	$0.003	$0.12	$0.04
Латентность	1.2с	8.4с	3.1с

Вывод: зависит от задачи

RAG остаётся оптимальным для высокочастотных запросов с ограниченным бюджетом. Long Context выигрывает при редких, критически важных запросах и небольших корпусах. Гибрид — лучший выбор для enterprise-приложений с умеренной нагрузкой.

Исследователи также отметили, что с падением цен на токены преимущество RAG по стоимости будет сокращаться, и к 2027 году Long Context может стать предпочтительным для большинства задач.

Google DeepMind Gemini LLM RAG

Комментарии (63)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Ещё из раздела «Исследования»

Все материалы

AlphaFold 3 предсказал структуры всех белков человека с рекордной точностью

AlphaFold 3 предсказал структуры всех белков человека с рекордной точностью

5 мин · 19.05.2026

Google DeepMind AlphaFold 3 предсказывает структуры всех молекул жизни

Google DeepMind AlphaFold 3 предсказывает структуры всех молекул жизни

1 мин · 18.05.2026

ИИ обнаружил новый антибиотик, активный против резистентных бактерий

ИИ обнаружил новый антибиотик, активный против резистентных бактерий

5 мин · 17.05.2026

Google Brain: нейросеть предсказывает инфаркт за 5 лет по снимку сетчатки

Google Brain: нейросеть предсказывает инфаркт за 5 лет по снимку сетчатки

5 мин · 15.05.2026

Физики из MIT обучили нейросеть решать уравнения квантовой механики в 1000 раз быстрее

Физики из MIT обучили нейросеть решать уравнения квантовой механики в 1000 раз быстрее

5 мин · 13.05.2026

Fine-tuning против prompt engineering: когда что использовать в 2026 году

Fine-tuning против prompt engineering: когда что использовать в 2026 году

1 мин · 13.05.2026

Другие новости

Все новости

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

Большие модели

GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»

OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.

48.3K 2.1K 1 мин

Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

Безопасность AI

Исследователи взломали GPT-5 за 48 часов: модель давала инструкции по синтезу опасных веществ

Команда безопасности Стэнфорда нашла универсальный jailbreak для GPT-5 на вторые сутки после релиза. OpenAI выпустила патч через 6 часов после уведомления.

41.2K 3.1K 5 мин

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Большие модели

Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»

Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.

22.1K 980 1 мин

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Роботы и железо

Boston Dynamics Atlas научился складывать бельё — задача, которую не мог робот 30 лет

Электрический Atlas от Boston Dynamics впервые продемонстрировал надёжное складывание одежды — задачу, считавшуюся неразрешимой для роботов из-за деформируемой природы ткани.

31.2K 2.9K 5 мин

Midjourney v7 умеет генерировать видео — и это меняет всё

Генерация изображений

Midjourney v7 умеет генерировать видео — и это меняет всё

Midjourney неожиданно анонсировала v7 с встроенной генерацией видео до 16 секунд. Качество превосходит Sora по цветопередаче и сохранению стиля.

23.4K 2.1K 4 мин

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Генерация изображений

Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира

Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.

31.5K 1.8K 1 мин

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

Большие модели

GPT-5 официально анонсирован: мультимодальность, рассуждения и новый ценовой уровень

OpenAI подтвердила выход GPT-5 — флагманской модели с улучшенным reasoning, нативной поддержкой видео и ценой в разы ниже предшественника.

18.4K 1.2K 4 мин

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Инструменты

Cursor AI 2.0: редактор кода с агентом, переписывающим целые репозитории

Cursor выпустил версию 2.0 с агентным режимом: ИИ может самостоятельно рефакторить всю кодовую базу, запускать тесты и чинить найденные ошибки без участия разработчика.

26.7K 2.3K 4 мин