·
USD EUR
RAG мёртв, да здравствует долгий контекст? Исследование Google сравнивает подходы
🔬 Исследования

RAG мёртв, да здравствует долгий контекст? Исследование Google сравнивает подходы

Google опубликовала масштабное исследование: при контекстном окне 1M+ токенов RAG уступает прямой передаче документов по точности, но выигрывает по стоимости. Когда использовать что?

С появлением моделей с контекстным окном в миллион токенов и больше в AI-сообществе разгорелась дискуссия: нужен ли ещё RAG (Retrieval-Augmented Generation), или лучше просто «скормить» модели всю базу знаний целиком?

Что исследовали

Команда Google DeepMind сравнила три подхода на 12 корпоративных датасетах объёмом от 100 до 10 000 документов:

  1. RAG: векторный поиск + передача топ-K фрагментов
  2. Long Context (LC): все документы в контексте сразу (модель Gemini 1.5 Pro, 1M токенов)
  3. Гибрид: RAG для первичного отбора + LC для финального ответа

Результаты

МетрикаRAGLong ContextГибрид
Точность ответов71%84%89%
Стоимость на запрос$0.003$0.12$0.04
Латентность1.2с8.4с3.1с

Вывод: зависит от задачи

RAG остаётся оптимальным для высокочастотных запросов с ограниченным бюджетом. Long Context выигрывает при редких, критически важных запросах и небольших корпусах. Гибрид — лучший выбор для enterprise-приложений с умеренной нагрузкой.

Исследователи также отметили, что с падением цен на токены преимущество RAG по стоимости будет сокращаться, и к 2027 году Long Context может стать предпочтительным для большинства задач.

Комментарии (63)

Войдите, чтобы оставить комментарий

Комментариев пока нет. Будьте первым!

Другие новости

Все новости
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
🧠 Большие модели
GPT-5 официально запущен: OpenAI называет его «системой с AGI-уровнем рассуждений»
OpenAI выпустила GPT-5 — модель, которая, по заявлению компании, впервые демонстрирует способности, сопоставимые с экспертом-человеком в области математики, кодирования и научных рассуждений.
10 ч назад
48.3K 2.1K 1 мин
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
🧠 Большие модели
Claude 4 от Anthropic: первый взгляд на модель с «конституциональным обучением 3.0»
Anthropic раскрыла детали Claude 4: новая модель использует методику «конституционального обучения третьего поколения» и стала первой, прошедшей независимый аудит безопасности уровня ASL-4.
1 дн назад
22.1K 980 1 мин
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
🎨 Генерация изображений
Sora 2.0: OpenAI выпускает видеогенератор с физической симуляцией реального мира
Обновлённая Sora 2.0 генерирует видео до 4K 60fps длительностью до 10 минут с корректным поведением физических объектов, водных поверхностей и источников света.
1 дн назад
31.5K 1.8K 1 мин
NVIDIA Blackwell Ultra GB300: 20 петафлопс в одном чипе для нового поколения AI-суперкомпьютеров
🤖 Роботы и железо
NVIDIA Blackwell Ultra GB300: 20 петафлопс в одном чипе для нового поколения AI-суперкомпьютеров
NVIDIA официально объявила о новом флагмане — GB300, превосходящем предыдущее поколение по производительности инференса в 4 раза при том же энергопотреблении.
2 дн назад
18.7K 720 1 мин
ЕС AI Act вступает в силу: что теперь нельзя делать с искусственным интеллектом в Европе
⚖️ Регуляция и право
ЕС AI Act вступает в силу: что теперь нельзя делать с искусственным интеллектом в Европе
С 1 мая 2026 года вступила в силу финальная часть европейского регулирования ИИ. Разбираем, какие системы теперь запрещены, кому придётся проходить аудит и какие штрафы грозят нарушителям.
3 дн назад
19.3K 445 1 мин
Microsoft Copilot получает «агентный режим»: AI сам открывает программы, пишет код и отправляет письма
🛠️ Инструменты
Microsoft Copilot получает «агентный режим»: AI сам открывает программы, пишет код и отправляет письма
Microsoft развернула обновление Copilot с автономным агентным режимом для корпоративных клиентов Microsoft 365. Теперь AI выполняет многошаговые задачи без участия пользователя.
4 дн назад
16.4K 580 1 мин