RAG

RAG (Retrieval-Augmented Generation, генерация с дополненным поиском) — это архитектурный паттерн, который позволяет языковой модели (LLM) отвечать на вопросы, используя ваши данные. Модель не дообучается — она получает релевантные документы прямо в контексте запроса.

Проблема LLM: они знают то, на чём обучены, и на определённую дату. Они не знают ваших внутренних регламентов, прайс-листов, контрактов. Можно дообучить модель — но это дорого и долго. RAG решает проблему проще: при запросе пользователя система сначала ищет релевантные документы в вашей базе, затем передаёт их модели вместе с вопросом.

Как это работает: ваши документы разбиваются на куски (chunks), для каждого вычисляется векторное представление (embedding) и сохраняется в векторную базу данных. При запросе пользователя система находит наиболее похожие куски, добавляет их в промпт LLM, и модель генерирует ответ на основе этих данных.

RAG — это основа для корпоративных чат-ботов, помощников по документации, систем поиска по базе знаний. Он снижает галлюцинации модели, потому что ответ опирается на конкретные документы, а не на общие знания.

Ключевые преимущества

LLM отвечает на основе ваших документов, а не общих знаний
Не требует дообучения модели — работает из коробки
Векторный поиск находит релевантные куски документов
Снижает галлюцинации и повышает точность ответов
Основа для корпоративных AI-помощников

Примеры

HR-бот: сотрудники спрашивают про отпуска, ДМС, KPI — бот ищет ответы во внутренних регламентах. Техподдержка: бот ищет решения в базе знаний по описанию проблемы. Юридический помощник: находит релевантные статьи законов и прецеденты. Внутренняя документация: разработчики спрашивают про API проекта на естественном языке.

Когда это нужно

RAG нужен, когда: хотите создать AI-помощника по вашей базе знаний, нужен чат-бот для техподдержки с поиском по документации, хотите сделать внутренний поиск по документам умнее, LLM галлюцинирует — нужно привязать к реальным данным.

Связанные термины

LLM Machine Learning NLP

Частые вопросы

RAG или дообучение (fine-tuning) — что выбрать?

RAG — для работы с конкретными данными (документы, база знаний). Fine-tuning — для изменения стиля или поведения модели. RAG дешевле, быстрее внедряется и данные обновляются мгновенно. Fine-tuning нужен, когда требуется изменить формат ответов или адаптировать модель к специфичной задаче. Часто используют оба подхода.

Какие данные подходят для RAG?

Любые текстовые: PDF, Word, HTML, Markdown, Confluence, Notion, электронная почта. Также таблицы и структурированные данные. Главное — данные должны быть актуальными и без противоречий. Мусор на входе = мусор на выходе, даже с самой умной моделью.

Сколько стоит внедрение RAG?

Простой RAG-бот по базе знаний: от 300 000 руб. Корпоративный AI-помощник с интеграциями: от 800 000 руб. Стоимость зависит от объёма данных, количества источников и требований к качеству ответов.

RAG

Ключевые преимущества

Примеры

Когда это нужно

Связанные термины

Частые вопросы

Читайте также

Внедрение ИИ

ИИ-агенты

NLP (обработка естественного языка)

Machine Learning

LLM

Готовы начать проект?