Игорь Градов
Игорь Градов
6 мин
ai

LlamaIndex показала агентный поиск: 4 инструмента вместо одноразового RAG-запроса

LlamaIndex опубликовала на GitHub приложение «legal-kb», готовый пример агентного поиска по юридическим документам, и впервые показала, как четыре инструмента файловой системы заменяют одноразовый RAG-запрос (retrieval-augmented generation, генерация ответа с опорой на найденные документы).

LlamaIndex показала агентный поиск: 4 инструмента вместо одноразового RAG-запроса
Почему это важно

Обычный RAG отправляет один поисковый запрос и работает с тем, что нашёл. Агентный подход даёт модели набор инструментов, она сама решает, в каком порядке искать, открывать файлы и перепроверять цитаты, а значит, точность ответа на сложный вопрос по документам растёт без ручной настройки пайплайна.

Команда LlamaIndex назвала этот паттерн Retrieval Harness, «обвязка для поиска». Суть в том, что ИИ-агент (программа, которая сама планирует шаги и вызывает нужные функции) получает не один вызов поиска, а четыре инструмента, похожих на команды файловой системы. Он может листать файлы, читать конкретный документ, искать по ключевым словам и запускать гибридный семантический поиск. Ниже разбираем, как это устроено и как повторить на своих данных.

Что понадобится

  • Аккаунт на LlamaCloud (платформа LlamaIndex для индексации документов)
  • Ключ API от OpenAI или Anthropic (модель выбирается при каждом запросе)
  • PostgreSQL и Prisma (ORM, прослойка между кодом и базой данных) для хранения метаданных файлов и версий
  • Node.js и TanStack Start (фреймворк для веб-приложений на React)
  • Репозиторий «legal-kb» с GitHub
  • Примерно 30 минут на развёртывание, если PostgreSQL уже настроен

Как запустить агентный поиск по документам за шесть шагов

  1. Клонируйте репозиторий и установите зависимости.
git clone https://github.com/llamaindex/legal-kb.git
cd legal-kb
npm install
  1. Настройте переменные окружения. Укажите ключ LlamaCloud API, строку подключения к PostgreSQL и ключ OpenAI или Anthropic. Пример файла .env:
LLAMA_CLOUD_API_KEY=your_key
DATABASE_URL=postgresql://user:pass@localhost:5432/legalkb
OPENAI_API_KEY=your_openai_key
  1. Инициализируйте базу данных. Prisma создаст таблицы для файлов и проектов:
npx prisma db push
  1. Запустите приложение и создайте проект. В интерфейсе вы авторизуетесь, создаёте проект и загружаете документы. Каждый проект зеркалируется как управляемый индекс LlamaCloud Index v2. Файлы парсятся и индексируются автоматически в фоне, интерфейс опрашивает статус, пока индекс не будет готов.

  2. Откройте чат с агентом. Агент получает четыре инструмента, каждый из которых вызывает API индекса:

  3. findFiles находит документы по имени или метаданным

  4. retrieve запускает гибридный поиск (семантический плюс ключевые слова) с возможностью реранкинга (повторного ранжирования результатов по релевантности)
  5. readFile открывает конкретный файл целиком
  6. grepFile ищет точное совпадение текста внутри документа, аналог команды grep в терминале

Системный промпт (инструкция для модели) задаёт порядок: агент обязан сначала вызвать findFiles, чтобы понять, какие документы есть. Затем сузить поиск через retrieve. И только потом подтвердить точную формулировку через readFile или grepFile, прежде чем цитировать.

  1. Проверьте версионирование. Повторная загрузка файла с тем же именем в тот же проект создаёт версии v1, v2, v3. Слой поиска фильтрует по полю version в метаданных, поэтому агент может сравнивать разные редакции одного договора.

Как устроены цитаты?

Каждый найденный фрагмент получает короткий идентификатор, например cite:c7f2qa. Агент ссылается на него в ответе, а интерфейс показывает кликабельный чип. При нажатии открывается скриншот страницы документа с рамкой вокруг процитированного текста. Это решает главную проблему RAG: пользователь видит, откуда взята информация, и может проверить контекст.

Чем агентный поиск отличается от обычного RAG?

Стандартный RAG (llamaindex rag пример реализации которого есть в документации LlamaIndex) работает так: один запрос, один поиск по эмбеддингам (числовым представлениям текста), один ответ. Если нужная информация разбросана по нескольким файлам или требуется перепроверка формулировки, одного прохода не хватает.

Агентная обвязка работает иначе. Модель сама решает, сколько вызовов сделать, в каком порядке и какие фильтры применить. Агент использует ToolLoopAgent из Vercel AI SDK 6, который поддерживает потоковую передачу рассуждений: модели Claude используют расширенное мышление, модели OpenAI с рассуждениями работают на среднем уровне усилий.

Что делать с этим прямо сейчас?

Авторам Дзена и копирайтерам. Если вы работаете с большими базами справочных материалов, шаблон «legal-kb» можно адаптировать под базу знаний редакции. Загрузите редполитику, гайды, старые тексты. Агент будет искать по ним и цитировать конкретные пункты вместо того, чтобы галлюцинировать (уверенно выдумывать то, чего не было).

Маркетологам. Версионирование через пару «проект плюс имя файла» позволяет отслеживать изменения в договорах, офертах и политиках. Загрузили обновлённую оферту, агент покажет разницу между v1 и v2 по конкретному пункту.

Предпринимателям в РФ и СНГ. LlamaCloud доступен из России, но требует оплаты в валюте. Ключи OpenAI или Anthropic тоже понадобятся с зарубежной карты или через посредника. Из локальных альтернатив для индексации документов можно рассмотреть связку YandexGPT с собственным векторным хранилищем, но готового аналога агентной обвязки с четырьмя инструментами на российском рынке пока нет.

Пример: вопрос по договору

Вы загрузили в проект пять NDA (соглашений о неразглашении) и спрашиваете: «Какой срок уведомления для расторжения MSA?» Агент вызывает findFiles, находит все загруженные договоры. Затем retrieve ищет по запросу «notice period termination». Получив кандидатов, вызывает grepFile на конкретном файле, чтобы найти точную формулировку пункта. Ответ приходит с цитатой cite:c7f2qa, при клике открывается страница договора с выделенным абзацем.

Частые ошибки

Не пропускайте порядок вызова инструментов. Если убрать из системного промпта требование начинать с findFiles, агент будет сразу запускать retrieve и может пропустить релевантные документы, которых не знал.

Не загружайте сотни файлов без структуры. Индексация идёт в фоне, и при большом объёме статус «ready» может не наступить быстро. Группируйте документы по проектам.

Версионирование работает только в пределах одного проекта и одного имени файла. Если переименовали файл, это новый документ, а не новая версия.

PostgreSQL и Prisma обязательны. Без базы данных метаданные файлов и версий не сохраняются, и агент теряет контекст между сессиями.

Мнение редакции dzen.guru

Я протестировал паттерн на нескольких PDF. Главная ценность не в самом приложении, а в архитектурном решении: четыре инструмента, которые агент комбинирует сам. Это воспроизводимый шаблон. Вы можете взять те же четыре функции, подключить к своему индексу и к любой модели через Vercel AI SDK. Код открытый, ничего не мешает заменить LlamaCloud на локальное векторное хранилище, но тогда парсинг и индексацию придётся писать самим. Честная оговорка: для продакшена с конфиденциальными документами проверьте, куда уходят данные при загрузке в LlamaCloud. В документации LlamaIndex указано, что файлы обрабатываются на их серверах.

Попробуйте генерацию контента с ИИ на dzen.guru

Если вы ищете способ ускорить работу с текстами и документами, протестируйте наши инструменты для авторов Дзена.

Попробовать бесплатно

Шаблон «legal-kb» показывает конкретный путь от одноразового RAG-запроса к полноценному агенту, который сам ориентируется в базе знаний. Код открыт, стек знакомый, а паттерн с четырьмя инструментами файловой системы можно перенести на любую предметную область, от юридических документов до редакционных баз.

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

ai

Кибербезопасность и искусственный интеллект: урок цифры из трёх реальных сбоев с Claude

Материал представляет собой личный блог-пост (на русском языке) с тремя историями о сбоях при делегировании задач ИИ-ассистенту Claude. Автор описывает…

6 мин
Что такое галлюцинации нейросетей в науке: инструмент ловит фальшивые ссылки в PDF
ai

Что такое галлюцинации нейросетей в науке: инструмент ловит фальшивые ссылки в PDF

Нейросеть, которая проверяет научные ссылки, теперь работает с кириллицей, OCR и кривыми PDF, и вот как ей пользоваться. Почему это важно Галлюцинации…

5 мин
Экс-глава Qwen объяснил, что такое ИИ-агент и почему он вытесняет «думающие» модели
ai

Экс-глава Qwen объяснил, что такое ИИ-агент и почему он вытесняет «думающие» модели

Компания Alibaba развивала семейство моделей Qwen как универсального помощника, но бывший технический руководитель проекта Junyang Lin, ушедший в независимые…

6 мин