Игорь Градов

3 июля 2026 г. в 07:30 МСК7 мин

ИИ-агенты это 712 строк без фреймворков: как один файл заменил LangChain

Anthropic выпустила Claude 4.5 Haiku и Claude 4.6 Sonnet, и один разработчик собрал на них рабочего ИИ-агента для студии дизайна интерьера за несколько дней, уложив всю логику в один файл на 712 строк без единого фреймворка.

Почему это важно

ИИ-агенты это не обязательно сложный стек из пяти библиотек: для задач с узким объёмом ответственности хватает прямого HTTP-запроса к модели и грамотного системного промпта, а экономия времени измеряется неделями.

Практик без глубокого бэкграунда в разработке запустил в продакшн двух ИИ-агентов для небольшой дизайн-студии в Москве. Первый отвечает клиентам ночью в чате на сайте, второй генерирует три концепции интерьера по короткому брифу. Весь проект обошёлся без LangChain, без векторных баз данных, без RAG-фреймворков (RAG, метод, при котором модель сначала ищет релевантные данные в базе, а потом формирует ответ). Разбор основан на публикации автора, который описал каждую развилку и каждые грабли.

Что понадобится?

Аккаунт Anthropic с доступом к API моделей Claude (в проекте использованы Claude Haiku 4.5 для чата и Claude Sonnet 4.6 для генерации концепций)
Python 3 и библиотека httpx для HTTP-запросов к API
FastAPI для создания серверных эндпоинтов (адресов, по которым фронтенд обращается к вашему коду)
Аккаунт Pexels API для бесплатного подбора фотографий интерьеров
Хостинг: Railway для бэкенда, любой VPS для статичного фронтенда
Время: несколько рабочих дней, если вы не профессиональный разработчик

Когда LangChain действительно не нужен?

Автор начинал с типичного представления: ИИ-агенты это обязательно LangChain для оркестрации (управления цепочками вызовов), векторная база для контекста и агент-роутер с инструментами. Так пишут в большинстве руководств.

Но перед тем как тащить фреймворк в проект, он расписал, что именно решает его задачу. Результат оказался отрезвляющим:

Оркестрация цепочек? В проекте одна цепочка: сообщение пользователя, один запрос к модели, ответ. LangChain тут обёртка вокруг обычного POST-запроса
RAG для тарифов и услуг? Весь контент студии уместился в 2 500 токенов (токен, единица текста, примерно три четверти слова) системного промпта (системный промпт, скрытая инструкция модели, которую задаёт разработчик). Тарифы обновляются раз в квартал
Векторная база? Услуг семь штук, сессии по 5 до 10 сообщений, у дизайнера 30 проектов в год. Векторный поиск по такому объёму избыточен
Агент-роутер с инструментами? Чат не ходит ни в календарь, ни в CRM. Единственный внешний вызов, поиск фото в Pexels, жёстко привязан к структуре ответа

LangChain добавил бы зависимость примерно на 500 МБ, собственный слой абстракций с отдельными багами и версионную нестабильность. Взамен, замену одной строки httpx.post() на chain.invoke().

Автор формулирует границу так: LangChain окупается при трёх и более параллельных цепочках, реальном роутинге между моделями, сложном агенте с несколькими инструментами. Одна цепочка «вопрос, ответ», берите прямой HTTP.

Пошаговая инструкция

Определите границы задачи. Запишите, что именно агент должен делать, и ничего сверх. В этом проекте две функции: чат для ответов ночью и генератор концепций по брифу
Проверьте, помещается ли контент в системный промпт. Соберите все тарифы, услуги, правила ответов. Если объём до 5 000 до 6 000 токенов, RAG не нужен. В проекте полный промпт с эталонами ответов занял около 5 500 токенов
Напишите системный промпт как строгий FAQ-документ, а не творческий текст. Структура: роль, список услуг, тарифы, правила маршрутизации (когда давать контакт, когда объяснять тариф, когда предлагать бриф)

Ты — ассистент студии дизайна интерьера.
Отвечай вежливо, по делу, в спокойном профессиональном тоне.
Без лишних эмодзи. Только на русском.

О СТУДИИ:

- Дизайн интерьера жилых пространств в Москве

УСЛУГИ:

1. Функциональное планирование
2. Дизайн-проект
3. Рабочая документация

ПРАВИЛА:

- Вопрос о записи → дать контакт студии
- Вопрос о цене → объяснить тариф без точных цифр,
  пока клиент не уточнил параметры объекта

Создайте FastAPI-приложение с эндпоинтами. В проекте четыре эндпоинта: чат, приём брифа, генерация концепций, поиск фото. Всё в одном файле main.py
Разделите модели по задачам. Для быстрых ответов в чате, лёгкая и дешёвая модель (Claude Haiku 4.5). Для генерации развёрнутых концепций, более мощная (Claude Sonnet 4.6)
Подключите Pexels API для иллюстраций. Эндпоинт /brief после генерации концепции вызывает Pexels и прикрепляет по четыре фотографии к каждой из трёх концепций
Разверните бэкенд на Railway, фронтенд на VPS. Статичный фронт отправляет запросы к FastAPI-серверу

Как это выглядит на практике

Клиент заходит на сайт студии в 23:00, пишет в чат: «Сколько стоит дизайн-проект двушки 60 метров?» Агент на Claude Haiku 4.5 мгновенно отвечает, объясняет тарифы и предлагает заполнить бриф. Клиент заполняет короткую форму: площадь, стиль, бюджет. Эндпоинт /brief на Claude Sonnet 4.6 генерирует три концепции, каждая с палитрой, материалами, мебелью, освещением и четырьмя фотографиями из Pexels. Утром дизайнер открывает результат и видит, к какому направлению клиент уже склоняется.

Что с этого вам прямо сейчас?

Авторам Дзена и копирайтерам. Если вы пишете про ИИ-инструменты или ведёте экспертный блог, этот подход демонстрирует ценную тему для контента: не «какой фреймворк модный», а «когда фреймворк вообще не нужен». Разборы развилок с конкретными цифрами (712 строк, 2 500 токенов, 7 услуг) собирают больше доверия, чем обзоры абстрактных возможностей.

Маркетологам и владельцам малого бизнеса. Чат-агент, который отвечает ночью, решает конкретную проблему: клиент не уходит к конкурентам, пока вы спите. Для студий, клиник, сервисных компаний с одним-двумя специалистами это рабочая модель. При этом Claude API доступен из РФ через VPN или через посредника, а из доступных в РФ аналогов стоит посмотреть на YandexGPT и GigaChat, у обоих есть API с системным промптом.

Предпринимателям в РФ и СНГ. Проект уложился в несколько рабочих дней силами одного человека без глубокого опыта разработки. Если ваш бизнес-контент (услуги, тарифы, FAQ) помещается в несколько тысяч токенов, вы можете повторить этот подход без найма команды.

Частые ошибки

Тащить фреймворк «потому что так делают взрослые». Автор прямо пишет: страх делать «не как у людей» чуть не привёл его к решению, которое добавило бы 500 МБ зависимостей без реальной пользы. Сначала распишите, какие абстракции вам нужны, потом берите инструмент.

Класть в RAG то, что помещается в промпт. Если у вас 7 услуг и 3 тарифа, векторная база, это не инженерная зрелость, а лишний слой отказов. RAG начинает окупаться, когда контент регулярно обновляется, его много и он неоднородный.

Давать агенту широкие полномочия. В этом проекте чат не ходит ни в CRM, ни в календарь. Каждый внешний вызов, это потенциальная точка отказа и дыра в безопасности. Сужайте scope до минимально необходимого.

Путать «ИИ-агент» с «универсальным ботом». ИИ-агенты это программы, которые выполняют задачу автономно, но автономность не значит «делает всё подряд». Две узкие функции с понятной границей ответственности работают надёжнее одного «умного помощника на все случаи».

Мнение редакции dzen.guru

Этот кейс ценен не кодом, а методом принятия решений. Автор честно признаётся: он не профессиональный разработчик, лез в документацию по каждому слою. И именно поэтому его разбор полезнее типичного гайда «от эксперта», он показывает реальные развилки, а не идеальный путь.

По моим наблюдениям, большинство проектов с LangChain, которые я видел у авторов Дзена, используют от силы 5 до 10 процентов его возможностей. Остальное, мёртвый груз, который усложняет отладку и обновление. Для задач уровня «один системный промпт плюс один внешний API» прямой HTTP-запрос проще, прозрачнее и быстрее в поддержке.

Честная оговорка: подход работает, пока контент помещается в контекстное окно модели и не обновляется ежедневно. Как только у бизнеса появляется каталог на тысячи позиций, меняющийся каждый день, или агенту нужно принимать решения из нескольких источников, фреймворк и RAG становятся оправданными. Граница, три и более параллельные цепочки, реальный роутинг, сложный мультишаговый агент.

Научитесь строить контент-стратегию с ИИ

В dzen.guru мы разбираем, как авторы и предприниматели применяют нейросети без лишних абстракций. Практика, не теория.

Попробовать dzen.guru

Прямой HTTP-запрос к Claude вместо фреймворка на 500 МБ, это не лайфхак и не бунт против индустрии. Это результат честного вопроса: «Какую именно проблему решает каждый слой в моём стеке?» Если ответ «никакую», слой лишний, сколько бы звёзд ни было у его репозитория на GitHub.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Большие языковые модели мыслят одинаково: как получить от ИИ неповторяющиеся идеи

Большие языковые модели (LLM, нейросети, которые генерируют текст) выдают на удивление одинаковые ответы на открытые вопросы, и австралийский стартап…

3 июля в 09:30 МСК6 мин

Gemini Spark вышел на Mac: ИИ-агент Google получил доступ к локальным файлам

Google второго июля выпустила настольное приложение Gemini Spark для macOS, и теперь ИИ-агент (программа, которая сама выполняет цепочку действий на…

3 июля в 08:30 МСК4 мин

Создатель TCP/IP уходит из Google: его прогноз об ИИ-агентах повторяет историю интернета

Винтон Серф, один из создателей интернета, на прошлой неделе объявил об уходе с поста главного интернет-евангелиста Google после 20 лет в компании и напоследок…

3 июля в 08:15 МСК5 мин