ИИ-агенты это 712 строк без фреймворков: как один файл заменил LangChain
Anthropic выпустила Claude 4.5 Haiku и Claude 4.6 Sonnet, и один разработчик собрал на них рабочего ИИ-агента для студии дизайна интерьера за несколько дней, уложив всю логику в один файл на 712 строк без единого фреймворка.

ИИ-агенты это не обязательно сложный стек из пяти библиотек: для задач с узким объёмом ответственности хватает прямого HTTP-запроса к модели и грамотного системного промпта, а экономия времени измеряется неделями.
Практик без глубокого бэкграунда в разработке запустил в продакшн двух ИИ-агентов для небольшой дизайн-студии в Москве. Первый отвечает клиентам ночью в чате на сайте, второй генерирует три концепции интерьера по короткому брифу. Весь проект обошёлся без LangChain, без векторных баз данных, без RAG-фреймворков (RAG, метод, при котором модель сначала ищет релевантные данные в базе, а потом формирует ответ). Разбор основан на публикации автора, который описал каждую развилку и каждые грабли.
Что понадобится?
- Аккаунт Anthropic с доступом к API моделей Claude (в проекте использованы Claude Haiku 4.5 для чата и Claude Sonnet 4.6 для генерации концепций)
- Python 3 и библиотека
httpxдля HTTP-запросов к API - FastAPI для создания серверных эндпоинтов (адресов, по которым фронтенд обращается к вашему коду)
- Аккаунт Pexels API для бесплатного подбора фотографий интерьеров
- Хостинг: Railway для бэкенда, любой VPS для статичного фронтенда
- Время: несколько рабочих дней, если вы не профессиональный разработчик
Когда LangChain действительно не нужен?
Автор начинал с типичного представления: ИИ-агенты это обязательно LangChain для оркестрации (управления цепочками вызовов), векторная база для контекста и агент-роутер с инструментами. Так пишут в большинстве руководств.
Но перед тем как тащить фреймворк в проект, он расписал, что именно решает его задачу. Результат оказался отрезвляющим:
- Оркестрация цепочек? В проекте одна цепочка: сообщение пользователя, один запрос к модели, ответ. LangChain тут обёртка вокруг обычного POST-запроса
- RAG для тарифов и услуг? Весь контент студии уместился в 2 500 токенов (токен, единица текста, примерно три четверти слова) системного промпта (системный промпт, скрытая инструкция модели, которую задаёт разработчик). Тарифы обновляются раз в квартал
- Векторная база? Услуг семь штук, сессии по 5 до 10 сообщений, у дизайнера 30 проектов в год. Векторный поиск по такому объёму избыточен
- Агент-роутер с инструментами? Чат не ходит ни в календарь, ни в CRM. Единственный внешний вызов, поиск фото в Pexels, жёстко привязан к структуре ответа
LangChain добавил бы зависимость примерно на 500 МБ, собственный слой абстракций с отдельными багами и версионную нестабильность. Взамен, замену одной строки httpx.post() на chain.invoke().
Автор формулирует границу так: LangChain окупается при трёх и более параллельных цепочках, реальном роутинге между моделями, сложном агенте с несколькими инструментами. Одна цепочка «вопрос, ответ», берите прямой HTTP.
Пошаговая инструкция
-
Определите границы задачи. Запишите, что именно агент должен делать, и ничего сверх. В этом проекте две функции: чат для ответов ночью и генератор концепций по брифу
-
Проверьте, помещается ли контент в системный промпт. Соберите все тарифы, услуги, правила ответов. Если объём до 5 000 до 6 000 токенов, RAG не нужен. В проекте полный промпт с эталонами ответов занял около 5 500 токенов
-
Напишите системный промпт как строгий FAQ-документ, а не творческий текст. Структура: роль, список услуг, тарифы, правила маршрутизации (когда давать контакт, когда объяснять тариф, когда предлагать бриф)
Ты — ассистент студии дизайна интерьера.
Отвечай вежливо, по делу, в спокойном профессиональном тоне.
Без лишних эмодзи. Только на русском.
О СТУДИИ:
- Дизайн интерьера жилых пространств в Москве
УСЛУГИ:
1. Функциональное планирование
2. Дизайн-проект
3. Рабочая документация
ПРАВИЛА:
- Вопрос о записи → дать контакт студии
- Вопрос о цене → объяснить тариф без точных цифр,
пока клиент не уточнил параметры объекта
-
Создайте FastAPI-приложение с эндпоинтами. В проекте четыре эндпоинта: чат, приём брифа, генерация концепций, поиск фото. Всё в одном файле
main.py -
Разделите модели по задачам. Для быстрых ответов в чате, лёгкая и дешёвая модель (Claude Haiku 4.5). Для генерации развёрнутых концепций, более мощная (Claude Sonnet 4.6)
-
Подключите Pexels API для иллюстраций. Эндпоинт
/briefпосле генерации концепции вызывает Pexels и прикрепляет по четыре фотографии к каждой из трёх концепций -
Разверните бэкенд на Railway, фронтенд на VPS. Статичный фронт отправляет запросы к FastAPI-серверу
Клиент заходит на сайт студии в 23:00, пишет в чат: «Сколько стоит дизайн-проект двушки 60 метров?» Агент на Claude Haiku 4.5 мгновенно отвечает, объясняет тарифы и предлагает заполнить бриф. Клиент заполняет короткую форму: площадь, стиль, бюджет. Эндпоинт /brief на Claude Sonnet 4.6 генерирует три концепции, каждая с палитрой, материалами, мебелью, освещением и четырьмя фотографиями из Pexels. Утром дизайнер открывает результат и видит, к какому направлению клиент уже склоняется.
Что с этого вам прямо сейчас?
Авторам Дзена и копирайтерам. Если вы пишете про ИИ-инструменты или ведёте экспертный блог, этот подход демонстрирует ценную тему для контента: не «какой фреймворк модный», а «когда фреймворк вообще не нужен». Разборы развилок с конкретными цифрами (712 строк, 2 500 токенов, 7 услуг) собирают больше доверия, чем обзоры абстрактных возможностей.
Маркетологам и владельцам малого бизнеса. Чат-агент, который отвечает ночью, решает конкретную проблему: клиент не уходит к конкурентам, пока вы спите. Для студий, клиник, сервисных компаний с одним-двумя специалистами это рабочая модель. При этом Claude API доступен из РФ через VPN или через посредника, а из доступных в РФ аналогов стоит посмотреть на YandexGPT и GigaChat, у обоих есть API с системным промптом.
Предпринимателям в РФ и СНГ. Проект уложился в несколько рабочих дней силами одного человека без глубокого опыта разработки. Если ваш бизнес-контент (услуги, тарифы, FAQ) помещается в несколько тысяч токенов, вы можете повторить этот подход без найма команды.
Тащить фреймворк «потому что так делают взрослые». Автор прямо пишет: страх делать «не как у людей» чуть не привёл его к решению, которое добавило бы 500 МБ зависимостей без реальной пользы. Сначала распишите, какие абстракции вам нужны, потом берите инструмент.
Класть в RAG то, что помещается в промпт. Если у вас 7 услуг и 3 тарифа, векторная база, это не инженерная зрелость, а лишний слой отказов. RAG начинает окупаться, когда контент регулярно обновляется, его много и он неоднородный.
Давать агенту широкие полномочия. В этом проекте чат не ходит ни в CRM, ни в календарь. Каждый внешний вызов, это потенциальная точка отказа и дыра в безопасности. Сужайте scope до минимально необходимого.
Путать «ИИ-агент» с «универсальным ботом». ИИ-агенты это программы, которые выполняют задачу автономно, но автономность не значит «делает всё подряд». Две узкие функции с понятной границей ответственности работают надёжнее одного «умного помощника на все случаи».
Этот кейс ценен не кодом, а методом принятия решений. Автор честно признаётся: он не профессиональный разработчик, лез в документацию по каждому слою. И именно поэтому его разбор полезнее типичного гайда «от эксперта», он показывает реальные развилки, а не идеальный путь.
По моим наблюдениям, большинство проектов с LangChain, которые я видел у авторов Дзена, используют от силы 5 до 10 процентов его возможностей. Остальное, мёртвый груз, который усложняет отладку и обновление. Для задач уровня «один системный промпт плюс один внешний API» прямой HTTP-запрос проще, прозрачнее и быстрее в поддержке.
Честная оговорка: подход работает, пока контент помещается в контекстное окно модели и не обновляется ежедневно. Как только у бизнеса появляется каталог на тысячи позиций, меняющийся каждый день, или агенту нужно принимать решения из нескольких источников, фреймворк и RAG становятся оправданными. Граница, три и более параллельные цепочки, реальный роутинг, сложный мультишаговый агент.
Научитесь строить контент-стратегию с ИИ
В dzen.guru мы разбираем, как авторы и предприниматели применяют нейросети без лишних абстракций. Практика, не теория.
Попробовать dzen.guruПрямой HTTP-запрос к Claude вместо фреймворка на 500 МБ, это не лайфхак и не бунт против индустрии. Это результат честного вопроса: «Какую именно проблему решает каждый слой в моём стеке?» Если ответ «никакую», слой лишний, сколько бы звёзд ни было у его репозитория на GitHub.

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также
Большие языковые модели мыслят одинаково: как получить от ИИ неповторяющиеся идеи
Большие языковые модели (LLM, нейросети, которые генерируют текст) выдают на удивление одинаковые ответы на открытые вопросы, и австралийский стартап…
Gemini Spark вышел на Mac: ИИ-агент Google получил доступ к локальным файлам
Google второго июля выпустила настольное приложение Gemini Spark для macOS, и теперь ИИ-агент (программа, которая сама выполняет цепочку действий на…

Создатель TCP/IP уходит из Google: его прогноз об ИИ-агентах повторяет историю интернета
Винтон Серф, один из создателей интернета, на прошлой неделе объявил об уходе с поста главного интернет-евангелиста Google после 20 лет в компании и напоследок…
Комментарии