IBM открыла CUGA: что такое ИИ-агент, который собирается в одном файле
Почему это важно IBM выложила в открытый доступ «обвязку» для сборки ИИ-агентов, которая берёт на себя планирование, управление состоянием и контроль ошибок, а…

IBM выложила в открытый доступ «обвязку» для сборки ИИ-агентов, которая берёт на себя планирование, управление состоянием и контроль ошибок, а разработчику оставляет только список инструментов и промпт.
IBM опубликовала CUGA (Configurable Generalist Agent), открытую библиотеку для Python, которая позволяет собрать работающего ИИ-агента в одном файле, и выложила два десятка готовых примеров, чтобы доказать, что это реально.
Что такое ИИ-агент в данном случае? Это программа, которая сама планирует цепочку действий, вызывает нужные инструменты, отслеживает промежуточные результаты и корректирует план, если что-то пошло не так. Обычно на сборку такой «обвязки» уходит неделя, прежде чем агент начнёт делать хоть что-то полезное. CUGA снимает эту работу.
| Что | Когда | Кто выпустил | Цена |
|---|---|---|---|
| CUGA (Configurable Generalist Agent), библиотека для сборки ИИ-агентов с открытым кодом и набор из 24 готовых приложений | Дата точного релиза в источнике не указана | IBM | Бесплатно, открытый код (pip install cuga) |
Что берёт на себя CUGA?
Источник описывает библиотеку как «harness» (обвязку, каркас), а не фреймворк. Разница принципиальная: вы не учите новую архитектуру, а конфигурируете готовую.
- Планирование и самокоррекция. Агент сначала составляет план, потом выполняет шаги. Если на каком-то шаге результат неверный, встроенный механизм рефлексии (reflection step) ловит ошибку и перестраивает план, а не продолжает вслепую.
- Управление состоянием на длинных задачах. На задаче из 20 шагов обычные агенты теряют промежуточные результаты и начинают их «додумывать». CUGA хранит переменные между шагами.
- Сменные инструменты без переписывания кода. OpenAPI, MCP (Model Context Protocol, стандарт подключения внешних сервисов к модели) и функции LangChain подключаются одинаково.
- Три режима баланса «цена и скорость». Fast, Balanced и Accurate переключаются через конфигурацию, а не через код.
- Смена модели одной переменной окружения. OpenAI, Anthropic, watsonx, Ollama и другие провайдеры подключаются через одну настройку. Готовые демо-приложения работают на модели gpt-oss-120b, а не на самой дорогой «фронтирной» модели.
- Делегирование между агентами через протокол A2A и встроенный RAG (поиск по документам) на базе Docling.
По данным IBM, CUGA занимала первое место в бенчмарках AppWorld (с июля 2025 по февраль 2026) и WebArena (с февраля по сентябрь 2025). Именно механика планирования и рефлексии, а не размер модели, по утверждению разработчиков, позволяет меньшей модели с открытыми весами (open weights, когда параметры модели доступны для скачивания) показывать результат, для которого обычно нужна более крупная закрытая модель.
Как выглядит код на практике?
Каждое из 24 демо-приложений укладывается в один файл на FastAPI (популярный Python-фреймворк для веб-приложений). Пример с «советником по архитектуре IBM Cloud» занимает четыре аргумента:
- Модель, через фабрику, которая не привязана к конкретному провайдеру.
- Список инструментов: часть подключается из MCP-серверов (например, веб-поиск одной строкой
load_tools(["web"])), часть пишется вручную как обычная Python-функция. - Системный промпт (special_instructions), где описано, что агент должен делать.
- Папка для хранения состояния и политик.
Промпт агента задаёт правила поведения: сначала проверь каталог, потом рекомендуй. Документирование функции (docstring) служит инструкцией для агента, когда именно вызывать этот инструмент. Разработчик пишет одну функцию, которая специфична для его задачи, а всё остальное берёт из готовых MCP-серверов.
Как попробовать?
- Установите библиотеку командой
pip install cuga. - Задайте переменные окружения для выбора провайдера и модели (LLM_PROVIDER и LLM_MODEL).
- Откройте галерею готовых приложений cuga-apps и скопируйте ближайший к вашей задаче пример.
- Замените список инструментов и системный промпт на свои.
Есть ли аналоги в России?
Прямого российского аналога CUGA с открытым кодом источник не называет. Для контекста:
| Параметр | CUGA (IBM) | YandexGPT / GigaChat |
|---|---|---|
| Тип | Открытая библиотека для сборки своих ИИ-агентов | Облачные API для генерации текста, агентные возможности ограничены |
| Открытый код | Да | Нет |
| Агентное планирование и самокоррекция | Встроено | Нужно реализовывать самостоятельно |
| Доступность в РФ | Библиотека ставится локально, модели через Ollama работают без ограничений | Полностью доступны |
Для российского разработчика ключевое преимущество в том, что CUGA ставится локально и работает с Ollama, то есть не требует доступа к зарубежным API, которые могут быть ограничены.
CUGA решает ровно ту проблему, которая останавливает большинство: не «как написать промпт», а «как сделать так, чтобы агент не терял контекст на пятом шаге и не начинал галлюцинировать» (галлюцинация, когда ИИ уверенно выдумывает то, чего не было).
Мне нравится подход «один файл на одно приложение». Для автора Дзена это означает, что можно собрать агента, который, например, проверяет факты в черновике или подбирает источники, без глубоких знаний архитектуры. Для маркетолога и предпринимателя пока рано говорить о готовом продукте, это инструмент для разработчика.
Оговорка: 24 демо-приложения не равны боевому продакшену. IBM упоминает, что тот же код можно запускать «governed in production», но детали этого перехода источник не раскрывает. Попробуйте скопировать одно демо и запустить с локальной моделью через Ollama. Это займёт полчаса и покажет, подходит ли CUGA под вашу задачу.
Частые вопросы
Нужно ли платить за использование CUGA?
Нет. Библиотека распространяется с открытым кодом и устанавливается бесплатно через pip install cuga. Платить нужно только за модель, если вы используете коммерческий API (OpenAI, Anthropic). При работе через Ollama с локальной моделью затраты нулевые.
Обязательно ли знать Python, чтобы собрать агента?
Да. CUGA рассчитана на разработчиков, владеющих Python и знакомых с FastAPI. Для авторов без опыта программирования библиотека в текущем виде не подходит, но готовые демо-приложения можно использовать как отправную точку с минимальными правками.
Чем CUGA отличается от LangChain и других фреймворков?
IBM позиционирует CUGA не как фреймворк, а как «обвязку» (harness): вместо изучения новой архитектуры вы задаёте конфигурацию. Планирование, рефлексия и управление состоянием встроены, а не собираются из компонентов вручную. Инструменты LangChain при этом подключаются к CUGA как один из типов совместимых инструментов.
Для тех, кто давно хотел понять, что такое ИИ-агент на практике, а не в теории, CUGA даёт 24 работающих примера, которые можно разобрать строчка за строчкой, и это, пожалуй, самый наглядный учебник из доступных сегодня.

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

Google встроил тренды YouTube в рекламный кабинет: пропуск рекламы подтолкнул к расширению работы с авторами
YouTube усилил рекламный кабинет четырьмя инструментами на базе Gemini, и теперь тренды, аналитика по авторам и подсказки по креативам доступны прямо внутри…

Пузырь ИИ уже лопнул в вашей работе: тест Доктороу на «обратного центавра»
Разговоры о пузыре ИИ ведутся давно, но писатель и технологический журналист Кори Доктороу в новой книге предлагает не гадать, когда он лопнет, а разобраться,…

Google DeepMind и A24 вместе создадут ИИ для кино: учёные сядут рядом с режиссёрами
Google DeepMind и независимая кинокомпания A24 3 июня 2025 года объявили о долгосрочном исследовательском партнёрстве, в котором учёные-разработчики ИИ будут…
Комментарии