Игорь Градов
Игорь Градов
6 мин
ai

Как работают ИИ агенты в корпоративных системах

Корпоративные ИИ-агенты решают задачи, которые раньше требовали недель ручной работы: разбор миллионов строк устаревшего кода, генерация тестов, реагирование на инциденты в реальном времени, и всё это без перерасхода токенов и без галлюцинаций (когда модель уверенно выдумывает то, чего не было), если правильно выстроить агентную логику.

Как работают ИИ агенты в корпоративных системах
Почему это важно

Исследователи IBM показали, что ИИ-агенты для бизнеса, оснащённые графами знаний и статическим анализом кода, снижают потребление токенов до 30 раз по сравнению с голым использованием большой языковой модели, сохраняя при этом точность ответов на уровне выше базового.

Большинство пилотных ИИ-проектов на предприятиях проваливаются. Публикация исследователей IBM Research на HuggingFace объясняет, почему так происходит и как это исправить. Ключевая идея: сама по себе большая языковая модель не справляется с корпоративными задачами, потому что рабочие процессы предприятий динамичны, долгоиграющи, опутаны сотнями API и баз данных, а ещё ограничены регуляторными политиками. Модели нужен «навигатор», агентная логика, набор программных примитивов, которые сужают контекст и направляют модель точно по маршруту задачи.

Что понадобится

  • Понимание задачи: конкретный корпоративный процесс, который вы хотите автоматизировать (разбор легаси-кода, тестирование, мониторинг инцидентов)
  • Инструмент статического анализа кода: библиотека, которая разбирает исходный код на структурные элементы без его запуска (для COBOL и Java подойдут специализированные парсеры)
  • Граф знаний (knowledge graph, структура «сущность и связь», где каждый микросервис, база данных и метрика связаны между собой): можно построить в Neo4j или аналогичной графовой базе данных
  • Доступ к языковой модели: в примерах IBM используются Mistral Medium 250B и Devstral 24B, но логика применима к любой модели, включая открытые
  • Агентный фреймворк: оболочка, в которой работает ИИ-агент (LangGraph, CrewAI или собственная разработка)
  • Время: от нескольких дней на прототип одного агента до нескольких недель на интеграцию в рабочий процесс

Пошаговая инструкция

  1. Определите рабочий процесс и его границы. Корпоративные процессы обладают тремя свойствами: они динамичны и длительны, используют множество API и сервисов, ограничены политиками и регуляциями. Запишите, какие из этих свойств критичны для вашей задачи.

  2. Постройте предварительно индексированное представление данных. Вместо того чтобы каждый раз скармливать модели весь исходный код или всю документацию, прогоните статический анализ и сохраните результат в структурированной базе. В примере IBM для разбора COBOL-приложений (до миллиона строк кода и тысячи программ) статический анализ создаёт схему из сотен взаимосвязанных таблиц. Модель обращается уже к готовым структурам, а не к «сырому» коду.

  3. Сформируйте граф знаний для контекста. Для задач мониторинга и реагирования на инциденты IBM определяет граф, где сущности включают микросервисы, сервисы баз данных, промежуточное ПО и телеметрию. В граф встраивают «племенные знания», экспертизу, которая обычно живёт только в головах инженеров.

  4. Соберите агента с логикой навигации. Агентная логика встраивается между пользовательским запросом и языковой моделью. Она сужает контекстное пространство: модель получает не миллион строк, а выжимку, релевантную конкретному вопросу.

# Псевдо-архитектура агента с логикой навигации user_query → agent_logic(static_analysis + knowledge_graph) → reduced_context → LLM → validated_response

  1. Добавьте суб-агентов для итеративного улучшения. В примере IBM с генерацией тестов (инструмент Aster) суб-агенты отвечают за расширение покрытия кода и исправление ошибок компиляции. Каждый суб-агент решает узкую задачу, а не пытается «понять всё».

  2. Измерьте результат по трём метрикам: качество, стоимость, доверие. Без замеров вы не отличите рабочего агента от дорогой игрушки. IBM фиксирует покрытие кода (line, branch, method coverage), потребление токенов и рейтинги разработчиков.

Четыре сценария, где это уже работает

Исследователи IBM проверили агентную логику на четырёх задачах корпоративного цикла разработки ПО.

Понимание легаси-кода (COBOL/PL/1). Агент App Insights в составе IBM watsonx Code Assistant for Z использует статический анализ и предындексированную базу. Результат на системах до миллиона строк кода: точность понимания приложений на уровне чуть выше базовой модели при потреблении токенов примерно в 30 раз ниже.

Генерация тестов (Aster). Библиотека Aster генерирует юнит-тесты, интеграционные, API и тесты на изменения. По данным публикации, на 75 и более Java-приложениях IBM CIO (до 560 классов и 67 тысяч строк кода) с моделью Devstral 24B покрытие выросло на 20 до 45 процентов. Потребление токенов ниже до 15 раз по сравнению с ведущими ИИ-агентами для написания кода.

Реагирование на инциденты. Граф знаний плюс библиотеки наблюдаемости (observability, возможность видеть, что происходит внутри работающей системы) позволяют агенту проактивно находить проблемы до того, как они превратятся в аварии.

Автоматизация комплаенса. Модернизация соответствия нормативным требованиям для критически важных сред, задача, где ошибка стоит дорого, а ручная работа занимает месяцы.

Пример: разбор COBOL-приложения

Задача: понять структуру и логику COBOL-приложения объёмом 800 тысяч строк.

Без агентной логики: модель получает весь код целиком, расходует огромный контекст, часто галлюцинирует на редких конструкциях COBOL.

С агентной логикой: статический анализ разбирает код, строит индексированное представление в базе из сотен таблиц. Агент при вопросе пользователя извлекает из базы только релевантные фрагменты и передаёт модели Mistral Medium 250B. Результат: точность ответов на уровне выше базового подхода, расход токенов снижен примерно в 30 раз.

Частые ошибки

Пытаться решить всё одной моделью без агентной логики. Чем шире контекст, тем больше модель тратит токенов и тем чаще выдумывает. Статический анализ и граф знаний существуют именно для того, чтобы сузить контекст до необходимого минимума.

Игнорировать суб-агентов. Один агент на все задачи работает хуже, чем несколько узкоспециализированных. В примере Aster отдельные суб-агенты чинят ошибки компиляции и расширяют покрытие, каждый делает одно дело хорошо.

Не измерять потребление токенов. Без метрик вы не заметите, что агент пережигает бюджет. Разница может быть в десятки раз.

Забывать про «племенные знания». Экспертиза, которая живёт в головах инженеров, не попадает в модель автоматически. Её нужно явно закладывать в граф знаний.

Что делать с этим прямо сейчас, по ролям

Разработчику. Если вы работаете с легаси-системами (COBOL, PL/1, старые Java-монолиты), начните с построения статического анализа и индексированной базы структур. Это снизит расход токенов и повысит точность ответов модели. Из доступных в РФ моделей для экспериментов подойдут YandexGPT и GigaChat, а для кода можно использовать открытые модели вроде Devstral.

Маркетологу и менеджеру продукта. ИИ-агенты для бизнеса перестают быть демо-проектами и выходят на уровень предпродакшена. Если ваша компания обсуждает внедрение ИИ, покажите команде эту архитектуру: агентная логика плюс граф знаний, конкретный рецепт, а не абстрактное «внедрите ИИ».

Предпринимателю в РФ и СНГ. IBM watsonx Code Assistant for Z, продукт для крупного энтерпрайза, в России напрямую недоступен. Но сама архитектура, статический анализ плюс граф знаний плюс языковая модель, воспроизводима на любом стеке. Если у вас есть легаси-код и дорогие инженеры, которые тратят дни на его разбор, это ваша точка экономии.

Мнение редакции dzen.guru

Публикация IBM Research подтверждает то, что я наблюдаю на практике: голая языковая модель без «направляющих рельсов» в корпоративной среде проваливается. Она либо галлюцинирует, либо сжигает бюджет на токены, либо и то и другое.

Агентная логика, это не маркетинговый термин. Это конкретный инженерный слой: граф знаний, статический анализ, предындексированные базы. Он решает главную проблему, сужает контекст до того объёма, с которым модель справляется точно и дёшево.

Честная оговорка: результаты IBM получены на их собственных продуктах и инфраструктуре. Воспроизвести 30-кратное снижение токенов на произвольном проекте с произвольной моделью вы вряд ли сможете без серьёзной инженерной работы. Но направление верное, и начать можно с малого: один процесс, один граф, один агент.

Подход IBM показывает, что масштабируемое внедрение ИИ-агентов в корпоративные системы зависит не от размера модели, а от качества навигации, которую вы ей даёте. Постройте граф знаний для одного рабочего процесса, измерьте расход токенов до и после, и вы получите аргумент, который убедит любого скептика внутри компании.

По материалам HuggingFace

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Поисковик без ИИ набирает популярность
ai

Поисковик без ИИ набирает популярность

DuckDuckGo выпустил браузерные расширения для Chrome и Firefox, которые делают поиск без ИИ-ответов настройкой по умолчанию, и это произошло на фоне резкого…

5 мин
Microsoft представит новые ИИ модели на Build
ai

Microsoft представит новые ИИ модели на Build

Microsoft второго июня откроет конференцию Build, на которой покажет собственную рассуждающую модель MAI-Thinking-1, обновлённые модели для генерации…

5 мин
Strava ограничивает доступ к API из за искусственного интеллекта
ai

Strava ограничивает доступ к API из за искусственного интеллекта

Strava второго июня ввела платную подписку $11,99 в месяц для разработчиков, которые хотят использовать её API (интерфейс, через который сторонние приложения…

4 мин