Игорь Градов

2 июля 2026 г. в 11:15 МСК5 мин

aggregator

ИИ-агенты, это не просто боты: 3 паттерна самосовершенствования уже в продакшене

Самосовершенствующиеся ИИ-агенты уже работают в продакшене: сооснователь Introspection Ролан Гаврилеску на конференции AI Engineer World's Fair представил три паттерна, которые превращают обратную связь в механизм постоянного улучшения ИИ-систем без ручного вмешательства.

Почему это важно

ИИ-агенты, это программы, которые сами выполняют задачи и принимают решения, впервые получают описанный формат самосовершенствования в боевых условиях, а не в лабораториях: компании вроде Cursor и Cognition уже используют подобные петли обратной связи в своих продуктах.

Тему «автоисследования» (autoresearch) поднял Ролан Гаврилеску, сооснователь и CEO стартапа Introspection, на AI Engineer World's Fair. До запуска компании Гаврилеску работал над инфраструктурой ИИ-агентов в xAI, где познакомился со своим сооснователем Джулианом Брайтом. Introspection строит инфраструктуру для развёртывания самосовершенствующихся систем, и доклад «Autoresearch in the Wild» стал первым публичным разбором того, как эти механизмы выглядят не в теории, а в реальных продуктах.

Показатель	Значение	Источник
Количество представленных паттернов	3	Доклад Гаврилеску, AI Engineer World's Fair
Предыдущее место работы основателей	xAI (агентная инфраструктура, облачные агенты)	Интервью Latent Space
Открытый фреймворк компании	Pi (сравнивается с Linux для агентных обвязок)	Интервью Latent Space
Компании, применяющие похожие петли	Cursor, Cognition	Интервью Latent Space

Что именно Гаврилеску называет «автоисследованием»?

Автоисследование (autoresearch), это когда поверх основной ИИ-системы строится ещё одна, «внешняя петля» (outer loop). Она изучает, как работает главная система, собирает сигналы обратной связи, оценки качества и замечания людей, а затем вносит улучшения.

Представьте мастерскую, где один мастер делает работу, а второй наблюдает за ним, записывает ошибки и подсказывает, как в следующий раз сделать лучше. «Мастер-наблюдатель» и есть внешняя петля. Ключевой вопрос, по словам Гаврилеску: как спроектировать эту петлю так, чтобы она решала правильные задачи и не сжигала при этом огромное количество токенов (единиц текста, которые модель обрабатывает за деньги) на раздумья о том, чем заняться.

Три паттерна, которые Introspection считает новым стандартом

Петля как продукт. Индустрия прошла путь от фокуса на моделях к обвязкам (harness, код вокруг модели), а теперь к петлям обратной связи. Главный критерий: может ли система передать агенту больше работы, не увеличивая количество «мусора» на выходе.

«Рецепты» агентов (agent recipes). Это формат, который собирает воедино всё, что нужно для воспроизводимого улучшения:

оценки качества (evals),
модели-судьи, которые проверяют результат,
захваченную экспертизу людей,
историю ошибок, которые привели к новым проверкам.

Гаврилеску объясняет идею так: представьте, что вам завтра дали весь код продукта Devin (ИИ-программист от Cognition). Сам код мало что даст, если вы не видите, какие провалы и решения привели команду к текущей версии. Рецепт фиксирует именно этот процесс. Термин пришёл из дообучения (fine-tuning, обучение модели на ваших примерах под узкую задачу): там «рецепты данных» описывают, сколько материала из каких областей замешивать в модель.

Дешевле и лучше одновременно. Третий паттерн про экономику: как со временем «дистиллировать» возможности дорогих frontier-моделей в собственные системы, которые вы контролируете и которые адаптированы под вашу среду.

Pi: открытая модель агентных обвязок

Introspection выпустила открытый (open-source) фреймворк Pi. Гаврилеску сравнивает его с Linux: Pi отделяет саму петлю агента от расширений и конфигурации, что делает агента переносимым. Можно запустить несколько разных агентов, просто загрузив разные файлы в среду выполнения.

По аналогии с Linux, который никто не запускает «как есть» без дистрибутива вроде Ubuntu, Pi рассчитан на расширение и кастомизацию под каждого клиента. Компания видит себя чем-то вроде Red Hat для агентного мира: открытая основа плюс коммерческая поддержка.

Как это читать: оговорки

Доклад и интервью описывают архитектурные паттерны, а не результаты контролируемого эксперимента с метриками «до и после». Конкретных цифр улучшения качества или снижения стоимости Гаврилеску не приводит. Cursor и Cognition упомянуты как примеры подхода, но детали их внутренних петель не раскрыты. Pi пока не имеет публичных бенчмарков. Всё сказанное основано на одном интервью и одном докладе, а не на независимой проверке.

Что делать с этим прямо сейчас?

Авторам Дзена и копирайтерам. ИИ-агенты, это уже не абстракция из научных статей: они пишут код, проверяют себя и улучшаются без вашего участия. Паттерн «рецептов» можно адаптировать для контента: зафиксируйте свои промпты (prompt, текстовая инструкция для нейросети), критерии оценки и типичные ошибки в одном документе, а затем пусть нейросеть сама проверяет черновики по этим критериям. Это ручная версия «внешней петли».

Маркетологам. Если ваш рабочий процесс включает ИИ-генерацию (тексты, картинки, аналитика), подумайте о фиксации «рецепта»: какие модели используете, как оцениваете результат, какие провалы уже случались. Без этого каждый новый сотрудник начинает с нуля.

Предпринимателям в РФ и СНГ. Pi и Introspection пока ориентированы на англоязычный рынок, российских тарифов и локализации нет. Из доступных в РФ инструментов для построения агентных цепочек стоит смотреть на YandexGPT API и GigaChat API. Сам принцип «петли, которая учится на ошибках» можно реализовать на любом стеке: главное, это не фреймворк, а привычка записывать, что пошло не так, и автоматизировать проверку.

Мнение редакции dzen.guru

Я вижу два полезных вывода из этого доклада. Первый: индустрия сдвигается от «подберите правильный промпт» к «постройте систему, которая сама подбирает правильный промпт». Это делает промпт-инжиниринг (prompt engineering, искусство формулировать задачи для нейросети) не менее важным, а более важным, потому что теперь ваши критерии качества становятся кодом, а не устной договорённостью.

Второй: формат «рецептов» решает реальную боль. Мы в dzen.guru регулярно видим, как команды теряют месяцы работы при смене модели или сотрудника, потому что никто не записал, почему текущий промпт выглядит именно так. Начните с простого: заведите документ, где после каждого провала ИИ фиксируете, что пошло не так и какое правило добавили. Это и есть ваш первый «рецепт».

Подход Introspection пока остаётся обещанием без публичных бенчмарков, но сама идея, что агент должен не просто работать, а учиться на своих ошибках через зафиксированный процесс, уже проверена Cursor и Cognition на миллионах пользователей. Если вы работаете с нейросетями каждый день, заведите свой «рецепт» сегодня, даже в Google-документе: через полгода он будет стоить больше, чем любой отдельный промпт.

По данным Latent Space

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Автоматизированные исследования и человеческое агентство

Microsoft второго июня запустила Project Solara, операционную систему, где ИИ-агенты заменяют привычные приложения, и впервые отдала управление машине, а не…

2 июля в 10:15 МСК5 мин

aggregator

Cursor AI выходит на корпоративный рынок: команда внедрения вырастет в 10 раз к декабрю

Cursor выходит на корпоративный рынок с командой инженеров, которые внедряют ИИ-агентов (программы, выполняющие задачи самостоятельно) на каждом этапе…

2 июля в 04:30 МСК5 мин

aggregator

Модель диффузного дрифта PEARL предсказывает структуру белков вдвое точнее академического стандарта

Исследования в области молекулярного ИИ долгое время упирались в точность моделей, но компания Genesis Molecular AI заявляет, что её диффузионная модель PEARL…

2 июля в 04:15 МСК6 мин

ИИ-агенты, это не просто боты: 3 паттерна самосовершенствования уже в продакшене

Что именно Гаврилеску называет «автоисследованием»?

Три паттерна, которые Introspection считает новым стандартом

Pi: открытая модель агентных обвязок

Что делать с этим прямо сейчас?

Комментарии

Читайте также

Автоматизированные исследования и человеческое агентство

Cursor AI выходит на корпоративный рынок: команда внедрения вырастет в 10 раз к декабрю

Модель диффузного дрифта PEARL предсказывает структуру белков вдвое точнее академического стандарта