95% инженеров используют ИИ-агентов, но 59% боятся их кода: итоги AI Engineering World's Fair
Четвёртого июня на конференции AI Engineer World's Fair в финальный день развернулась публичная дискуссия о том, готовы ли автономные «петли» (loops) в разработке заменить ручное написание кода, и результаты отраслевого опроса показали, что практика пока обгоняет инструменты контроля.

95% опрошенных инженеров уже используют ИИ-агентов (программы, которые действуют самостоятельно), но единого стандарта контроля за ними до сих пор нет, а 59% боятся, что код, написанный машиной, создаёт долгосрочные проблемы.
Конференция AI Engineer World's Fair собрала практиков, которые строят приложения на базе больших языковых моделей. Финальный день свёлся к вопросу, вокруг которого крутится вся дисциплина AI engineering (building applications with foundation models): можно ли уже сейчас запускать «программные фабрики», где ИИ-агенты пишут и тестируют код в автоматическом цикле, или инженерная культура не успевает за амбициями? Ответы дали дебаты, интервью с руководителем лабораторий Anthropic и ежегодный опрос от Amplify.
| Что | Когда | Кто выпустил | Цена |
|---|---|---|---|
| Дебаты о loops на AI Engineer World's Fair | 4 июня 2025 | Организаторы AIEWF | Не раскрыта |
| Анонс Claude Tag (внутренняя модель Anthropic) | Объявлена за неделю до конференции | Anthropic | Не раскрыта |
| Опрос AI Engineer Survey 2026 | Представлен 4 июня 2025 | Amplify (Barr Yaron) | Бесплатный доступ к результатам |
Петли в коде: за и против
-
Сторонники loops (Джеффри Хантли, создатель Ralph Loop, и Иан Ливингстон, CEO Keycard) утверждают, что автоматические циклы «проверил, узнал, применил» уже работают. Хантли заявил, что не видит смысла возвращаться к ручному написанию кода, и сравнил роль инженера с машинистом локомотива: задача не писать рельсы, а удерживать поезд на пути.
-
Скептики (Декс Хорти из HumanLayer и Грег Пструча из Subroutine) не против петель как таковых. Хорти напомнил, что Kubernetes (система управления контейнерами) построена на петлях, но они детерминированные, то есть предсказуемые. Проблема в том, что «хайп обгоняет дисциплину». По словам Хорти, пока нет доказательств, что можно подняться на уровень абстракции выше и отдать кодирование агентам целиком.
-
Экономический аргумент. Пструча заявил, что агентные (agentic) петли экономически нежизнеспособны: нельзя «оркестрировать проблемы, просто покупая больше токенов» (токен, минимальная единица текста, которую обрабатывает модель).
-
Компромисс. Даже сторонник Хантли признал: «программные фабрики» (software factories), где агенты полностью заменяют команду, пока не решённая задача. Хорти посоветовал начинать с малого и «наращивать интуицию», а не автоматизировать всё сразу.
Любопытная деталь: когда модератор Элли Хау попросила зал проголосовать, кто победил, софиты слепили настолько, что ни она, ни спикеры не смогли сосчитать руки. Как заметили участники, будь за свет в ответе ИИ-агент, проблемы бы не было.
Claude Tag: как Anthropic строит «фабрику» изнутри?
Майк Кригер, сооснователь Instagram и нынешний руководитель лабораторий Anthropic, рассказал о Claude Tag. Это внутренняя модель компании, которую объявили за неделю до конференции.
По словам Кригера, Tag работает иначе, чем обычный Claude: задачи делегируются агенту асинхронно (без ожидания мгновенного ответа), а сам агент действует проактивно. Пример инструкции команды: «Не просто исправь баг. Теперь ты отвечаешь за этот участок кодовой базы, следи за каналом обратной связи и сам бери задачи».
Кригер признал и обратную сторону: команда стала «упираться в ревью» и в «человеческую способность полностью осмыслить, что мы делаем». Фактически Anthropic столкнулась с тем же узким горлышком, о котором предупреждали скептики на дебатах.
95% инженеров уже с агентами, но контроль отстаёт
Барр Ярон из Amplify представила ежегодный опрос AI Engineer Survey 2026. Ключевые цифры:
- 95% респондентов используют ИИ-агентов. По данным Amplify, это примерно вдвое больше, чем годом ранее.
- 89% команд, работающих с агентами, сообщили, что агенты могут записывать данные (год назад таких было 52%).
- 40% заявили, что стоимость ИИ регулярно ограничивает амбиции, ещё 36% сталкиваются с этим время от времени.
- 59% опасаются, что код, сгенерированный ИИ, создаёт долгосрочные технические долги.
Ярон подчеркнула: агенты перестали быть инструментом для чтения, суммирования и черновиков. Они действуют внутри систем. Но уровень контроля остаётся примитивным: ручные одобрения и права доступа, а за ними разрозненные методы вроде декомпозиции задач, поиска по базе знаний (RAG), памяти и песочниц.
«Никто не решил вопрос уровня контроля для агентов.» : Барр Ярон, Amplify
Сравнение: а что в России?
| Параметр | Зарубежные инструменты (Claude, Cursor, Devin) | Российские аналоги (YandexGPT, GigaChat) |
|---|---|---|
| Агентный режим в IDE | Доступен (Cursor, Windsurf, Claude Code) | Встроенного агентного IDE нет; GigaChat и YandexGPT работают через API и чат |
| Автоматические петли для кода | Экспериментальные (Ralph Loop, Devin) | Публичных аналогов пока не заявлено |
| Стоимость токенов | Высокая, 40% инженеров жалуются на лимит бюджета (данные Amplify) | Тарифы ниже, но и возможности агентного режима ограничены |
Для российских разработчиков и стартапов, копирующих западные подходы AI engineering (building applications with foundation models), главный вывод: инструменты для loops пока экспериментальные даже у создателей, торопиться с полной автоматизацией нет смысла.
Что это значит для вас?
Авторам Дзена. Тема «ИИ пишет код сам» генерирует трафик, но честный угол сильнее хайпа. Пишите не «ИИ заменил программистов», а «95% уже используют, но 59% боятся последствий». Контраст цепляет.
Маркетологам. Если вы заказываете разработку у студий, которые обещают «полностью автоматизированный ИИ-пайплайн», спросите, как устроен контроль. По данным Amplify, стандарта контроля нет ни у кого.
Предпринимателям в РФ и СНГ. Прямого доступа к Claude Tag, Ralph Loop и Keycard из России нет. Но подход «начни с малого, нарасти интуицию», который рекомендовал Хорти, работает с любыми доступными моделями: YandexGPT, GigaChat, открытыми (open-source) моделями через Ollama.
Как попробовать агентный подход к коду?
- Установите локальную среду с поддержкой ИИ-агентов: Cursor (cursor.sh) или VS Code с расширением Continue. Оба работают с открытыми моделями.
- Начните с одной задачи, а не с «фабрики»: дайте агенту один баг или один тест и проверьте результат вручную.
- Отслеживайте расход токенов (единиц текста, за которые платите провайдеру модели): по данным Amplify, это второй по важности показатель после качества.
- Только после стабильных результатов на малом цикле расширяйте петлю, добавляя мониторинг и обратную связь.
Дебаты на AIEWF показали то, что я вижу и в работе с авторами: инструмент уже мощный, но вера в полную автоматизацию опережает реальность. Образ Хантли про машиниста локомотива точен, пока ты следишь за рельсами, поезд едет. Отвернулся, и 59% опрошенных уже видят «технический долг», который никто не знает, как разгребать. Для российского рынка это хорошая новость: мы не «отстаём», мы идём параллельно. Стандарта контроля нет ни у Anthropic, ни у кого-то ещё. Сейчас лучшее время не копировать чужие «фабрики», а выстраивать свои маленькие петли и учиться их контролировать. Мой совет: попробуйте агентный режим на одной рутинной задаче на этой неделе и замерьте, сколько времени ушло на проверку результата. Это и будет ваша реальная «петля».
Частые вопросы
Что такое loops в контексте разработки с ИИ?
Loops (петли, циклы) означают автоматический цикл: ИИ-агент пишет код, запускает тесты, видит ошибки, исправляет их и повторяет, пока задача не решена. Идея в том, чтобы человек задавал цель, а машина сама проходила путь «попробовал, узнал, применил». Спор идёт о том, насколько этот цикл надёжен без постоянного человеческого контроля.
Claude Tag и обычный Claude: в чём разница?
По словам Майка Кригера из Anthropic, Claude Tag работает более автономно: ему делегируют ответственность за участок кода, он сам мониторит каналы обратной связи и берёт задачи. Обычный Claude отвечает на запросы по одному. Tag ближе к концепции «программной фабрики», но пока доступен только внутри Anthropic.
Стоит ли российскому разработчику переходить на агентный подход прямо сейчас?
Пробовать стоит, копировать чужие «фабрики» целиком нет. Данные Amplify показывают, что даже в западных командах контроль за агентами остаётся примитивным, а расходы на токены ограничивают амбиции у 76% респондентов (40% регулярно, 36% периодически). Начните с одной задачи, измерьте результат, и только потом расширяйте.

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

Персональные сайты на основе ИИ
Компания Adobe показала на конференции AI Engineer World's Fair в Сан-Франциско прототип «агентного сайта», который собирает уникальную страницу под каждого…

Prompt engineering становится инженерией навыков: Google предлагает давать ИИ-агентам точный словарь команд
Prompt engineering перестаёт быть набором трюков: Пол Бакаус из Google предлагает строить для ИИ-агентов целую систему профессиональных навыков, где человек не…
Software factories: ИИ-агенты замыкают цикл от тикета до релиза без участия человека
Тема «фабрик кода» (software factories) за последние полгода переросла из метафоры в конкретный продуктовый сдвиг: несколько компаний одновременно строят…
Комментарии