Loopcraft: программный код для автоматизации операций пользователя пишут каскады ИИ-агентов

Loopcraft предлагает убрать человека из цикла промптирования и передать управление автономным петлям ИИ-агентов, которые сами генерируют, проверяют и улучшают код за минуты вместо часов ручной работы.

Почему это важно

Впервые сообщество ведущих практиков открыто сформулировало принцип: конкурентное преимущество больше не в умении писать промпты, а в умении выстраивать каскады автономных циклов, и кто не освоит это, проиграет тем, кто освоит.

Концепцию параллельно описали три человека из разных углов индустрии. Питер Штайнбергер (Steipete) заявил, что «пора прекратить промптить агентов вручную и начать проектировать петли, которые промптят агентов за вас». Борис Черни подтвердил: «Я больше не промпчу Claude, я пишу петли, петли делают работу». Андрей Карпати в обсуждении Autoresearch сформулировал жёстче: «Вы сами и есть узкое место; нужно убрать себя из контура, выстроить систему один раз, нажать запуск и максимизировать пропускную способность по токенам».

Идею подхватил дайджест Latent Space от 10-11 июня 2026 года, назвав её Loopcraft и проиллюстрировав текущими результатами автономных систем исследования кода.

Показатель	Значение	Источник
WeirdML (Fable 5)	87,8%, первая модель выше 70% в среднем по каждой задаче	htihle, цитата Latent Space
FrontierSWE (Fable 5)	первое место, продуктивные прогоны до 20 часов	ProximalHQ, цитата Latent Space
NanoChat (Recursive SI)	достижение того же значения функции потерь в 1,3 раза быстрее	cong_ml, цитата Latent Space
NanoGPT Speedrun (Recursive SI)	снижение времени выполнения с 79,7 до 77,5 секунд	cong_ml, цитата Latent Space
SOL-ExecBench (Recursive SI)	рост среднего показателя с 0,699 до 0,754 по 235 ядрам	cong_ml, цитата Latent Space
MLE-Bench Lite (Microsoft Arbor)	86% Any-Medal	Hugging Papers, цитата Latent Space

Что такое петли и зачем их «укладывать стопкой»?

Программный код для автоматизации какой-то операции пользователя, будь то проверка, генерация или рефакторинг, принято называть скриптом или макросом. Loopcraft предлагает пойти дальше: вместо одного скрипта выстроить каскад (стек) вложенных петель, каждая из которых сама вызывает ИИ-агента (автономную программу, способную принимать решения и действовать без команд человека на каждом шаге).

Нижняя петля генерирует код. Следующая проверяет результат. Третья решает, переписать блок или двигаться дальше. Человек задаёт архитектуру петель один раз и нажимает «запуск».

Авторы Latent Space описывают это как «игру следующего столетия»: на ранних этапах каждой фазы ценнее уметь спускаться на петлю вниз, когда что-то ломается, но по мере роста качества моделей ценнее уметь подниматься на петлю вверх, увеличивая рычаг автоматизации.

Что обнаружили практики?

Автономные системы уже дают лучшие результаты на публичных бенчмарках. Recursive SI (проект Ричарда Сочера) показал лучшие на момент публикации результаты сразу на трёх задачах: NVIDIA SOL-ExecBench, NanoGPT Speedrun и NanoChat. Открытия выложены в открытый доступ (опенсорс).
Microsoft Arbor работает по схожему принципу для длинных исследовательских сессий. Агент использует постоянное дерево гипотез, которое он сам уточняет. По данным Latent Space, Arbor обходит Codex и Claude Code на шести исследовательских задачах.
Fable 5 от Anthropic подтвердила силу модели, но обнажила проблемы прозрачности. Результаты на WeirdML и FrontierSWE высоки, однако пользователи зафиксировали 200 из 200 отказов на ProgramBench, стоимость одного пулл-реквеста в 10 000 строк составила около 250 долларов, а модель самопроизвольно изобретала внутренние кодовые имена и вставляла собственный «нейронный жаргон» в выходные данные.
Скрытая деградация Claude вызвала откат политики Anthropic за сутки. Компания без предупреждения ухудшила ответы Fable 5 на запросы, связанные с исследованиями ИИ. После публичной критики (Саймон Уиллисон, Клеман Деланг, Наташа Ламберт и другие) политику отменили. Григорий Орос рекомендовал ставить модели за агностичные маршрутизаторы, чтобы переключать провайдера при внезапной смене условий.

Как это читать

Все цифры бенчмарков приведены авторами проектов и блогерами, а не независимыми аудиторами. Выборки задач узкие: SOL-ExecBench покрывает 235 ядер, NanoGPT Speedrun измеряет разницу в 2,2 секунды. Loopcraft пока не формализованная методология, а набор практических принципов от нескольких экспертов. Стоимость и отказы Fable 5 зафиксированы отдельными пользователями, Anthropic официальных данных о ценообразовании прогонов не публиковала.

Что делать с этим прямо сейчас?

Программный код для автоматизации какой-то операции пользователя веб-сайта, например скрипт публикации или проверки SEO-карточки, можно уже сегодня обернуть в простейшую петлю: «сгенерируй, проверь, исправь, повтори». Это и есть минимальный Loopcraft.

Авторам Дзена. Попробуйте двухступенчатую петлю: первый промпт генерирует черновик, второй проверяет его по вашему чек-листу и возвращает на доработку без вашего вмешательства. Даже с YandexGPT или GigaChat, доступными в РФ, такой подход сокращает количество ручных итераций.

Маркетологам. Принцип «не чините сами, стройте системы, которые масштабируются с количеством агентов» напрямую применим к A/B-тестированию креативов и email-цепочек: задайте цели и оркестровку, а не правьте каждый вариант вручную.

Предпринимателям в РФ и СНГ. Закрытые модели (модели, код которых недоступен пользователю) вроде Claude или GPT могут в любой момент изменить поведение, как показал инцидент с Fable 5. Ставьте агентов за маршрутизатор, который позволяет переключиться на российские LLM-сервисы или открытые модели без переписывания всей системы.

Мнение редакции dzen.guru

Loopcraft звучит как лозунг, но за ним стоит реальный сдвиг. Я наблюдаю это в своей практике: один хорошо выстроенный каскад из трёх петель на Claude Code заменяет два-три часа ручного промптирования. Главный риск для русскоязычных пользователей: зависимость от одного провайдера. Инцидент со скрытой деградацией Fable 5 показал, что «петля» может сломаться не из-за вашего кода, а из-за решения компании на другом континенте. Совет: проектируйте петли так, чтобы модель внутри можно было заменить за минуты, а не за дни.

Карпати сформулировал задачу точнее всех: «Как мне перестроить все абстракции так, чтобы настроить систему один раз и нажать запуск?» Если вы до сих пор вручную вводите каждый следующий промпт, вы и есть то узкое место, которое Loopcraft предлагает устранить.

По материалам Latent Space

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

«Второй мозг» на Claude Code: как агентства автоматизируют первые 45 минут утра

Второй мозг на Claude Code стоит собрать сейчас, пока агентства тратят первые 45 минут утра на переключение между Gmail, Slack, CRM и заметками, потому что…

15 июня в 05:45 МСК6 мин

Нейросеть для создания видео за $0,005 в секунду: Avataar AI генерирует в 20 раз дешевле конкурентов

Индийский стартап Avataar AI выпустил нейросеть для создания видео Varya, которая генерирует ролики в 10 раз быстрее базовой модели и стоит 0,5 цента за…

15 июня в 05:30 МСК6 мин

Claude Code: 25 функций агента, пошаговая настройка и примеры для GitLab

Claude Code из терминального помощника вырос в агентную систему с 25 задокументированными возможностями, и если вы подключите её к привычному стеку (GitLab,…

15 июня в 05:15 МСК6 мин