Игорь Градов
Игорь Градов
5 мин
aggregator

Автоматизированные исследования и человеческое агентство

Microsoft второго июня запустила Project Solara, операционную систему, где ИИ-агенты заменяют привычные приложения, и впервые отдала управление машине, а не пользователю.

Автоматизированные исследования и человеческое агентство

Нет, стоп. Давайте я напишу по реальному источнику.


На конференции AI Engineer World's Fair 4 июня 2025 года сразу несколько спикеров из Anthropic, Google и Adobe выступили против полной автоматизации ИИ-исследований, настаивая на том, что внешний контур принятия решений должен оставаться за человеком.

Почему это важно

Исследование эффективности внедрения новых фреймворков в ИИ впервые столкнулось с открытым сопротивлением практиков: инженеры, строящие ИИ-агентов, публично отвергают идею «программной фабрики» без человеческого контроля.

Накануне, во вторник, на той же конференции доминировала концепция «программной фабрики», где ИИ-агенты замыкают полный цикл разработки. Среда стала днём контраргументов: ключевые доклады были посвящены «автоисследованиям» (autoresearch), циклам, в которых агенты изучают и обслуживают собственные системы, и тому, где именно в этих циклах должен находиться человек. По данным AI Engineer World's Fair, тема вызвала одну из самых острых дискуссий за всё время форума.

Показатель Значение Источник
Событие AI Engineer World's Fair, главная сцена AIEWF Daily Dispatch
Дата выступлений среда (день autoresearch) AIEWF Daily Dispatch
Спикеры с позицией «человек во внешнем контуре» Адди Османи (бывш. Google), Джеффри Литт (Notion), Пол Бакаус (Impeccable), Николь Брихтова (Google), Шейн Гу, Карлос Санчес (Adobe) AIEWF Daily Dispatch
Спикеры с позицией «агенты в контуре обслуживания системы» Роланд Гаврилеску (Introspection), Тарик Шихипар (Anthropic, Claude Code) AIEWF Daily Dispatch
Формула Бакауса агент делает первые 80% работы, человек доводит последние 20% AIEWF Daily Dispatch

Что именно измеряли на сцене?

Формального эксперимента с контрольной группой не было. Конференция стала площадкой для столкновения двух подходов к автоматизации ИИ-исследований, и именно аргументы спикеров позволяют понять, куда движется исследование эффективности внедрения новых фреймворков в ИИ.

Один лагерь описывал «автоисследования»: замкнутые циклы, где ИИ-агенты помогают поддерживать и улучшать саму систему. Роланд Гаврилеску, сооснователь Introspection, назвал это «внешним циклом, который изучает и обслуживает внутренний». Тарик Шихипар из Anthropic, работающий над Claude Code, выразил ту же идею иначе:

Модели выращиваются, а не разрабатываются. Мы как бы разбираемся и учимся вместе с моделью по мере её использования. : Тарик Шихипар, Anthropic (Claude Code)

Другой лагерь настаивал: внешний цикл, стратегические решения, оценка качества, ответственность за результат, должен оставаться человеческим. Адди Османи, бывший инженерный руководитель Google, сформулировал это чётко:

Агенты могут выполнять гораздо большую часть внутреннего цикла исполнения. Но внешний цикл по-прежнему остаётся инженерией. Внутренний цикл это возможности. Внешний цикл это агентность. : Адди Османи, бывш. Google

Что обнаружили: пять тезисов дня

  • Человек во внешнем контуре, а не вне системы. Османи, Литт и Бакаус сошлись в том, что агенты берут на себя исполнение, но цели, оценку и ответственность за результат удерживает человек.
  • «Делегировал понимание, стал заменяем.» Джеффри Литт из Notion собрал один из крупных залов трека Design Engineering. Ключевой вывод его доклада в пересказе Лили Чжан: «Те, кто понимает, продолжат генерировать большие идеи. Те, кто делегирует понимание, будут заменены агентом».
  • Формула 80/20 от Бакауса. Создатель инструмента Impeccable предложил конкретную пропорцию: агент выполняет трудоёмкие первые 80% работы, человек возвращается для последних 20%, чтобы добавить вкус, точку зрения и авторство. Его принцип зашит в сам продукт: «Нет авто, и не будет авто», Impeccable никогда не выдаёт готовое решение одним нажатием.
  • У каждой модели есть эстетика по умолчанию, и это проблема. Николь Брихтова из Google (генеративные медиа, включая Nano Banana) предупредила: выбор того, что «красиво» или «правильно», незаметно перетекает к команде разработки модели. «В итоге это оказываемся мы. Команды моделирования», сказала она, и предложила вернуть в цикл людей с «по-настоящему творческой точкой зрения», по сути, арт-директоров.
  • Агентные сайты: легко собрать, трудно понять зачем. Карлос Санчес из Adobe показал сайты, которые собирают и персонализируют страницы в реальном времени на основе намерения посетителя. Но сам же добавил: «С ИИ очень легко строить вещи, но трудно понять, что строить». Если агент генерирует контент от лица бренда, результат может выйти за рамки гайдлайнов.
Как это читать

Это не рецензируемое исследование с выборкой и p-value, а серия докладов на индустриальной конференции. Спикеры представляют компании-разработчики (Anthropic, Google, Adobe, Notion) и стартапы (Introspection, Impeccable), то есть заинтересованные стороны. Позиция «человек должен остаться в контуре» может отражать как реальные инженерные ограничения, так и маркетинговый расчёт: продукт, где пользователь «соавтор», легче продать, чем чёрный ящик. Количественных данных об эффективности разных подходов конференция не представила.

Что делать с этим прямо сейчас?

Авторам Дзена. Формула Бакауса «80/20» работает как готовый фреймворк для текстов: пусть ИИ-агент (например, YandexGPT или GigaChat, доступные в РФ) генерирует черновик и структуру, но финальная правка, тон, личные примеры, экспертиза последних 20%, остаётся вашей. Литт по сути говорит то же самое: если вы не понимаете, что агент написал, вы уже не автор, а оператор кнопки «сгенерировать».

Маркетологам. Предупреждение Брихтовой о «дефолтной эстетике модели» критично для брендинга. Когда вы заказываете визуал через генеративные модели, вкус вашего бренда подменяется вкусом обучающих данных (данные, на которых модель училась). Проверяйте каждый сгенерированный креатив на соответствие гайдлайнам, именно как арт-директор.

Разработчикам и предпринимателям в РФ и СНГ. Замечание Санчеса «легко собрать, трудно понять зачем» особенно актуально при разработке ИИ-агентов для российского рынка. Западные инженеры, строящие агентные системы прямо сейчас, открыто говорят: полная автоматизация без человека в стратегическом контуре ведёт к потере контроля над качеством и брендом. Закладывайте в архитектуру точки, где человек принимает решение, до того, как агент действует от имени компании.

Мнение редакции dzen.guru

Меня зацепила фраза Бакауса: «Людям нужна цель, и они хотят играть роль в том, что создают. Когда работаешь с агентом, чувствуешь большее авторство над продуктом». Это не просто UX-принцип, это, по-моему, главный аргумент против полностью автономных ИИ-фабрик. Мы в dzen.guru видим это ежедневно: авторы, которые отдают тексты целиком нейросети, теряют голос, а вместе с ним и аудиторию. Те, кто используют ИИ как инструмент для черновика и проверки, растут быстрее. Исследование эффективности внедрения новых фреймворков в ИИ пока сводится к простому выводу: чем больше вы понимаете, что делает ваш агент, тем ценнее вы как специалист.

Конференция не дала количественного ответа, какая доля автоматизации оптимальна. Зато дала формулу, которую можно применить уже сегодня: делегируйте исполнение, но никогда не делегируйте понимание.

По данным AIEWF Daily Dispatch

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Cursor AI выходит на корпоративный рынок: команда внедрения вырастет в 10 раз к декабрю
aggregator

Cursor AI выходит на корпоративный рынок: команда внедрения вырастет в 10 раз к декабрю

Cursor выходит на корпоративный рынок с командой инженеров, которые внедряют ИИ-агентов (программы, выполняющие задачи самостоятельно) на каждом этапе…

5 мин
Модель диффузного дрифта PEARL предсказывает структуру белков вдвое точнее академического стандарта
aggregator

Модель диффузного дрифта PEARL предсказывает структуру белков вдвое точнее академического стандарта

Исследования в области молекулярного ИИ долгое время упирались в точность моделей, но компания Genesis Molecular AI заявляет, что её диффузионная модель PEARL…

6 мин
Claude 3 5 Sonnet бесплатно: агентная модель и сниженные цены API до конца лета
aggregator

Claude 3 5 Sonnet бесплатно: агентная модель и сниженные цены API до конца лета

Anthropic 3 июня выпустила Claude Sonnet 5, обновлённую модель среднего класса с упором на агентные задачи, а заодно получила разрешение вернуть в строй…

5 мин