Создание ИИ-агентов нового типа: Sakana Marlin работает 8 часов и выдаёт отчёт на 100 страниц

Sakana AI, лаборатория из Токио, на этой неделе выпустила свой первый коммерческий продукт Sakana Marlin, автономного ИИ-агента для создания стратегических отчётов, который работает не секунды, а до восьми часов над одной задачей.

Почему это важно

Sakana Marlin перевернула привычную логику «быстрее значит лучше»: агент тратит часы вместо минут, но на выходе даёт готовый отчёт на 60-100 страниц с источниками и презентацией, фактически заменяя недели работы стратегической команды.

Создание ИИ-агентов для бизнеса переходит от помощников-чатботов к автономным исследователям. Sakana AI, известная публикациями в Nature и на NeurIPS, превратила свои академические наработки в платный продукт для корпораций. Партнёрами компании уже стали японский банковский гигант MUFG и Citigroup, который вошёл стратегическим инвестором.

Показатель	Значение	Источник
Время одного запуска	до 8 часов	Sakana AI (MarkTechPost)
Объём отчёта	60-100 страниц	Пресс-показ Sakana AI
Число источников в отчёте	60-80	Пресс-показ Sakana AI
LLM-запросов за сессию	сотни-тысячи	Sakana AI
Участники закрытой беты	около 300 специалистов	Sakana AI
Дата беты	апрель 2026	Sakana AI
Открытый код ядра	TreeQuest, лицензия Apache 2.0	Sakana AI
Стартовая цена (pay-as-you-go)	100 кредитов за запуск, ¥98 за кредит	Sakana AI
Подписка Pro	¥150 000 в месяц, 2 000 кредитов	Sakana AI

Как Marlin строит отчёт?

Marlin не отвечает на вопрос мгновенно, как обычный чатбот. Вы задаёте одну тему или вопрос. Дальше агент действует сам: формулирует гипотезы, ищет источники в открытом интернете, проверяет найденное и собирает результат в структурированный документ с основным текстом, списком литературы и приложениями. Презентационные слайды генерируются с помощью ИИ для создания изображений.

В основе лежит алгоритм AB-MCTS (Adaptive Branching Monte Carlo Tree Search, адаптивный древовидный поиск Монте-Карло). Проще говоря, это как шахматный движок, который на каждом шаге решает: взять новую ветку рассуждения (расширить поиск) или углубить уже перспективную. Обычные системы просто генерируют много вариантов параллельно и надеются, что хоть один окажется верным. AB-MCTS тратит ресурсы прицельно на лучшие ветки.

Алгоритм умеет подключать разные языковые модели к разным шагам рассуждения. В экспериментах Sakana AI на задачах ARC-AGI-2 связка o4-mini, Gemini 2.5 Pro и DeepSeek-R1 решила около 27,5% задач, тогда как o4-mini в одиночку справилась примерно с 23%.

Что обнаружили во время бета-теста?

Глубина вместо скорости работает. Около 300 специалистов в закрытой бете тестировали Marlin на реальных задачах: формулирование стратегий, анализ рынков, оценка рисков, конкурентный анализ.
Отчёты действительно объёмные. На пресс-показе документы содержали от 60 до 100 страниц с 60-80 источниками, это не пересказ «Википедии», а структурированное исследование с гипотезами и выводами.
Кредиты расходуются, даже если вы отменили запуск. Одна сессия выбирает от сотен до тысяч обращений к языковым моделям, и стоимость ощутима: минимум 100 кредитов за запуск при pay-as-you-go.
Ядро алгоритма открыто. Sakana опубликовала AB-MCTS как библиотеку TreeQuest под открытой лицензией Apache 2.0. Любой разработчик может установить её, задать свою функцию оценки и запустить древовидный поиск.

Как это читать

Результаты впечатляют, но есть оговорки. Бета-тест охватил около 300 человек, это немного для выводов о качестве на разных отраслях. Время сравнения с конкурентами (минуты против часов) приведено по приблизительным данным, а не по независимым замерам. Автоматически сгенерированные отчёты могут содержать ошибки, которые сложно заметить без экспертной проверки. Сама Sakana AI подчёркивает: человек обязан проверять результат перед любым решением. Создание ИИ-агентов такого уровня пока не отменяет финальной ответственности человека.

Что это значит для вас?

Авторам Дзена и копирайтерам. Marlin показывает новую планку генерации длинных исследовательских текстов. Если вы пишете аналитику, обзоры рынков или разборы, присмотритесь к TreeQuest: это открытый код, и его можно адаптировать под свои задачи уже сейчас, не дожидаясь русской версии Marlin. Настроить оценочную функцию на русскоязычные источники реально хоть завтра.

Маркетологам. Конкурентный анализ, который обычно занимает неделю у аналитика, Marlin сжимает в часы. Но ¥150 000 (примерно 95 000 рублей) в месяц за Pro-подписку, это бюджет уровня среднего агентства. Экономика имеет смысл, если стратегические отчёты у вас регулярная задача, а не разовый запрос.

Предпринимателям в РФ и СНГ. Marlin пока заточен под японский и английский рынки. Русскоязычных отчётов и локальных регуляций он не знает. Из доступных в России инструментов для глубокой аналитики через ИИ можно пробовать YandexGPT и GigaChat с ручной оркестрацией промптов, но автономного восьмичасового агента-стратега на русском языке пока нет. Именно здесь открытый TreeQuest даёт шанс: его можно развернуть локально и подключить к нужным моделям.

Мнение редакции dzen.guru

Я вижу в Marlin честный ответ на главную проблему «быстрых» ИИ-исследователей: они выдают поверхностные компиляции, а не проверенные гипотезы. Sakana сознательно выбрала медленный путь, и сам факт, что корпорации вроде MUFG и Citigroup заходят партнёрами, говорит о спросе на глубину. Для российского рынка самое ценное здесь, открытый TreeQuest. Если кто-то из команд в РФ возьмёт этот алгоритм и обернёт вокруг него русскоязычные источники и локальные данные, получится инструмент, которого сейчас просто не существует.

Создание ИИ-агентов уровня «виртуальный директор по стратегии» перестало быть лабораторной концепцией. Marlin уже работает, уже платный, а его ядро уже в открытом доступе. Кто первым адаптирует эту механику под русскоязычный рынок, получит преимущество, которое конкуренты не скопируют за вечер.

По материалам MarkTechPost

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Белый дом заставил Anthropic отключить модели для сотен миллионов пользователей за выходные

Anthropic 12 июня получила предписание Белого дома заблокировать иностранный доступ к своим новейшим моделям Fable 5 и Mythos 5, а спустя часы отключила обе…

16 июня в 04:45 МСК5 мин

Anthropic отключила модели по приказу Белого дома: какие альтернативы Claude доступны сейчас

Microsoft, Google, открытые модели и российские сервисы покрывают почти все задачи, которые раньше решал Claude, и после инцидента с Anthropic самое время…

16 июня в 04:30 МСК5 мин

Facebook запустил поиск с нейросетью: публичные посты станут сырьём для ИИ-ответов

Facebook теперь отвечает на поисковые запросы не ссылками, а текстом, который нейросеть собирает из публичных постов пользователей, и это напрямую касается…

16 июня в 04:15 МСК4 мин