Игорь Градов
Игорь Градов
5 мин
ai

Google перевела Gemini API на новый интерфейс: агентные функции доступны только через него

Google выпустила Interactions API в стабильной версии и сделала его основным интерфейсом для работы с моделями Gemini и ИИ-агентами, заменив прежний generateContent API для всех новых проектов.

Google перевела Gemini API на новый интерфейс: агентные функции доступны только через него
Почему это важно

Frontier-возможности для агентных сценариев и долгих задач теперь будут появляться только в Interactions API, а значит, разработчикам придётся переходить на новый интерфейс, если они хотят получать свежие модели первыми.

С декабря 2025 года Interactions API работал в публичной бета-версии. По данным Google, за это время он стал самым популярным способом сборки приложений на базе Gemini среди разработчиков. Теперь API получил стабильную схему и набор возможностей, которые разработчики просили в обратной связи: управляемых ИИ-агентов, фоновое выполнение задач, генерацию медиа и обновлённый Deep Research. Документация Google AI Studio по умолчанию переведена на Interactions API, а прежний generateContent API продолжит работать и получать новые модели Gemini, но без эксклюзивных агентных функций.

Что Когда Кто выпустил Цена
Interactions API (стабильная версия) Июнь 2025 (GA после бета-версии с декабря 2025) Google Два тарифа: Flex (на 50% дешевле базового) и Priority (быстрее, дороже). Gemini API key бесплатно в Google AI Studio

Что изменилось после бета-версии?

  • Управляемые ИИ-агенты (Managed Agents). Один вызов Gemini API создаёт удалённую Linux-песочницу, где агент рассуждает, выполняет код, просматривает веб и управляет файлами. По умолчанию используется агент Antigravity, но можно создать собственного с инструкциями, навыками и источниками данных.
  • Фоновое выполнение. Параметр background=True в любом вызове запускает задачу асинхронно (то есть сервер выполняет её в фоне, не заставляя ваш код ждать ответа). Для длинных агентных сценариев это критично.
  • Инструменты можно смешивать. В одном запросе теперь совмещаются встроенные инструменты Google (поиск, карты) и пользовательские функции. Результат инструмента может возвращать не только текст, но и изображения.
  • Deep Research стал глубже. Появились две версии агента (быстрая и углублённая), совместное планирование, встроенные графики и инфографика, а также мультимодальное (работающее с разными типами данных: текст, картинки, PDF, аудио) обоснование ответов.
  • Генерация медиа. Картинки через Nano Banana 2, музыка через Lyria 3, выразительная речь с поддержкой нескольких говорящих.
  • Шаги вместо ролей. Новая схема заменяет старую ролевую модель: каждое действие (ввод пользователя, размышление модели, вызов функции, ответ) теперь отдельный типизированный шаг. Миграция упрощена: Google опубликовала руководство, где каждое поле старого формата сопоставлено с новым.
  • Экономия и отладка. Тариф Flex снижает стоимость на 50% по сравнению с Priority. Ошибки теперь указывают на конкретное поле. История взаимодействий хранится 55 дней на платном тарифе.

Как попробовать за четыре шага?

  1. Получите gemini api key в Google AI Studio (бесплатно, потребуется аккаунт Google).
  2. Установите Python SDK или JavaScript SDK через менеджер пакетов вашего проекта.
  3. Следуйте документации Interactions API: минимальный вызов занимает несколько строк кода. Для модели передаёте model_id, для агента agent_id, для фоновых задач добавляете background=True.
  4. Если переходите с generateContent, откройте руководство по миграции: там каждое поле старого формата сопоставлено с новым.

Для тех, кто работает через сторонние фреймворки: LiteLLM, Eigent и Agno уже поддерживают Interactions API. Это значит, что подключение к Gemini через эти библиотеки не потребует переписывания кода с нуля.

Есть ли аналоги в России?

Параметр Interactions API (Gemini) YandexGPT API GigaChat API
Управляемые агенты с песочницей Да (Managed Agents) Нет на момент публикации Нет на момент публикации
Фоновое выполнение background=True Асинхронный режим доступен Асинхронный режим доступен
Генерация изображений и музыки через один API Да Отдельные сервисы (YandexART) Отдельные сервисы
Доступ из РФ Требуется VPN и зарубежный аккаунт Без ограничений Без ограничений

Прямого аналога Managed Agents, когда один вызов API разворачивает полноценную песочницу с браузером и файловой системой, у российских провайдеров пока нет. Но для базовых задач (генерация текста, работа с промптами, простые цепочки вызовов) YandexGPT и GigaChat остаются рабочими вариантами без проблем с доступом.

Что делать с этим прямо сейчас, по ролям?

Автору на Дзене. Если вы используете нейросети для генерации черновиков или картинок, Interactions API пока избыточен: он заточен под код. Но если вы экспериментируете с ИИ-агентами для автоматизации рутины (сбор информации, подготовка фактуры), попробуйте Deep Research через Google AI Studio: он теперь работает с PDF и аудио.

Разработчику. Параметр background=True решает конкретную боль: длинные агентные цепочки больше не блокируют поток. Если вы работаете через LiteLLM или Agno, интеграция уже готова. Получите gemini api key и протестируйте Managed Agents в песочнице.

Предпринимателю в РФ. Доступ к Gemini API из России остаётся непрямым. Для продакшена, где важна стабильность и легальность, YandexGPT и GigaChat надёжнее. Для R&D и прототипов Interactions API даёт возможности, которых у российских аналогов пока нет.

Мнение редакции dzen.guru

Google делает ставку на агентную архитектуру и прямо говорит: новые возможности для сложных сценариев будут появляться только в Interactions API. Это не косметическое обновление, а смена рельсов. Кто строит на generateContent, пока может не спешить, старый API обещают поддерживать. Но откладывать миграцию на год я бы не стал: когда нужная модель выйдет только в новом формате, переписывать придётся в спешке.

Оговорка: Gemini Omni, одна из анонсированных возможностей, отмечена как «скоро» без даты. Тариф Flex снижает стоимость на 50%, но Google не опубликовала абсолютные цены в этом анонсе, проверяйте в документации на момент использования.

Мой совет: получите gemini api key, запустите один тестовый вызов через Interactions API и сравните с тем, как вы работаете сейчас. Десять минут покажут, стоит ли переходить уже или подождать.

Частые вопросы

Старый generateContent API перестанет работать?

Нет. Google прямо заявила, что generateContent остаётся полностью поддерживаемым и будет получать новые модели Gemini. Но эксклюзивные возможности для агентов и долгих задач будут появляться только в Interactions API.

Нужно ли переписывать весь код при переходе?

Не обязательно сразу. Google опубликовала руководство по миграции, где каждое поле старого формата сопоставлено с новым. В документации есть переключатель, который показывает примеры кода и в старом, и в новом формате. Переходить можно постепенно.

Можно ли использовать Interactions API из России?

Формально Gemini API требует зарубежного аккаунта Google. Для экспериментов и прототипов это решается, для коммерческих проектов с российскими пользователями стоит учитывать риски и рассмотреть YandexGPT или GigaChat как основной канал, а Gemini как дополнительный.

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Codex записал 37 ТБ логов за 3 недели: главные проблемы AI агентов не в модели
ai

Codex записал 37 ТБ логов за 3 недели: главные проблемы AI агентов не в модели

Codex от OpenAI за три недели записал на пользовательский SSD 37 терабайт диагностических логов, и этот случай показал одну из самых недооценённых проблем…

6 мин
Hugging Face Hub перешёл на еженедельные релизы: весь конвейер собран на открытых моделях
ai

Hugging Face Hub перешёл на еженедельные релизы: весь конвейер собран на открытых моделях

Российские разработчики, работающие с открытыми библиотеками машинного обучения, теперь могут взять за основу готовый рабочий процесс еженедельного релиза…

5 мин
Prime Intellect открыла обучение нейросетей с триллионом параметров на 28 узлах вместо сотен
ai

Prime Intellect открыла обучение нейросетей с триллионом параметров на 28 узлах вместо сотен

Компания Prime Intellect выпустила версию 0.6.0 своего открытого фреймворка prime-rl, и теперь разработчики могут запускать обучение с подкреплением на моделях…

6 мин