Игорь Градов

15 июня 2026 г. в 10:15 МСК5 мин

ГЛМ 5.2 получила контекст в миллион токенов: целый проект помещается в одну сессию

GLM 5.2 от Z.ai вышла 13 июня 2026 года с контекстным окном в миллион токенов и совместимостью с Claude Code и Cline, что даёт разработчикам и авторам запасной маршрут при перебоях с API OpenAI и Anthropic.

Почему это важно

Миллион токенов (токен — это примерно одно слово или его часть) позволяют загрузить в модель целый проект или книгу целиком, а не скармливать по кусочкам. Для тех, кто работает через Claude Code или Cline, переключение занимает замену двух строк в конфиге.

Китайская компания Z.ai выпустила ГЛМ 5.2 — четвёртую крупную модель в линейке GLM-5 за четыре месяца. До неё вышли GLM-5 (11 февраля), GLM-5-Turbo (15 марта) и GLM-5.1 (7 апреля). По данным MarkTechPost, новинка доступна сразу на всех тарифах GLM Coding Plan: Lite, Pro, Max, Team. Бенчмарков (публичных тестов производительности вроде SWE-bench или Terminal-Bench) на момент запуска компания не представила.

Миллион токенов на практике — зачем столько?

Предыдущая GLM-5.1 работала с окном в 200 000 токенов. ГЛМ 5.2 увеличила его в пять раз, до 1 000 000. Максимальный ответ модели — до 131 072 токенов.

Что это значит в быту:

Целый средний репозиторий кода — исходники, тесты, конфигурации и история диалога — помещается в одну сессию без принудительного сжатия
Длинные документы, логи, стенограммы свыше 200 000 токенов больше не обрезаются
ИИ-агент (программа, которая сама выполняет цепочку действий) удерживает контекст на протяжении многошаговых задач

По данным сообщества, базовая архитектура GLM-5 — модель типа Mixture-of-Experts (смесь экспертов, когда модель «включает» только часть своих параметров на каждый запрос) с 744 миллиардами параметров, из которых на один токен активируются 40 миллиардов. Z.ai не уточнила, изменилась ли архитектура в версии 5.2.

Что	Когда	Кто выпустил	Цена
GLM 5.2 с контекстом 1 млн токенов	13 июня 2026	Z.ai	Доступна на тарифах Lite, Pro, Max, Team; точные цены компания не назвала

Что нового?

Контекстное окно 1 000 000 токенов — вариант обозначается как glm-5.2[1m] в конфигурации
Максимальный ответ до 131 072 токенов — можно получить развёрнутый вывод без обрезки
Два уровня «усилия мышления»: High и Max — Z.ai рекомендует Max для сложных многошаговых задач с кодом
Совместимость с восемью агентными инструментами — Claude Code, Cline, OpenCode и OpenClaw с первого дня
Подключение через Anthropic-совместимый эндпоинт — замена базового URL и идентификатора модели, без переписывания рабочего процесса
Бенчмарки не опубликованы — ни SWE-bench, ни Terminal-Bench, ни Code Arena на момент запуска

Как попробовать?

Для Claude Code. Откройте файл ~/.claude/settings.json и замените модели Sonnet и Opus на glm-5.2[1m]. Поднимите параметр CLAUDE_CODE_AUTO_COMPACT_WINDOW до 1000000, чтобы агент использовал весь контекст. Альтернативно — задайте переменные окружения: ANTHROPIC_BASE_URL на https://api.z.ai/api/anthropic, укажите свой API-ключ Z.ai и запустите claude
Для Cline. Выберите провайдер OpenAI Compatible. Базовый URL — https://api.z.ai/api/coding/paas/v4. Модель — glm-5.2, контекст — 1000000
Проверка. В сессии Claude Code выполните команду /effort и выберите max. Затем /status, чтобы убедиться, что активна именно GLM 5.2

Стоит ли сравнивать с YandexGPT и GigaChat?

Прямое сравнение здесь некорректно: ГЛМ 5.2 заточена под агентную работу с кодом и миллионный контекст, тогда как YandexGPT и GigaChat решают другие задачи и доступны в РФ без VPN. Но для понимания масштаба:

Параметр	GLM 5.2	YandexGPT (актуальная версия)	GigaChat
Контекстное окно	1 000 000 токенов	Компания не раскрывает точное число публично	До 32 768 токенов по открытым данным
Агентная работа с кодом	Совместимость с Claude Code, Cline, OpenCode	Не заявлена	Не заявлена
Доступ из РФ	Через API Z.ai, может потребоваться VPN	Без ограничений	Без ограничений

Если вы работаете с текстами на русском и не пишете код, YandexGPT и GigaChat закрывают большинство задач. ГЛМ 5.2 актуальна тем, кому нужен именно длинный контекст для кода или анализа больших документов.

Мнение редакции dzen.guru

Четыре крупных релиза за четыре месяца — Z.ai явно торопится занять нишу «альтернативный Claude для кодеров». Отсутствие бенчмарков на старте настораживает: компания просит верить на слово, что модель не хуже предшественницы.

Но практическая ценность для нашей аудитории есть. Если вы пользуетесь Claude Code и периодически сталкиваетесь с перебоями API Anthropic или OpenAI, ГЛМ 5.2 работает как запасной вариант с заменой двух строк конфига. Я бы рекомендовал попробовать на некритичном проекте, прежде чем переводить рабочие задачи: без публичных тестов сложно оценить качество на длинных сессиях.

Авторам Дзена, которые не пишут код: пока модель заточена под разработку, для генерации текстов она избыточна. Подождите, пока появятся бенчмарки и отзывы на текстовых задачах.

Маркетологам и предпринимателям: если у вас в команде есть разработчик, который работает через Claude Code, покажите ему эту новость. Резервный доступ к рабочему инструменту за пять минут настройки — это страховка, а не эксперимент.

Частые вопросы

GLM 5.2 бесплатна?

Модель доступна на всех тарифах GLM Coding Plan (Lite, Pro, Max, Team). Точные цены за токены Z.ai в анонсе не указала. Для проверки нужен API-ключ Z.ai.

Можно ли использовать без Claude Code или Cline?

Да. Z.ai заявляет совместимость с восемью агентными инструментами, включая OpenCode и OpenClaw. Подключение идёт через Anthropic-совместимый эндпоинт или OpenAI-совместимый провайдер.

Насколько модель надёжна без публичных бенчмарков?

Это открытый вопрос. Z.ai не представила результатов SWE-bench, Terminal-Bench или Code Arena. Предыдущая GLM-5.1, по данным сообщества, выдерживала до 1 700 агентных шагов и автономные циклы до восьми часов. Повторит ли это ГЛМ 5.2, пока неизвестно. Совет: тестируйте на второстепенных задачах, а рабочие проекты переводите после появления независимых замеров.

По материалам MarkTechPost

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

150 000 сокращений в AI и IT с начала 2026: рынок платит за увольнения ростом акций

Компании по всему миру фиксируют рекордную выручку и одновременно увольняют десятки тысяч сотрудников, называя причиной искусственный интеллект, но реальные…

15 июня в 11:15 МСК6 мин

Ограничения искусственного интеллекта: упражнение на 15 минут, которое делает промпты точнее

Статья-оригинал на Хабре представляет собой философское эссе с переводом Reddit-поста, а не новость с конкретными фактами, числами или датами. Архетип задан…

15 июня в 10:45 МСК6 мин

Создание ИИ-агентов на практике: 60+ статей Хабра закрывают разрыв с англоязычными гайдами

Мультимодальные модели и ИИ-агенты учатся видеть, слышать и читать код одновременно, и русскоязычное сообщество на Хабре за полтора месяца собрало больше 60…

15 июня в 09:45 МСК5 мин