ГЛМ 5.2 получила контекст в миллион токенов: целый проект помещается в одну сессию
GLM 5.2 от Z.ai вышла 13 июня 2026 года с контекстным окном в миллион токенов и совместимостью с Claude Code и Cline, что даёт разработчикам и авторам запасной маршрут при перебоях с API OpenAI и Anthropic.

Миллион токенов (токен — это примерно одно слово или его часть) позволяют загрузить в модель целый проект или книгу целиком, а не скармливать по кусочкам. Для тех, кто работает через Claude Code или Cline, переключение занимает замену двух строк в конфиге.
Китайская компания Z.ai выпустила ГЛМ 5.2 — четвёртую крупную модель в линейке GLM-5 за четыре месяца. До неё вышли GLM-5 (11 февраля), GLM-5-Turbo (15 марта) и GLM-5.1 (7 апреля). По данным MarkTechPost, новинка доступна сразу на всех тарифах GLM Coding Plan: Lite, Pro, Max, Team. Бенчмарков (публичных тестов производительности вроде SWE-bench или Terminal-Bench) на момент запуска компания не представила.
Миллион токенов на практике — зачем столько?
Предыдущая GLM-5.1 работала с окном в 200 000 токенов. ГЛМ 5.2 увеличила его в пять раз, до 1 000 000. Максимальный ответ модели — до 131 072 токенов.
Что это значит в быту:
- Целый средний репозиторий кода — исходники, тесты, конфигурации и история диалога — помещается в одну сессию без принудительного сжатия
- Длинные документы, логи, стенограммы свыше 200 000 токенов больше не обрезаются
- ИИ-агент (программа, которая сама выполняет цепочку действий) удерживает контекст на протяжении многошаговых задач
По данным сообщества, базовая архитектура GLM-5 — модель типа Mixture-of-Experts (смесь экспертов, когда модель «включает» только часть своих параметров на каждый запрос) с 744 миллиардами параметров, из которых на один токен активируются 40 миллиардов. Z.ai не уточнила, изменилась ли архитектура в версии 5.2.
| Что | Когда | Кто выпустил | Цена |
|---|---|---|---|
| GLM 5.2 с контекстом 1 млн токенов | 13 июня 2026 | Z.ai | Доступна на тарифах Lite, Pro, Max, Team; точные цены компания не назвала |
Что нового?
- Контекстное окно 1 000 000 токенов — вариант обозначается как
glm-5.2[1m]в конфигурации - Максимальный ответ до 131 072 токенов — можно получить развёрнутый вывод без обрезки
- Два уровня «усилия мышления»: High и Max — Z.ai рекомендует Max для сложных многошаговых задач с кодом
- Совместимость с восемью агентными инструментами — Claude Code, Cline, OpenCode и OpenClaw с первого дня
- Подключение через Anthropic-совместимый эндпоинт — замена базового URL и идентификатора модели, без переписывания рабочего процесса
- Бенчмарки не опубликованы — ни SWE-bench, ни Terminal-Bench, ни Code Arena на момент запуска
Как попробовать?
- Для Claude Code. Откройте файл
~/.claude/settings.jsonи замените модели Sonnet и Opus наglm-5.2[1m]. Поднимите параметрCLAUDE_CODE_AUTO_COMPACT_WINDOWдо1000000, чтобы агент использовал весь контекст. Альтернативно — задайте переменные окружения:ANTHROPIC_BASE_URLнаhttps://api.z.ai/api/anthropic, укажите свой API-ключ Z.ai и запуститеclaude - Для Cline. Выберите провайдер OpenAI Compatible. Базовый URL —
https://api.z.ai/api/coding/paas/v4. Модель —glm-5.2, контекст —1000000 - Проверка. В сессии Claude Code выполните команду
/effortи выберитеmax. Затем/status, чтобы убедиться, что активна именно GLM 5.2
Стоит ли сравнивать с YandexGPT и GigaChat?
Прямое сравнение здесь некорректно: ГЛМ 5.2 заточена под агентную работу с кодом и миллионный контекст, тогда как YandexGPT и GigaChat решают другие задачи и доступны в РФ без VPN. Но для понимания масштаба:
| Параметр | GLM 5.2 | YandexGPT (актуальная версия) | GigaChat |
|---|---|---|---|
| Контекстное окно | 1 000 000 токенов | Компания не раскрывает точное число публично | До 32 768 токенов по открытым данным |
| Агентная работа с кодом | Совместимость с Claude Code, Cline, OpenCode | Не заявлена | Не заявлена |
| Доступ из РФ | Через API Z.ai, может потребоваться VPN | Без ограничений | Без ограничений |
Если вы работаете с текстами на русском и не пишете код, YandexGPT и GigaChat закрывают большинство задач. ГЛМ 5.2 актуальна тем, кому нужен именно длинный контекст для кода или анализа больших документов.
Четыре крупных релиза за четыре месяца — Z.ai явно торопится занять нишу «альтернативный Claude для кодеров». Отсутствие бенчмарков на старте настораживает: компания просит верить на слово, что модель не хуже предшественницы.
Но практическая ценность для нашей аудитории есть. Если вы пользуетесь Claude Code и периодически сталкиваетесь с перебоями API Anthropic или OpenAI, ГЛМ 5.2 работает как запасной вариант с заменой двух строк конфига. Я бы рекомендовал попробовать на некритичном проекте, прежде чем переводить рабочие задачи: без публичных тестов сложно оценить качество на длинных сессиях.
Авторам Дзена, которые не пишут код: пока модель заточена под разработку, для генерации текстов она избыточна. Подождите, пока появятся бенчмарки и отзывы на текстовых задачах.
Маркетологам и предпринимателям: если у вас в команде есть разработчик, который работает через Claude Code, покажите ему эту новость. Резервный доступ к рабочему инструменту за пять минут настройки — это страховка, а не эксперимент.
Частые вопросы
GLM 5.2 бесплатна?
Модель доступна на всех тарифах GLM Coding Plan (Lite, Pro, Max, Team). Точные цены за токены Z.ai в анонсе не указала. Для проверки нужен API-ключ Z.ai.
Можно ли использовать без Claude Code или Cline?
Да. Z.ai заявляет совместимость с восемью агентными инструментами, включая OpenCode и OpenClaw. Подключение идёт через Anthropic-совместимый эндпоинт или OpenAI-совместимый провайдер.
Насколько модель надёжна без публичных бенчмарков?
Это открытый вопрос. Z.ai не представила результатов SWE-bench, Terminal-Bench или Code Arena. Предыдущая GLM-5.1, по данным сообщества, выдерживала до 1 700 агентных шагов и автономные циклы до восьми часов. Повторит ли это ГЛМ 5.2, пока неизвестно. Совет: тестируйте на второстепенных задачах, а рабочие проекты переводите после появления независимых замеров.
По материалам MarkTechPost

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

150 000 сокращений в AI и IT с начала 2026: рынок платит за увольнения ростом акций
Компании по всему миру фиксируют рекордную выручку и одновременно увольняют десятки тысяч сотрудников, называя причиной искусственный интеллект, но реальные…

Ограничения искусственного интеллекта: упражнение на 15 минут, которое делает промпты точнее
Статья-оригинал на Хабре представляет собой философское эссе с переводом Reddit-поста, а не новость с конкретными фактами, числами или датами. Архетип задан…
Создание ИИ-агентов на практике: 60+ статей Хабра закрывают разрыв с англоязычными гайдами
Мультимодальные модели и ИИ-агенты учатся видеть, слышать и читать код одновременно, и русскоязычное сообщество на Хабре за полтора месяца собрало больше 60…
Комментарии