Игорь Градов
Игорь Градов
4 мин
aggregator

GLM нейросеть догнала GPT-5.5 и Opus 4.8: открытая модель впервые заменяет платные API

GLM нейросеть Zhipu выпустила версию 5.2, и независимые тесты показали, что эта открытая модель работает на уровне закрытых лидеров рынка, включая GPT-5.5 и Opus 4.8, а сообщество впервые признало её пригодной для ежедневной работы.

GLM нейросеть догнала GPT-5.5 и Opus 4.8: открытая модель впервые заменяет платные API
Почему это важно

Открытые модели (открытые веса, код доступен для скачивания) годами уступали закрытым сервисам в реальных задачах. GLM-5.2 первой из них получила массовое подтверждение от практиков, что разрыв закрылся, и это меняет экономику для всех, кто зависит от платных API.

Обычно история с открытыми моделями развивается по одному сценарию: громкий релиз, красивые результаты на бенчмарках (стандартных тестах производительности), а через месяц модель забывают. Издание Latent Space называет это «бенчмаксингом», натаскиванием на тесты без реальной пользы. GLM нейросеть версии 5.2 от китайской компании Zhipu, судя по реакции сообщества и независимым замерам, этот цикл сломала.

Главные цифры

Показатель Значение Источник
Позиция в тесте на «агентную» работу со знаниями Между GPT-5.5 и Opus 4.8 Artificial Analysis
Внутренние задачи: рост от GLM-5.1 к GLM-5.2 С 21/70 до 48/70 @ZixuanLi_ (команда Zhipu)
Контекстное окно (максимум токенов за один запрос) 1 млн токенов Latent Space
Цена доступа через Hugging Face Бесплатно (ограниченное время) Latent Space

Что измеряли?

Artificial Analysis, независимая платформа оценки ИИ-моделей, запустила новый бенчмарк, ориентированный на «агентную работу со знаниями». Это не абстрактные задачи на логику: модель проверяют на том, как она справляется с рабочими сценариями, поиском информации, обработкой документов, выполнением цепочек действий.

Параллельно практики проверяли GLM нейросеть в повседневных задачах. Джереми Ховард, известный исследователь и преподаватель глубокого обучения, оценил её как «не хуже Opus 4.8 и GPT-5.5» для своих задач. Разработчик Мат Веллосо назвал GLM-5.2 первой открытой моделью, которую он готов использовать как основной инструмент каждый день.

Сообщество r/LocalLlama на Reddit, один из главных форумов для тех, кто запускает модели локально, также подтвердило качество.

Что обнаружили?

  • Уровень закрытых лидеров. По данным Artificial Analysis, GLM-5.2 расположилась между GPT-5.5 и Opus 4.8 на новом бенчмарке агентной работы со знаниями.
  • Скачок от предыдущей версии. Внутренние тесты Zhipu показали рост с 21 из 70 задач (GLM-5.1) до 48 из 70 (GLM-5.2), по данным члена команды @ZixuanLi_.
  • Архитектурное нововведение. GLM-5.2 использует механизм IndexShare: модель переиспользует индексы разреженного внимания (sparse attention, метод, при котором модель фокусируется не на всём тексте, а на ключевых фрагментах) между группами слоёв. Это снижает стоимость обработки длинных текстов до 1 млн токенов (токен, минимальная единица текста для модели, примерно три четверти слова).
  • Главный пробел. Джереми Ховард отметил отсутствие поддержки изображений: GLM-5.2 пока не мультимодальная (мультимодальная, способная работать и с текстом, и с картинками).
  • Доступность. Модель выложена на Hugging Face, бесплатна через Inference Providers на ограниченный период. Поддерживается локальный запуск через llama.cpp и Unsloth в формате GGUF.
Как это читать

Бенчмарк Artificial Analysis новый, и его методология пока не прошла широкую независимую проверку. Оценки практиков субъективны: «не хуже GPT-5.5» для задач конкретного пользователя не означает превосходства во всех сценариях. У модели нет поддержки изображений, что для многих задач критично. Бесплатный доступ через Hugging Face ограничен по времени, постоянные условия Zhipu пока не объявила.

Что это значит для вас?

Авторам Дзена и копирайтерам. GLM-5.2 можно скачать и запустить локально. Если вы пишете большие тексты и не хотите платить за каждый запрос к GPT или Claude, это первая открытая модель, о которой практики говорят как о реальной замене. Попробовать можно бесплатно через Hugging Face, но учтите: для локального запуска нужна мощная видеокарта или облачный сервер.

Маркетологам. Модель с контекстом в 1 млн токенов способна обработать целую базу знаний за один запрос. Для задач, где нужен анализ документов, FAQ, длинных брифов, это снимает ограничение, с которым до сих пор справлялись только платные сервисы.

Предпринимателям в РФ и СНГ. Открытые веса означают, что модель можно развернуть на своих серверах, без зависимости от зарубежных API, которые могут закрыть доступ. Из доступных в РФ аналогов, YandexGPT и GigaChat, оба закрытые, то есть работают только через API провайдера. GLM-5.2 даёт альтернативу для тех, кому нужен полный контроль над инфраструктурой.

Мнение редакции dzen.guru

Я слежу за открытыми моделями с первых дней LLaMA, и каждый раз история повторялась: красивые цифры на бенчмарках, потом разочарование в реальной работе. GLM-5.2 выглядит иначе, не потому что цифры другие, а потому что практики, которые обычно скептичны, сами перешли на неё в повседневных задачах. Для российского рынка это практичный сигнал: если вы строите продукт на ИИ и боитесь зависимости от OpenAI или Anthropic, сейчас впервые есть открытая модель, которую стоит тестировать всерьёз. Но без иллюзий: отсутствие работы с изображениями и неизвестная цена после промопериода могут изменить расклад.

Zhipu продолжает наращивать темп: разрыв между GLM-5.0 и GLM-5.2 занял считанные месяцы, и если следующая версия закроет пробел с мультимодальностью, у закрытых лабораторий станет на один аргумент в пользу подписки меньше.

По материалам Latent Space

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Искусственный интеллект это наука: ИИ-лаборатория Radical AI создала 1200 сплавов за полгода
aggregator

Искусственный интеллект это наука: ИИ-лаборатория Radical AI создала 1200 сплавов за полгода

Компания Radical AI построила лабораторию, где ИИ-учёный сам выдвигает гипотезы, а роботы тут же синтезируют и проверяют новые сплавы, и за полгода эта связка…

5 мин
SpaceX купила Cursor редактор за $60 млрд акциями: Маск строит свой ИИ-стек для кода
aggregator

SpaceX купила Cursor редактор за $60 млрд акциями: Маск строит свой ИИ-стек для кода

Cursor редактор кода, который массово используют разработчики по всему миру, перешёл под контроль SpaceX: компания Илона Маска заплатила за стартап 60…

4 мин
aggregator

Sequent собирает $150 млн на независимую безопасность ИИ: лаборатории не справляются сами

Microsoft представила новую модель, которая рассуждает сама, а Sequent предлагает альтернативный путь к безопасности ИИ. Группа исследователей из Британского…

5 мин