Кодовые модели ИИ с открытыми весами: Moonshot AI выложила триллион параметров за $0,19 за 1 млн токенов
Moonshot AI, китайский разработчик, 12 июня выпустила Kimi K2.7-Code, кодовую модель ИИ с открытыми весами и триллионом параметров, нацеленную на многошаговую разработку, а не на обычный чат.

Кодовые модели ИИ с открытыми весами такого масштаба до сих пор выпускали единицы, и появление конкурента, который по собственным тестам обходит Claude Opus 4.8 на агентных задачах, расширяет выбор для тех, кто не хочет зависеть от закрытых API.
До сих пор рынок кодовых моделей ИИ делили преимущественно закрытые решения OpenAI и Anthropic. Moonshot AI, известная моделями линейки Kimi, выложила K2.7-Code на Hugging Face под модифицированной лицензией MIT. Как сообщает MarkTechPost, модель также доступна через собственный API, совместимый с форматом OpenAI, и через платформу Kimi Code.
| Что | Когда | Кто выпустил | Цена |
|---|---|---|---|
| Kimi K2.7-Code, кодовая модель с открытыми весами | 12 июня 2026 | Moonshot AI (Китай) | $0,19 за 1 млн токенов кэшированного ввода (по данным Moonshot AI) |
Что умеет K2.7-Code?
-
Архитектура MoE (Mixture-of-Experts, «смесь экспертов», когда модель хранит много блоков знаний, но на каждый запрос включает лишь часть из них). Всего триллион параметров, но на один токен активируются только 32 миллиарда. 384 эксперта, из них 8 выбираются на каждый токен плюс 1 общий. 61 слой, включая 1 плотный.
-
Контекстное окно 256 тысяч токенов. Это позволяет загрузить в один промпт большой репозиторий, логи, скриншоты и видео одновременно, модель принимает текст, изображения и видео благодаря встроенному визуальному кодировщику MoonViT (400 млн параметров).
-
На 30% меньше «мыслительных» токенов, чем у предшественника K2.6 (по данным Moonshot AI). Рассуждающие токены (reasoning tokens, те, что модель тратит на внутренние размышления перед ответом) оплачиваются как выходные. При агентной работе модель проходит сотни шагов, и сокращение на треть снижает стоимость каждого прогона.
-
Рост на Kimi Code Bench v2: с 50,9 до 62,0 по сравнению с K2.6 (данные Moonshot AI). На бенчмарке MCP Mark Verified (тест на корректный вызов инструментов через Model Context Protocol, стандарт, по которому модель управляет внешними сервисами) K2.7-Code набрала 81,1 против 76,4 у Claude Opus 4.8.
-
Режим рассуждений включён принудительно. Его нельзя отключить, попытка вернёт ошибку API. Параметры генерации тоже зафиксированы: температура 1.0, top_p 0.95. Менять их нельзя.
Все опубликованные бенчмарки проведены самой Moonshot AI. Независимые измерения на момент публикации отсутствуют, и это главная оговорка.
Как попробовать?
-
Через API. Зарегистрируйтесь на platform.moonshot.ai, получите ключ. Модель вызывается строкой
kimi-k2.7-codeчерез стандартную библиотеку OpenAI для Python. Формат запросов совместим, менять код почти не нужно. -
Через платформу Kimi Code. Moonshot AI предлагает подписную среду для кодинга, где модель уже встроена. Подробности на сайте Kimi Code.
-
Самостоятельный хостинг. Веса лежат на Hugging Face, но занимают около 595 ГБ. Поддерживаются фреймворки vLLM, SGLang и KTransformers. Это серверное решение, не для ноутбука.
Сравнение с российскими аналогами
Прямого аналога кодовой модели ИИ такого масштаба с открытыми весами в России пока нет. YandexGPT и GigaChat умеют генерировать код, но не позиционируются как агентные кодовые модели для многошаговой разработки.
| Параметр | Kimi K2.7-Code | YandexGPT / GigaChat |
|---|---|---|
| Специализация | Кодинг, агентная многошаговая работа | Генеральные задачи, код как одна из функций |
| Открытые веса | Да (Hugging Face, модиф. MIT) | Нет |
| Контекст | 256 тыс. токенов | Меньше (точные значения зависят от версии) |
| Доступность в РФ | API доступен, самохостинг возможен | Нативно доступны, серверы в РФ |
Для разработчиков из РФ и СНГ K2.7-Code интересна именно тем, что веса можно скачать и развернуть на своём сервере без зависимости от зарубежного облака.
Триллион параметров с открытыми весами для кодинга, это заявка. Но пока все цифры идут от самой Moonshot AI, и я бы подождал независимых тестов, прежде чем перестраивать под неё рабочий процесс. Режим рассуждений, который нельзя выключить, и жёстко зафиксированные параметры генерации ограничивают гибкость: для экспериментов с промптами это неудобно.
Что сделать сегодня:
- Автору на Дзене. Если вы пишете про технологии или обучаете, попробуйте через API простой запрос на рефакторинг своего скрипта. Это даст материал для поста с личным опытом.
- Разработчику и маркетологу. Оцените стоимость: $0,19 за миллион кэшированных входных токенов ниже, чем у большинства закрытых моделей. Для автоматизации код-ревью или CI-проверок (автоматических проверок кода перед выпуском) это может быть выгодно.
- Предпринимателю в РФ. Скачать 595 ГБ весов и поднять на своём сервере реально, но потребуется серверное железо с большим объёмом видеопамяти. Зато данные не уходят за рубеж.
Частые вопросы
Можно ли запустить Kimi K2.7-Code на обычном компьютере?
Нет. Веса занимают около 595 ГБ, даже со встроенной квантизацией INT4 (сжатие модели до 4-битных чисел для экономии памяти). Нужен сервер с мощными GPU. Moonshot AI прямо указывает, что это не модель для ноутбука.
Чем K2.7-Code отличается от обычного чат-бота?
Модель заточена на агентную (agentную) работу с кодом: она планирует, редактирует файлы, запускает инструменты и отлаживает ошибки за много шагов. Обычный чат-бот отвечает на один вопрос за раз. K2.7-Code ближе к автономному программисту, который сам ведёт задачу от теста до зелёного билда.
Все ли тесты производительности достоверны?
На момент публикации все бенчмарки проведены командой Moonshot AI. Независимых подтверждений пока нет. Это стандартная ситуация для дня запуска, но принимать цифры за истину стоит с оговоркой.
Появление кодовых моделей ИИ такого класса с открытыми весами расширяет пространство выбора, и тем, кто строит внутренние инструменты для разработки, стоит как минимум протестировать API на реальной задаче, пока независимые бенчмарки ещё в пути.
По материалам MarkTechPost

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».
Читайте также

Минторг США впервые отключил нейросеть Claude после запуска: модели проработали 3 дня
Anthropic 12 июня 2026 года отключила Claude Fable 5 и Claude Mythos 5 для всех пользователей без исключения после того, как Министерство торговли США…

США впервые приравняли Anthropic Claude к стратегическому оружию: доступ закрыт даже для своих
Anthropic Claude Fable 5 и Claude Mythos 5 стали первыми ИИ-моделями, которые правительство США приравняло к стратегическим технологиям и закрыло для…

Искусственный интеллект подводит разработчиков: два провала показали цену кода без инженерного контроля
Искусственный интеллект обещает заменить разработчиков, но первые же AI-проекты без инженерного контроля разваливаются на практике, и сейчас, когда бизнес…
Комментарии