Игорь Градов

22 июня 2026 г. в 08:45 МСК5 мин

Стоимость токена zoo на своём сервере: от 10 до 60 ₽ за миллион, считает NeuralDeep

Компания NeuralDeep опубликовала 20 июня 2026 года подробный расчёт себестоимости токена (минимальной единицы текста, которую обрабатывает нейросеть) на собственном сервере в Санкт-Петербурге, и результат оказался полезнее любых маркетинговых прайсов: нижняя граница выходного токена по электричеству составила 10,76 рубля за миллион.

Почему это важно

Пока провайдеры называют розничные цены с маржой, этот расчёт впервые показывает «бэдрок», физический минимум, ниже которого токен стоить не может, и позволяет любому автору или предпринимателю понять, переплачивает он за API или нет.

Расчёт появился после волны обсуждений о росте цен на подписки и экономику языковых моделей. Автор, участник проекта NeuralDeep, намеренно убрал из формулы обучение моделей, зарплаты, аренду, маркетинг и юридические расходы, оставив только два слоя: электричество и амортизацию оборудования. Источник публикации: канал NeuralDeep.

Что	Когда	Кто считал	Стоимость токена (выход)
Нижняя граница по электричеству	20 июня 2026	NeuralDeep, Санкт-Петербург	10,76 ₽ за 1 млн токенов
С учётом амортизации за 5 лет	20 июня 2026	NeuralDeep	60,08 ₽ за 1 млн токенов

Как устроен расчёт и почему железо дороже розетки?

Формула простая: стоимость часа работы сервера делится на количество токенов, которое он за этот час генерирует. Результат умножается на миллион, чтобы получить стоимость токена zoo в привычном формате «цена за 1M токенов».

Сервер собран из двух модифицированных видеокарт RTX 4090 с 48 ГБ видеопамяти каждая. На них помещается модель GPT-OSS-120B (открытая модель со 120 миллиардами параметров) с контекстом до 131 тысячи токенов.

Потребление в работе. Пиковая мощность системы составляет 1 100 ватт, но через утилиту nvidia-smi мощность карт снижена с 450 до 250 ватт для уменьшения шума и износа. Реальное потребление при инференсе (генерации ответа нейросетью) не превышает 500 ватт.
Тариф. 6,97 рубля за киловатт-час по питерскому тарифу. Час работы сервера обходится в 3,49 рубля.
Скорость генерации. 90 выходных токенов в секунду в один поток. Обработка входного промпта (промпт, текст-инструкция для нейросети) идёт быстрее: около 1 440 токенов в секунду.

Только по электричеству миллион выходных токенов стоит 10,76 рубля, а миллион входных, всего 0,67 рубля.

Амортизация меняет картину в шесть раз

Сервер стоит примерно 700 тысяч рублей:

Две модифицированные RTX 4090 48 ГБ по 300 тысяч, итого 600 тысяч рублей.
Корпус, материнская плата, процессор, диск, память и блок питания на 1 200 ватт, ещё около 100 тысяч.

При списании за 5 лет непрерывной работы (43 800 часов) амортизация составляет примерно 15,98 рубля в час. Это почти в пять раз больше, чем электричество с его 3,49 рубля.

Итого с амортизацией: стоимость токена zoo для выхода вырастает с 10,76 до 60,08 рубля за миллион. Входной токен с амортизацией обходится около 3,75 рубля за миллион. Если сервер половину времени простаивает, амортизация на токен удваивается: 700 тысяч никуда не денутся, а полезных токенов выйдет вдвое меньше.

Сколько берут провайдеры?

Автор сравнил свою себестоимость с розничными ценами на ту же модель GPT-OSS-120B (курс ЦБ РФ на 20 июня 2026 года: 73,44 рубля за доллар).

Провайдер	Вход (₽ за 1M токенов)	Выход (₽ за 1M токенов)
Себестоимость NeuralDeep (электричество)	0,67	10,76
Себестоимость NeuralDeep (с амортизацией)	3,75	60,08
OpenRouter (агрегатор)	2,86	13,22
Яндекс AI Studio (синхронный, с НДС)	300	300
Cloud.ru (Evolution Foundation Models)	15,86	61

По данным автора, у разных провайдеров на OpenRouter цена выхода колеблется от 0,05 до 0,45 доллара за миллион токенов. Cloud.ru также предлагает партнёрскую программу с ценами вдвое ниже указанных.

Как попробовать самому?

Откройте формулу: (мощность в кВт × тариф за кВт·ч) / (скорость генерации в токенах/с × 3 600) × 1 000 000. Подставьте свои значения мощности, тарифа и скорости.
Узнайте реальное потребление своей видеокарты при инференсе через nvidia-smi (команда в терминале для карт NVIDIA).
Добавьте амортизацию: стоимость оборудования разделите на количество часов эксплуатации (для 5 лет это 43 800 часов) и прибавьте к стоимости электричества за час.

Что делать с этим прямо сейчас?

Авторам Дзена. Если вы пользуетесь API для генерации черновиков или рерайта, сравните свой тариф с нижней границей. Цена ниже 10 рублей за миллион выходных токенов означает, что провайдер либо субсидирует доступ, либо использует более дешёвое оборудование.

Маркетологам. Таблица выше позволяет быстро оценить, где маржа провайдера минимальна (OpenRouter), а где она кратно выше (Яндекс AI Studio). При больших объёмах разница в сотни рублей за миллион токенов превращается в ощутимый бюджет.

Предпринимателям в РФ. Собственный сервер за 700 тысяч рублей при полной загрузке даёт стоимость токена zoo дешевле, чем у большинства российских облачных провайдеров. Но при загрузке ниже 50% экономика рушится: амортизация удваивается, и дешевле платить за API.

Мнение редакции dzen.guru

Этот расчёт ценен не конкретными цифрами (они зависят от модели, железа и тарифа), а самой логикой. Любой человек теперь может за пять минут посчитать, сколько ему реально стоит один токен, и перестать верить маркетинговым прайсам на слово. По моим наблюдениям, Яндекс AI Studio берёт за GPT-OSS-120B заметно больше, чем зарубежные агрегаторы, и этот разрыв стоит учитывать при планировании расходов на контент. Если вы сейчас платите за генерацию текста через API, возьмите формулу, подставьте свои числа и сравните с провайдером. Возможно, вы найдёте, что переплачиваете в разы.

Частые вопросы

Почему в расчёте не учтены зарплаты, аренда и обучение модели?

Автор намеренно считал только физический минимум: электричество и износ оборудования. Это не полная себестоимость бизнеса, а нижняя граница, ниже которой токен не может стоить ни при каких условиях. Зарплаты, аренда, обучение и маркетинг добавляются сверху и у каждой компании свои.

Можно ли масштабировать формулу на другие модели и карты?

Да. Формула универсальна: меняются три переменные, мощность в киловаттах, тариф за электричество и скорость генерации в токенах в секунду. Для другой видеокарты или другой модели достаточно подставить свои значения. Чем крупнее модель, тем ниже скорость генерации и тем дороже токен при тех же затратах на электричество.

Зачем считать себестоимость, если я просто покупаю API?

Чтобы понимать маржу провайдера. Если себестоимость с амортизацией составляет 60 рублей за миллион выходных токенов, а провайдер берёт 300 рублей, его наценка пятикратная. Это не значит, что он жадничает (у него аренда дата-центра, поддержка, SLA), но вы видите, за что именно платите, и можете осознанно решить: платить за удобство или собирать свой сервер.

Формула, озвученная NeuralDeep, не заменяет бизнес-план, но даёт каждому точку отсчёта, от которой можно считать честно.

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Как обучить бота в Телеграмме читать каналы и выдавать аналитику за один вечер

Telegram-бот, который сам читает каналы и выдаёт аналитику, можно собрать без навыков программирования за один вечер, если заранее решить вопрос доступа к…

22 июня в 10:30 МСК6 мин

Google Street View снял 13 000 км дорог Грузии: от квеври Кахетии до башен Сванетии

Google Street View покрыл 13 тысяч километров грузинских дорог, от виноделен Кахетии с глиняными сосудами квеври до средневековых башен Сванетии, и открыл эти…

22 июня в 10:15 МСК4 мин

Найм программистов на младшие позиции упал на 60%: компании выбирают токены вместо стажёров

Мне нужно дописать оригинал, который обрезан. Но я буду работать строго с тем, что есть. Microsoft запустила Scout, агента для почты второго июня, впервые…

22 июня в 09:45 МСК7 мин