Игорь Градов
Игорь Градов
5 мин
ai

YADRO проверила переделанные NVIDIA H100: вдвое выше расход энергии, ниже скорость обмена

Сервер YADRO G4208P G3 прошёл тестирование с ускорителями NVIDIA H100 двух типов, и результаты показали, что переделанные из серверных модулей PCIe-карты заметно уступают оригинальным H100 NVL по скорости обмена данными между GPU.

YADRO проверила переделанные NVIDIA H100: вдвое выше расход энергии, ниже скорость обмена
Почему это важно

На рынке появились PCIe-карты NVIDIA H100, собранные из чипов, извлечённых из серверных HGX-модулей. Они продаются как аналоги оригинальных H100 NVL, но тесты YADRO показали разницу в производительности, которую продавцы не афишируют.

Команда инженеров российского производителя серверов YADRO опубликовала результаты сравнительного тестирования двух вариантов ускорителей NVIDIA H100. Один вариант, оригинальные карты H100 NVL, предназначенные для серверов. Второй, PCIe-карты, которые команда YADRO обозначила как «NVIDIA H100 Special»: это чипы SXM, извлечённые из модулей HGX и переупакованные в формат PCIe. Такие карты сейчас можно встретить на рынке, и для тех, кто собирается NVIDIA H100 купить, разница между ними и оригиналом критична.

Параметр Значение
Кто провёл тест YADRO, команда оценки серверных платформ для ИИ
Тестовый сервер YADRO G4208P G3 (до 8 GPU, до 4 800 Вт суммарно)
Сравниваемые карты NVIDIA H100 NVL и NVIDIA H100 Special (PCIe из SXM)
Тип сделки / формат Внутренняя валидация, публичный отчёт с методикой
Дата публикации Июнь 2025 (данные стенда от декабря 2025 по меткам nvidia-smi)

Что именно проверяли и как?

Артём Маклаев, инженер YADRO, описал методику так, чтобы любой покупатель мог её воспроизвести. Оба типа карт NVIDIA H100 устанавливались в один и тот же сервер YADRO G4208P G3 с одинаковыми версиями драйвера, CUDA (набор инструментов NVIDIA для вычислений на GPU) и операционной системы.

Тестов было два уровня:

  • vLLM benchmark (фреймворк для запуска больших языковых моделей) версии v0.18.0, который измерял реальную скорость генерации текста на моделях Qwen3-Coder-30B-A3B-Instruct и Qwen3-Coder-Next.
  • NCCL all_reduce_perf, тест от NVIDIA, который проверяет интерконнект (скорость, с которой несколько GPU обмениваются данными между собой). NCCL, это библиотека коммуникации между GPU, без которой инференс (генерация ответов моделью) на нескольких картах невозможен.

Эксперимент строился на случайных датасетах фиксированного размера: 1 000 токенов (единиц текста) на входе и 1 000 на выходе, а также 127 000 на входе и 1 000 на выходе. Такой подход изолирует влияние самих карт от вариативности реальных запросов.

Энергопотребление как первый сигнал проблемы

Ещё до запуска бенчмарков обнаружилась настораживающая деталь. По данным утилиты nvidia-smi, карта NVIDIA H100 Special потребляет до 700 Вт. Для сравнения: оригинальная NVIDIA H100 NVL потребляет от 350 до 400 Вт, то есть почти вдвое меньше.

Сервер YADRO G4208P G3 конструктивно рассчитан на суммарную мощность GPU до 4 800 Вт, то есть до 600 Вт на каждый из восьми ускорителей. Карта Special с её 700 Вт выходит за этот лимит, а это создаёт прямой риск для системы охлаждения.

Энергопотребление карты доходит до 700 Вт включительно, а это может стать серьёзным вызовом для системы охлаждения сервера. : Артём Маклаев, инженер YADRO

Почему это важно для рынка ускорителей?

Рынок ускорителей NVIDIA H100 в России и СНГ ограничен санкционными ограничениями на поставки. В таких условиях появление «перепакованных» PCIe-карт из серверных модулей HGX было предсказуемым: спрос велик, предложение сжато, а ценник на любую карту с маркировкой H100 остаётся высоким.

Публикация YADRO ценна тем, что впервые в открытом доступе появилась воспроизводимая методика сравнения. Покупатель, который планирует NVIDIA H100 купить, теперь может запустить те же два теста на своём стенде и за час понять, оригинальная ли перед ним карта.

Для производителей серверов это тоже сигнал: нужно проверять не только маркировку GPU, но и реальный интерконнект, а также тепловой пакет каждой поставляемой карты.

Что меняется для тех, кто работает с ИИ

Если вы покупаете ускорители для обучения или инференса, одной спецификации на бумаге больше недостаточно. Разница в интерконнекте между оригинальной NVIDIA H100 NVL и перепакованной PCIe-картой напрямую бьёт по скорости генерации, особенно на задачах с длинным контекстом и несколькими GPU. Экономия на «аналоге» может обернуться двойной переплатой за электричество и охлаждение.

Что делать с этим прямо сейчас, по ролям?

Если вы закупаете GPU для ИИ-проектов. Перед покупкой любой карты NVIDIA H100 запросите у продавца право на стендовое тестирование. Запустите NCCL all_reduce_perf: именно этот тест покажет реальную скорость обмена данными между GPU. Если продавец отказывает в тесте, это повод насторожиться.

Если вы автор на Дзене или контент-маркетолог. Тема «как не переплатить за ИИ-железо» актуальна для аудитории: малый бизнес и фрилансеры всё чаще арендуют GPU-серверы, и они не знают, что карты с одним названием могут работать по-разному. Методика YADRO, это готовый фактурный материал.

Если вы предприниматель в РФ и СНГ. Сервер YADRO G4208P G3 производится в России и заявлен как основная платформа под задачи ИИ. При выборе между импортным и отечественным сервером теперь есть публичный бенчмарк с открытой методикой, по которому можно сверяться.

Мнение редакции dzen.guru

По моим наблюдениям, большинство покупателей GPU в России ориентируются на название и объём памяти, а не на тип интерконнекта и реальное энергопотребление. Публикация YADRO полезна именно тем, что снимает эту слепую зону: вот конкретные команды, вот конкретные цифры, повторяйте на своём стенде. Единственная оговорка: полные результаты диаграмм пропускной способности в исходном материале обрезаны, поэтому точные проценты разницы я привести не могу. Но сам подход, два уровня тестов на одном сервере с одинаковым софтом, это минимальный стандарт проверки для любого, кто собирается потратить на ускорители серьёзный бюджет.

Где подвох

Тестирование проведено на конкретной серверной платформе YADRO G4208P G3. Результаты на других серверах могут отличаться из-за разницы в охлаждении, разводке шин PCIe и версиях BIOS. Кроме того, исходный материал обрывается на описании диаграмм, полные числовые данные по пропускной способности не опубликованы.

Главный вывод прост: если перед вами две карты с надписью NVIDIA H100, но одна потребляет 400 Вт, а другая 700, перед вами не одно и то же устройство, и никакая скидка не компенсирует двойной счёт за электричество и риск перегрева.

Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Нейросеть для кода проходит тесты, но оставляет дыры: разбор на реальных функциях Python
ai

Нейросеть для кода проходит тесты, но оставляет дыры: разбор на реальных функциях Python

Нейросеть для написания кода на Python выдаёт результат, который запускается с первого раза, но опытный разработчик из России 3 июня 2025 года показал на…

6 мин
Лабораторию нейронаук Сбера проверили по единственной публикации: метрики перепутаны
ai

Лабораторию нейронаук Сбера проверили по единственной публикации: метрики перепутаны

Я не могу написать эту статью в запрошенном формате how-to с пошаговой инструкцией, потому что источник не содержит практического руководства. Это…

5 мин
Метаболический ИИ устоял под давлением, а Claude сдался: тест на ложный авторитет
ai

Метаболический ИИ устоял под давлением, а Claude сдался: тест на ложный авторитет

Метаболический ИИ (metabolic AI) обещает решать задачи иначе, чем привычные языковые модели, и эксперимент с пространственной ловушкой показал, где именно…

6 мин