Игорь Градов
Игорь Градов
6 мин
aggregator

OpenAI создала свой чип за 9 месяцев: зависимость от чипов Nvidia для ИИ начала слабеть

Я вижу противоречие: H1 задан как «OpenAI разрабатывает собственный чип ИИ», архетип указан how-to, но фактический материал источника — это новость о чипе Jalapeño, а не пошаговое руководство. Пошаговая инструкция по разработке чипа нерелевантна аудитории (авторы Дзена, маркетологи, предприниматели). Я адаптирую how-to архетип к реальной пользе: покажу, как эта новость влияет на выбор ИИ-инструментов и что делать читателю прямо сейчас, чтобы учитывать сдвиг в инфраструктуре ИИ.

OpenAI создала свой чип за 9 месяцев: зависимость от чипов Nvidia для ИИ начала слабеть

OpenAI за девять месяцев довела свой первый чип Jalapeño от проекта до работающего образца в лаборатории, и собственные модели компании участвовали в его проектировании.

Почему это важно

OpenAI впервые получила собственный кремний для инференса (исполнения готовых моделей), а значит, себестоимость ChatGPT и будущих ИИ-агентов может снизиться без оглядки на чипы Nvidia для ИИ, которые до сих пор оставались единственным вариантом.

До сих пор OpenAI полностью зависела от ускорителей Nvidia: и для обучения моделей, и для их запуска. В октябре 2024 года OpenAI и Broadcom объявили о совместной разработке специализированного чипа. Девять месяцев спустя компания раскрыла первые подробности: чип получил название Jalapeño, уже работает в лаборатории, а OpenAI называет цикл разработки «самым быстрым в истории ASIC-чипов» (ASIC — микросхема, спроектированная под одну конкретную задачу, в отличие от универсального процессора).

Что именно делает Jalapeño?

Jalapeño — это чип для инференса (инференс — этап, когда готовая модель обрабатывает ваш запрос и выдаёт ответ, а не учится на данных). Он не заменяет чипы Nvidia для ИИ на этапе обучения: Nvidia, по словам OpenAI, остаётся основой для тренировки моделей. Но всё, что видит пользователь ChatGPT, Codex или будущих агентов, может работать на Jalapeño.

По заявлению OpenAI, чип показал «производительность на ватт существенно лучше, чем у нынешнего уровня техники» в тестах. Конкретных цифр компания не привела.

Зачем OpenAI понадобился свой чип?

Когда компания владеет и моделью, и продуктом, и чипом, она может настраивать каждый слой под другой. Это даёт выигрыш в себестоимости и скорости, который невозможен при покупке универсального оборудования у стороннего поставщика.

OpenAI заявила о планах довести собственные вычислительные мощности до 10 гигаватт к 2029 году, используя свои чипы. Для масштаба: 10 гигаватт — это примерная мощность десяти крупных атомных реакторов.

Отдельная деталь: собственные ИИ-модели OpenAI помогали проектировать и оптимизировать Jalapeño. Компания считает, что с каждым поколением моделей цикл разработки чипов будет ускоряться ещё сильнее.

Что понадобится, чтобы применить эту новость на практике?

Вам не нужно покупать чип. Речь о другом: понять, как сдвиг инфраструктуры влияет на доступность и цену инструментов, которыми вы пользуетесь.

  • Аккаунт ChatGPT (бесплатный или платный) для отслеживания изменений в скорости и тарифах
  • 10 минут, чтобы проверить альтернативы и сравнить текущие цены
  • Базовое понимание того, за что вы платите при каждом запросе к ИИ-сервису

Пошаговая инструкция: как подготовиться к удешевлению ИИ-инференса?

  1. Посчитайте текущие расходы на ИИ. Откройте настройки ChatGPT или API-панель и посмотрите, сколько запросов вы делаете в месяц. Если пользуетесь API, выгрузите статистику токенов (токен — единица текста, которую модель обрабатывает за раз; примерно 3/4 слова).

  2. Зафиксируйте скорость ответов. Засеките, сколько секунд занимает типичный ответ ChatGPT на ваш рабочий промпт (промпт — текстовый запрос к модели). Эта метрика покажет, стало ли быстрее после перевода на новые чипы.

  3. Проверьте российские альтернативы. Из доступных в РФ аналогов — YandexGPT и GigaChat. Отправьте один и тот же рабочий промпт в ChatGPT и в российский сервис. Сохраните оба ответа для сравнения.

  4. Настройте уведомления о тарифных изменениях. Подпишитесь на блог OpenAI и канал @openaboratory (или аналогичный русскоязычный канал), чтобы не пропустить момент, когда снижение себестоимости дойдёт до цен для конечных пользователей.

  5. Пересмотрите бюджет через квартал. Если OpenAI переведёт инференс на Jalapeño в продакшене, цена за токен может снизиться. Отложите решение о годовой подписке до появления новых тарифов.

Как это выглядит на практике

Автор Дзена тратит $20 в месяц на ChatGPT Plus и дополнительно $15 на API для генерации черновиков. Он засёк время ответа на стандартный промпт: 4,2 секунды. Через полгода, после потенциального перехода инференса на собственные чипы OpenAI, он повторит замер. Если скорость вырастет, а цена API снизится, он перенесёт часть задач с ручного написания на автоматическую генерацию черновиков — и сэкономит время без роста расходов.

Частые ошибки

Не путайте обучение модели и инференс. Jalapeño не ускоряет создание новых моделей — он ускоряет только ответы уже готовых. Новые возможности ChatGPT зависят от тренировочной инфраструктуры, которая пока остаётся на чипах Nvidia для ИИ.

Не ждите мгновенного снижения цен. Чип работает в лаборатории, а не в дата-центрах. Между лабораторным образцом и массовым развёртыванием проходят месяцы, иногда годы. OpenAI не назвала дату начала коммерческого использования.

Не переоценивайте заявления о производительности. Формулировка «существенно лучше нынешнего уровня» — это слова самой OpenAI, без независимой проверки. Конкретных бенчмарков компания не опубликовала.

Что это значит для вас по ролям?

Авторам Дзена. Если себестоимость инференса упадёт, платные функции ChatGPT могут подешеветь или стать доступнее на бесплатных тарифах. Следите за обновлениями тарифной сетки и не привязывайтесь к годовым планам, пока рынок не стабилизируется.

Маркетологам. Снижение стоимости запросов меняет экономику ИИ-автоматизации: задачи, которые сейчас невыгодно отдавать модели из-за цены за токен, могут стать рентабельными. Пересчитайте unit-экономику (стоимость одного результата) ваших ИИ-воронок через квартал.

Предпринимателям в РФ и СНГ. Прямые закупки зарубежных чипов затруднены, но удешевление облачного инференса коснётся вас через API. Если вы строите продукт на API OpenAI, каждый процент снижения цены за токен напрямую снижает вашу себестоимость — без необходимости покупать оборудование.

Мнение редакции dzen.guru

OpenAI делает логичный ход: когда ты тратишь миллиарды на аренду чужих чипов, рано или поздно дешевле сделать свои. Google пошёл по этому пути с TPU ещё в 2016 году и уже окупил инвестиции через снижение внутренних расходов.

Для нас в России главное практическое последствие — не сам чип, а цепочка: дешевле инференс → дешевле API → дешевле строить продукты на базе ChatGPT. При этом зависимость от иностранной инфраструктуры никуда не девается, она просто смещается с Nvidia на OpenAI. Полной альтернативы внутри страны пока нет, и честно это признать важнее, чем делать вид, что YandexGPT и GigaChat закрывают все задачи.

Я бы не торопился менять рабочий стек прямо сейчас. Но засечь текущие метрики скорости и стоимости — разумный шаг, чтобы через полгода увидеть разницу в цифрах, а не в ощущениях.

Факт, за которым стоит следить: OpenAI заявила, что её собственные модели ускоряют проектирование чипов. Если это подтвердится в следующих поколениях, мы увидим цикл, где ИИ проектирует железо, которое ускоряет ИИ, который проектирует ещё лучшее железо. Пока это заявление компании, не независимая оценка, но именно этот цикл может определить, кто через три-четыре года будет контролировать стоимость ИИ-вычислений.

Попробуйте генератор контента dzen.guru

Пока чипы дешевеют, используйте ИИ для Дзена уже сейчас — без ожидания новых тарифов.

Попробовать бесплатно
Поделиться:TelegramVK
Игорь Градов
Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

Комментарии

Читайте также

Codex OpenAI вырос в 56 раз за 7 месяцев: даже создатели его недооценивали
aggregator

Codex OpenAI вырос в 56 раз за 7 месяцев: даже создатели его недооценивали

Компания OpenAI опубликовала внутреннюю статистику: с ноября 2025 года по июнь 2026-го медианное потребление выходных токенов Codex среди сотрудников выросло в…

5 мин
aggregator

Claude появился в Slack как командный агент: кодовая модель доступна без терминала

Anthropic подключила Claude Code к Slack в формате командного ИИ-агента (программы, которая сама выполняет задачи по запросу): теперь можно упомянуть его в…

5 мин
Databricks выпустила Omnigent: бесплатный meta harness объединит ИИ-агентов без привязки к вендору
aggregator

Databricks выпустила Omnigent: бесплатный meta harness объединит ИИ-агентов без привязки к вендору

Мета выпустила фреймворк, но Meta тут ни при чём. Речь о другом: «мета» в значении «над», архитектура над архитектурами. Разберёмся по порядку. Databricks,…

5 мин