OpenAI и Broadcom представили чип Jalapeño для инференса LLM

OpenAI представила первый собственный специализированный ускоритель для инференса больших языковых моделей, разработанный совместно с Broadcom. Компания заявляет о лучшей энергоэффективности по сравнению с актуальными решениями, но финальные тесты и технический отчет еще не опубликованы.

OpenAI и Broadcom представили Jalapeño — первый собственный «Intelligence Processor» OpenAI, специализированный ускоритель для инференса больших языковых моделей. Чип стал первым элементом многопоколенной вычислительной платформы, которую OpenAI строит вместе с Broadcom и партнерами.

Сэм Альтман и Хок Тан с пластиной Jalapeño

По данным OpenAI, Jalapeño проектировался с нуля под современные LLM-нагрузки, а не адаптировался из ускорителя общего назначения. OpenAI отвечала за архитектуру, Broadcom — за реализацию кремния, сетевые технологии и коммуникационные решения, включая Tomahawk, а Celestica — за платы, стойки и системную интеграцию.

Инженерные образцы уже выполняют ML-нагрузки в лаборатории, включая GPT-5.3-Codex-Spark. OpenAI заявляет, что ранние тесты показывают существенно лучшую производительность на ватт по сравнению с актуальными решениями уровня state of the art, но финальные результаты и подробный технический отчет еще не опубликованы.

Разработка от начального дизайна до tape-out заняла девять месяцев. Начальное развертывание платформы запланировано до конца 2026 года, после чего OpenAI и Broadcom намерены расширять ее в следующих поколениях.

Источник: openai.com

Связь с редакцией