OpenAIとBroadcom Inc.は、大規模言語モデル(LLM)のワークロードの効率を向上させるため、「Jalapeño」と呼ばれるカスタムAI推論チップを開発した [1]。
このパートナーシップは、フルスタックAIプラットフォームへの重要な転換を意味しており、サードパーティのハードウェアプロバイダーへの依存度を下げ、ChatGPTなどのモデルの運用コストを削減することを目的としている [2]。
両社によると、この新ハードウェアは、学習済みモデルから回答を生成するプロセスである「推論」に特化して設計されている。このチップにより、推論コストを50%削減できる可能性がある [1]。この効率化により、データセンター運営に伴う膨大な電力消費と財務的オーバーヘッドを削減しつつ、AIサービスの可用性を拡大させる狙いだ [3]。
開発プロセスは迅速に進められ、初期設計段階からテープアウトまで約9か月で完了した [4]。この加速されたタイムラインは、OpenAIのソフトウェア専門知識とBroadcomのシリコンエンジニアリング能力による合理的な連携を示唆している [2]。
導入時期については報告によって異なる。一部の情報源は2026年末までに導入されるとしているが [5]、別の報告では、現在はサンプルによるテスト段階であり、具体的な導入日は確定していないとしている [2]。
Broadcomは、大手テック企業向けにカスタムASIC(特定用途向け集積回路)を開発してきた実績がある。Broadcomと提携することで、OpenAIは自社のプロプライエタリなトランスフォーマーに必要とされる特定の数学的演算を最適化した、専用のハードウェアソリューションを得ることになる [3]。
この動きは、汎用GPU市場のボトルネックや高価格を回避するために、AI開発者がカスタムシリコンを自社開発するという業界全体の広範なトレンドに沿ったものである [2]。
“新ハードウェアは、学習済みモデルから回答を生成するプロセスである推論に特化して設計されている。”
Jalapeñoチップは、OpenAIがソフトウェア中心の企業から、ハードウェアとソフトウェアを垂直統合したプロバイダーへと移行することを象徴している。シリコン層を制御することで、OpenAIは特定のハードウェアアーキテクチャに合わせてモデルを最適化でき、既製品のチップに依存する競合他社が太刀打ちできないパフォーマンスとコストの「堀(競争優位性)」を構築できる可能性がある。また、この動きはAIサプライチェーンを多様化し、業界全体のNvidiaへの完全な依存を軽減しようとする戦略的な取り組みでもある。



