Nvidiaは、WindowsノートPCをローカルで大規模言語モデル(LLM)を実行可能な「AIエージェントのパワーハウス」へと変貌させるため、RTX Sparkプラットフォームと新型チップを開発している [1, 2]。

この転換はクラウド依存からの脱却を意味し、ユーザーがオフラインでパーソナルAIアシスタントを操作することを可能にする。デバイス上でデータを処理することで、Nvidiaはプライバシーの向上と、リモートサーバーへのリクエストに伴うレイテンシ(遅延)の削減を目指している [3, 2]。

ジェンスン・ファンCEOは、2024年9月に配信された「The Vergecast」のエピソードの中でこれらの開発について言及した [3, 4]。この戦略には、RTX Sparkによるソフトウェアの最適化と、専用ハードウェアの導入という組み合わせが含まれている。具体的にNvidiaは、ローカルAIに必要な膨大な計算負荷を処理するために設計された「N2X」および「N3X」チップに取り組んでいる [2]

これらの新型チップの性能目標は極めて高い。N2Xチップは、現行のRTX 40シリーズGPUの約2倍の性能を提供することを意図している [2]。さらに、N3Xチップはより大きな容量向けに設計されており、現行のRTX 40シリーズの約3倍の性能を目標としている [2]

Nvidiaがローカル処理を推進する一方で、業界の他のプレーヤーは異なる戦略を採用している。Perplexityは、ローカルシリコンとクラウドサーバーの間でAIワークロードをバランスさせるハイブリッドモデルを模索している [3]。この対比は、AIの未来がクラウドに集中するのか、あるいは個人のハードウェアに分散されるのかという、業界全体の広範な議論を浮き彫りにしている [3, 1]。

ローカルAIのテストでは、旧世代のハードウェアでもある程度の実行可能性がすでに示されている。報告によると、一部のローカルAIモデルは、専用GPUを搭載していない6年前のノートPCでも効果的に動作するという [5]。しかし、RTX Sparkエコシステムは、単なる基本機能の提供を超え、複雑なAIエージェントのための高性能環境を構築することを目的としている [1]

Nvidiaは、WindowsノートPCをAIエージェントのパワーハウスに変えるため、RTX Sparkプラットフォームと新型チップを開発している。

AI実行のローカル移行は、AI体験をインターネット接続やサブスクリプションベースのクラウドモデルから切り離そうとする戦略的な試みである。NvidiaがN2XおよびN3Xアーキテクチャの実装に成功すれば、ノートPCは「クラウド上の知能にアクセスするための端末」から、「自律的な計算ノード」へと進化する。これにより、PC市場の競争環境が変わり、従来のCPUクロック速度よりも、NPUやGPUの性能がハードウェア販売の主要な原動力となる可能性がある。