Perplexity AIは、AIタスクをユーザーのデバイスと自社クラウドサーバーの間で自動的に振り分けるハイブリッド推論システムを導入した [1, 2, 3]。
この処理方式への移行は、分散型AIへの転換を意味しており、あらゆるクエリに対して大規模なサーバーファームに依存する状況を軽減する。ユーザーのノートパソコンに搭載されているハードウェアを活用することで、同社はサービスのスケールアップを可能にすると同時に、ユーザーにデータの制御権をより多く提供できる可能性がある。
「Local-Cloud Mode」と呼ばれるこの機能は、Mac向けのPerplexity Personal Computerアプリのユーザーに世界的に提供される [2, 3]。このシステムは、リクエストのどの部分をマシンのプロセッサでローカルに処理でき、どの部分にクラウドによる強力な処理が必要かを判断する [1, 2]。
Perplexityは、ハイブリッドルーティングにより、より多くのデータをデバイス内に保持できるため、ユーザーのプライバシーが向上すると述べている [1]。このアーキテクチャにより、機密情報が処理のために常にリモートサーバーに送信される必要がなくなる。
プライバシー以外に、同社はこのシステムが組織とユーザー双方にとってサーバー側のコストを削減すると述べている [1]。特定の計算をローカルハードウェアにオフロードすることで、クラウドベースの推論に伴うエネルギーおよび財務的なオーバーヘッドを削減できる。
今回の展開は、2026年5月に全ユーザーに提供されたMac向けPersonal Computerアプリの広範なリリースに続くものである [2]。この統合により、AIアシスタントはクラウド経由で大規模言語モデルの能力を維持しつつ、ローカルのオペレーティングシステムとより深く連携することが可能になる [2, 3]。
“システムは、リクエストのどの部分をマシンのプロセッサでローカルに処理できるかを判断する”
この展開は、クラウドの圧倒的なパワーとローカルハードウェアの速度およびセキュリティのバランスを取ることを目的とした、「エッジAI」への業界全体の広範なトレンドを示している。計算負荷をユーザーのデバイスに移行させることで、PerplexityはAI時代における2つの最大のハードル、すなわち膨大なサーバー維持コストと、高まる消費者のデータプライバシーへの不安を解決しようとしている。





