Googleは、Google翻訳アプリ内でほぼリアルタイムの連続翻訳を提供するAI搭載モデル「Gemini 3.5 Live Translate」を順次導入している [1]。
今回のアップデートは、ユーザーが話す前に手動で言語を選択する必要性をなくし、モバイルコミュニケーションに大きな転換をもたらすものである。言語検出の自動化とコンテキストを考慮した合成により、現実世界の多言語会話で通常発生する摩擦を解消することを目指している [1, 2]。
この機能は、AndroidおよびiOSスマートフォンのユーザー向けに世界的に展開されている [1, 2]。Gemini 3.5 Live Translateは約70言語をサポートしており [1]、合成プロセスにおいて話者の声の特徴を維持した同時通訳が可能だ [1, 2]。
中断と再開を繰り返す必要があった従来の翻訳ソフトウェアとは異なり、このモデルは対話の連続的な流れに焦点を当てている。システムは自動言語検出を用いて、誰がどの言語で話しているかを識別し、発話から翻訳出力までの遅延を短縮している [1, 2]。
Googleは、この技術の目標が、多様な社会的・専門的環境でシームレスに機能する高品質な翻訳を提供することにあると述べている [1, 2]。既存の翻訳アプリに統合されたことで、別途ハードウェアを用意することなく、同社の既存のグローバルユーザーベースがこのツールを利用できる [1]。
“Googleは「Gemini 3.5 Live Translate」と呼ばれる新しいAI搭載翻訳モデルを導入している”
連続的で声を維持した翻訳への移行は、「辞書形式」の翻訳から真の同時通訳への転換を示唆している。これを無料のグローバルアプリに統合することで、Googleは国境を越えたコミュニケーションの障壁を下げており、基本的なやり取りにおける人間の中介者への依存を減らすことで、旅行、国際ビジネス、外交に影響を与える可能性がある。





