Googleの新AI「Gemma 3n」登場
- 桜井 未来
- 5月21日
- 読了時間: 2分

モバイル端末上で動画、音声、テキストをリアルタイム処理
米Googleは5月20日(現地時間)、新たなAIモデル「Gemma 3n」のプレビュー版を発表した。このモデルは、同社のGemma 3シリーズの一環として登場し、特にスマートフォンやタブレットといったモバイルデバイスでの動作に最適化されている。Gemma 3nは、テキスト、画像、音声、動画といった複数の情報を理解し、処理できるマルチモーダルAIで、デバイス上で直接動作するため、リアルタイムかつ高性能な応答を実現している。
Gemma 3nは、Qualcomm Technologies、MediaTek、Samsung System LSIといったモバイルハードウェア業界の主要企業と連携して開発され、モバイル端末での実行に特化した設計となっている。このアーキテクチャは、2025年後半に登場予定の次世代モデル「Gemini Nano」にも採用される予定で、今後の進化が期待される。
このAIモデルでは、従来のテキスト、画像、音声の処理能力に加えて、動画理解機能も大幅に強化されている。音声認識や翻訳など、マルチモーダルな処理がより高精度になり、多言語対応も進化。日本語にも対応しており、開発者は、テキスト、画像、音声、動画を組み合わせた高度な対話型体験を構築できるようになった。また、リアルタイムでの音声認識や翻訳をモバイル端末上で直接実行できるため、プライバシーや低遅延が求められるアプリケーションにおいても大きな強みを発揮する。
Gemma 3nは、5月20日から、ブラウザ上で利用できる「Google AI Studio」や、ローカル開発環境向けの「Google AI Edge」を通じて、早期プレビュー版が提供されている。開発者はこれらのツールを使って、Gemma 3nのパワフルな機能を活用し、さまざまなモバイル向けアプリケーションを開発できるようになる。
参照サイト
Google for Developers