Google、Geminiに音楽生成AI「Lyria 3」統合
- 白石 奈々

- 6 時間前
- 読了時間: 2分

テキストや画像から30秒楽曲を自動生成、AI創作の対象が音楽領域へ拡張
米Googleは現地時間2月18日、生成AIモデル「Lyria 3」を「Gemini」アプリに統合し、テキストや画像入力から短尺の楽曲を自動生成できる機能をβ提供した。AIやモバイルアプリを日常的に活用する一般ユーザーやクリエイター層を主な対象とし、アイデアの説明や写真をアップロードするだけで、歌詞付きまたはインストゥルメンタルの約30秒トラックを作成できる。
音楽的構造を理解した生成性能と共有体験
Lyria 3は、リズムや構成、ボーカル表現といった音楽的要素を踏まえ、自然な流れを持つトラックを生成できる設計となっている。ジャンルや言語をまたぐボーカル生成にも対応し、ポップやファンクなど多様なスタイルの楽曲制作が可能だ。簡単なアイデアから完成度の高い音源を生成でき、用途に応じてクリアな音質で書き出せる点も特徴といえる。
また、生成された楽曲には、画像生成機能「Nano Banana」によって作成したカスタムカバーアートを付与でき、完成後は端末へのダウンロードや共有リンクによる外部共有にも対応する。
生成メディア技術の延長線上に位置付け
生成AIによる映像・画像・音楽制作の統合は近年加速しており、Googleも動画生成の「Veo」や画像生成の「Imagen」を展開してきた。Lyria 3は、こうした生成メディア技術の流れを音楽領域へ拡張するモデルとして位置付けられる。
AI生成コンテンツの識別と権利配慮
生成楽曲には電子透かし技術「SynthID」が埋め込まれ、AI生成コンテンツかどうかをGemini上で検証できる仕組みが用意されている。また、特定アーティストの模倣ではなく独自表現を目的に設計され、既存作品との類似性を検出するフィルターも導入された。利用は18歳以上が対象で、複数言語に対応し、サブスクリプションでは生成回数上限が拡張される。
個人の創作環境を拡張する生成AI
テキスト、画像、動画に続き音楽へと広がる生成AIの統合は、個人レベルのクリエイティブ制作環境を変化させつつある。Geminiにおける音楽生成機能の実装は、日常的な自己表現やコンテンツ制作を支援する基盤として、AI活用の領域をさらに広げる動きといえる。
参照サイト
Google The Keyword
A new way to express yourself: Gemini can now create music


