Microsoft、AIモデル群「MAI」を拡充 推論・画像・音声など7モデル公開
- 桜井 未来
- 6 時間前
- 読了時間: 2分

Build 2026で発表 コード生成や音声認識を含む新モデルをMicrosoft Foundryで提供
米Microsoftは現地時間6月2日、開発者会議「Microsoft Build 2026」で独自開発のAIモデル群「MAI(Microsoft AI)」の新ラインアップを発表した。今回公開されたのは、推論、コード生成、画像生成、音声認識、音声合成をカバーする7モデルで、同社のAI開発基盤「Microsoft Foundry」を通じて順次提供される。
推論から音声まで7モデルを展開
発表されたのは、推論モデル「MAI-Thinking-1」、コード生成モデル「MAI-Code-1-Flash」、画像生成モデル「MAI-Image-2.5」と「MAI-Image-2.5 Flash」、音声認識モデル「MAI-Transcribe-1.5」、音声合成モデル「MAI-Voice-2」と「MAI-Voice-2 Flash」の7モデルだ。テキスト、コード、画像、音声の主要領域をカバーする構成となっている。
画像生成や音声AIの機能を強化
MAI-Thinking-1は複雑な推論タスク向けに設計された大規模言語モデルで、MAI-Code-1-Flashは高速なコード生成を担う。画像分野では、MAI-Image-2.5が画像生成や編集機能を提供し、Flash版は低遅延処理に対応する。音声分野では、MAI-Transcribe-1.5が音声認識を担当し、MAI-Voice-2シリーズが多言語対応の音声合成機能を提供する。
4月発表モデルに続くラインアップ拡充
Microsoftは2026年4月にも「MAI-Transcribe-1」「MAI-Voice-1」「MAI-Image-2」を公開しており、今回の発表はMAIシリーズ拡充の一環と位置付けられる。新モデル群はMicrosoft Foundry上で利用でき、開発者はチャットボットや業務アプリケーション、コンテンツ生成サービスなどへの組み込みを進められる。
独自AIモデルの提供範囲を拡大
FoundryではOpenAIをはじめとする外部ベンダーのモデルも利用できるが、Microsoftは独自モデルのラインアップを拡充している。今回の発表により、同社は推論、コード生成、画像、音声といった主要なAIワークロードをMAIシリーズでカバーする体制を強化した。
マルチモーダルAI競争が加速
生成AI市場では、テキスト生成に加えて画像や音声を統合的に扱うマルチモーダル対応が進んでいる。MicrosoftによるMAIシリーズの拡充は、こうした流れを背景に、自社開発モデルの提供領域を広げる取り組みとして位置付けられそうだ。
参照サイト
Microsoft MAI Blog
Microsoft Build 2026: MAI Keynote Transcript
