OpenAI、GPT-4oの画像生成機能を発表
- 桜井 未来
- 3月27日
- 読了時間: 2分
更新日:3月31日

ユーザーのテキスト指示を基に高精度でリアルな画像を生成
米OpenAIは、3月25日(現地時間)、対話型AI「ChatGPT」に、GPT-4モデルを活用した画像生成機能を新たに搭載したことを発表した。この技術は、ユーザーのテキスト指示を基に高精度でリアルな画像を生成する能力を備えており、ChatGPTの無料ユーザー及び有料のPlus、Pro、Teamのユーザー、そして同社の動画生成AI「Sora」のユーザー向けに提供される。
この画像生成機能は、ユーザーが入力するテキストを正確にレンダリングし、プロンプトに従った詳細な画像を迅速に生成。また、ChatGPTの会話コンテキストやGPT-4固有の知識ベースを活用し、ユーザーが望むイメージに沿った画像を簡単に作成できるため、ビジュアルコンテンツの制作がより効率的で効果的になる。
例えば、この画像は、以下のテキストにより生成されている。

モール・オブ・アメリカの駐車場を急ぎ足で歩くカール・マルクスをパパラッチ風に撮影したもの。彼は高級品でいっぱいの光沢のある買い物袋をいくつも抱えている。彼のコートは風になびき、バッグのひとつは駆けているように揺れている。動きを強調するため、背景は車と光り輝くショッピングモールの入口でぼかしている。カメラのフラッシュが部分的に露出オーバーになり、混沌としたタブロイド紙のような雰囲気を醸し出している。
GPT-4の画像生成機能は、従来のモデルに比べて大幅に精度が向上しており、さまざまな分野での活用が期待されている。OpenAIの公式サイトでは、上記の例以外にも多くの事例が紹介されている。自分に合った活用方法を見つけてみては?
参照サイト
OpenAI公式サイト