イノベーション事業部の茶々丸です。
今回の第47回では当ブログでも度々話題になっているGoogleが提供する生成系AIのGemini(旧Bard)について紹介します。
ここ数年の間に画像生成AIという単語をよく耳にするようになりました。
ChatGPTには有料プランにはなりますが、DALL-EというOpenAI社からリリースされた画像生成AIを用いて画像生成を行うことができます。
一方Geminiでは現在無料で誰でも画像生成を行うことができます。
・画像生成方法
生成方法としてはいたってシンプルでGeminiの下部にあるプロンプト(指示)にテキストを入力するのみですが、現状ではいくつか条件があります。
①プロンプト(指示)の内容は英語で行う
②アスペクト比の指定はできない
③現在のバージョンでは人物を画像生成することはできない
今回は例として、以下の内容でGeminiに指示をしてみました(是非実際にお試しください)
Please generate an image of a Gundam standing in Shinjuku, Tokyo.
(東京の新宿に立つガンダムの画像を生成してください)
Could you please change the time of day in the generated image to night?
(生成した画像ですが時刻を夜に変更していただけますか?)
Could you please make the generated image face off against a Zaku?
(生成した画像ですがザクと対峙させていただけませんか?)
と、最初に生成された画像から対話形式でさらに変更を加えていくことも可能です。
ですが実際に生成して頂いた画像を見てもらえばわかりますが、ガンダムなどの具体的なものほど「それっぽい何か」が生み出されているかと思います。これは今後に期待ですね。
ですが抽象的なもの、たとえば
Generate an image of the sunset on the coast
(海岸に沈む夕日の画像を生成してください)
と、指示を送ることでまるで写真のような画像を生成してくれます。
対話形式で自分のお好みの画像を生み出せるようにGeminiを調整していくのも楽しいかもしれませんね。
それでは次回をお楽しみに!