【エンジニアブログ】第53回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

イノベーション事業部の茶々丸です。
「Googleレンズ」にまたもや新しい機能が加わりました。Google LLCの今のトレンドなのかどんどん色んな機能が追加されていきますね。それでは紹介していきましょう。


・機能詳細
Google 検索アプリ内でレンズを開き、シャッターボタンを長押しして動画を撮影しながら音声による質問が可能になりました。また動画だけならず、写真を撮る際にも同様に音声による質問が可能なようです。


どちらの機能も現状では英語による音声にしか対応していませんが、当ブログでも度々紹介しているGoogleの生成AIモデル「Gemini(ジェミニ)」が動画と質問を解析し、回答を生成するようです。


Googleのエンジニアリング担当バイスプレジデントであるRajan Patel氏曰く「動画を一連の画像フレームとしてキャプチャし、それをカスタムGeminiモデルに渡しています。そうすることで、AIが複数のフレームを連続的に理解し、ウェブに基づいた回答を生成します」といった説明をされているようです。


今はまだ携帯端末という形での小型のサポート端末という存在ではありますが、いよいよもって動画というリアルタイムの処理にも対応するようになってきたこともあって、色々なSF作品に出てくるような人間とほぼ見た目の変わらない人型アンドロイドや現代日本でも最も身近な青色のネコ型ロボットなど、夢にまで見た存在が現実味を帯びてきたように感じられます。


青色のネコ型ロボットは22世紀(西暦2101年~2200年)の未来からやってきているわけですが、このまま技術が進歩していけばもっと近い将来になりそうですね。


Googleだけでなく、色々な企業がAI技術に日夜従事する現代社会、さらなる革命的な一石を投じるのは誰になるのか、今後も注目ですね。

それでは次回をお楽しみに!