お電話でのお問い合わせ

03-3589-6753

【エンジニアブログ】第48回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

システム開発部の月月です。

今回は『Project Guideline』についてお話します。



Project Guidelineとは、視覚障がいを持つランナーが伴走者の助けなしに一人で自由に走ることを目標としたGoogleの研究開発プロジェクトです。

Project Guidelineは画像認識技術を用いて、地面に引かれた線を見分けます。
そして今ランナーが走っている位置を瞬時に判断し、音声でランナーに伝えます。
その音声により、ランナーは線から外れることなく走り続けることができるという仕組みです。


こうした仕組みは2023年にオープンソースとして公開され、
主に視覚障がい者向けのアクセシビリティ分野に取り組む方々が利用しやすいようになっています。


Project Guidelineではその実用に向け世界各地でテストを重ねており、
日本でも今年、横浜にて複数回に渡る体験会を開催中です。

過去にはこの技術を用いて、視覚障がいを持つランナー6人により42.195kmの駅伝レースを完走した実績もあり、
ハンディキャップを持つ方々にとって世界を広げる大きな助けとなっていることは間違いありません。

このような技術が進歩している大きな理由として、スマホの処理能力向上が挙げられます。

撮影、画像・空間認識、音声の出力といった機能を軽量なスマホが一手に引き受けてくれるため、
ランナーの走行を阻害することなく快適に走ることが可能となったわけです。

AIやARといったソフトウェア技術と高性能スマホというハードウェア技術の結晶が、
『Project Guideline』と言えるでしょう。

それでは次回をお楽しみに!

【エンジニアブログ】第47回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

イノベーション事業部の茶々丸です。

今回の第47回では当ブログでも度々話題になっているGoogleが提供する生成系AIのGemini(旧Bard)について紹介します。


ここ数年の間に画像生成AIという単語をよく耳にするようになりました。

ChatGPTには有料プランにはなりますが、DALL-EというOpenAI社からリリースされた画像生成AIを用いて画像生成を行うことができます。


一方Geminiでは現在無料で誰でも画像生成を行うことができます。


・画像生成方法
生成方法としてはいたってシンプルでGeminiの下部にあるプロンプト(指示)にテキストを入力するのみですが、現状ではいくつか条件があります。

①プロンプト(指示)の内容は英語で行う
②アスペクト比の指定はできない
③現在のバージョンでは人物を画像生成することはできない

今回は例として、以下の内容でGeminiに指示をしてみました(是非実際にお試しください)

Please generate an image of a Gundam standing in Shinjuku, Tokyo.
(東京の新宿に立つガンダムの画像を生成してください)

Could you please change the time of day in the generated image to night?
(生成した画像ですが時刻を夜に変更していただけますか?)

Could you please make the generated image face off against a Zaku?
(生成した画像ですがザクと対峙させていただけませんか?)

と、最初に生成された画像から対話形式でさらに変更を加えていくことも可能です。
ですが実際に生成して頂いた画像を見てもらえばわかりますが、ガンダムなどの具体的なものほど「それっぽい何か」が生み出されているかと思います。これは今後に期待ですね。


ですが抽象的なもの、たとえば

Generate an image of the sunset on the coast
(海岸に沈む夕日の画像を生成してください)

と、指示を送ることでまるで写真のような画像を生成してくれます。
対話形式で自分のお好みの画像を生み出せるようにGeminiを調整していくのも楽しいかもしれませんね。

それでは次回をお楽しみに!

【エンジニアブログ】第46回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

システム開発部の月月です。

今回は前回の『かこって検索』に引き続き、Googleの新たな検索機能をご紹介いたします。

今回紹介するのは『マルチ検索』です。


こちらの機能、iPhoneやAndroid上で利用可能なGoogleアプリに搭載されています。

Googleアプリには元々Googleレンズという画像検索機能が存在していましたが、画像+テキストを同時にインプットして検索できるようになりました。
これが『マルチ検索』です。
幅広い環境で使える機能ということで私も試しに使ってみましたので、使用例をお伝えします。


《使用例》
画像のインプットには、その場で撮った写真やカメラロールの写真を使用することができます。

今回はカメラロールにあった浅草寺の門の写真を使います(あの大きな提灯が特徴の門です)。

まずは画像のみで検索してみます。
すると、あの門の名前は宝蔵門ということが分かりました。Googleビジネスプロフィールや浅草寺のホームページなど、施設そのものの情報が上位の検索結果となりました。

続いて、画像+テキストで検索してみます。
先ほどと同じ画像に『グルメ』というテキストを追加して検索してみると、浅草のグルメ情報を扱うページが上位に表示されるようになりました。
日本語にもしっかり対応していますね。

このように宝蔵門や浅草寺の名前を知らなくても、写真があれば付近のお店を調べることが可能です。

他にも、折り紙の完成品の写真と『折り方』で検索すれば折り方を紹介しているページにすぐ辿り着くことができたり、様々な活用法が考えられますね。


第44回でご紹介した内容とも通じていますが、マルチモーダルAI(複数のデータタイプに対応して処理可能なAI)の進化が、私達の手の届く範囲にまで影響を及ぼしています。

新技術も習うより慣れろということで、ぜひ皆さんもお手元のスマートフォンでマルチ検索を試してみてはいかがでしょうか。

【エンジニアブログ】第45回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

イノベーション事業部の茶々丸です。

今回第45回では1月末より一部のGoogle Pixelなどで利用できるようになりました機能『かこって検索』についてご紹介させて頂きます。


昨今、X(旧Twitter)・Line・Facebook・Instagram・YouTube・TikTock等々、日々の生活でSNSを利用しない日がないほどSNSは一般的になってきたかと思います。
そんな折、SNS利用時に画像内や動画内で何気なく見かけた洋服や鞄、食べ物など、ふと目にしたモノの詳細を知りたくなったことはないでしょうか?


「かこって検索」はアプリを切り替えることなく、それらを簡単な操作でGoogle検索できる機能となります。

・起動方法
ホームボタンまたはナビゲーションバーを長押しすることで起動されます。

・操作方法
操作方法はいたってシンプルで、画像や動画を見ている際でもかこって検索は起動することができ、ディスプレイ内の検索したいモノを指でなぞって丸で囲むだけ。
すると、Google検索でその部分に関する情報が画像検索されます。検索結果には、画像や動画の該当部分の拡大表示や、関連するニュース記事やウェブサイトのリンクが表示されます。

また指でなぞって丸で囲む以外にも、検索したい部分をなぞって塗りつぶしたり、タップしたりすることでも検索は可能です。

と、ここまで紹介してきましたが、Google Pixelでないと使えないのでは…?という感想を抱かれると思います。
しかしご存じでしょうか?同じくGoogle Pixelで使用できる有名な「消しゴムマジック」ですが、
現在では有料サービスである「Google One」に加入すれば、iPhoneや他社のAndroid端末でも使えるようになっているのです。

ですので、かこって検索が将来的にGoogle Pixel以外の他端末で使用できるようになる日もそう遠くない未来にあることでしょう。


それでは次回をお楽しみに!

Mediaメディア掲載実績

歯科医院経営・総合情報誌アポロニア21/月刊「BIGLIFE21」/月刊「美楽」/楽天コミュニケーションズ㈱様/他

【Biglife21】様WEB記事はこちら
お客様の本音を集める新クラウドサービス「JOYボイス」を提案する

WEB記事を読む

Contactシステム開発・クラウドサービス・SES お気軽にお問い合わせください