今回はGoogleBardの画像入力の詳細や使い方など、解説していきます。
Contents
GoogleBardの画像認識が話題に
7月13日にGoogleBardで大型のアップデートが行われました。
読み上げ機能など様々な機能が付きましたが、中でも話題なのが画像認識機能です。
これはAIに画像を読み込ませて、解説など様々な事を行わせる機能です。
もともとChatGPTで発表されていた機能でしたが、まだ実装されていませんでした。
今回GoogleBardが先に実装されたため、より注目された訳です。
この機能はもともとサービスとしてあったGoogleレンズの機能を活用しているとされています。
実際に使ってみた
早速、GoogleBardの画像認識を使っていきます。
今回はバラの画像を認識させ、「What is this?(これはなんですか?)」と送って見ます。
花びらだけのアップで全体が見えないので、AIだとバラだと分からない可能性もあります。
送信をすると、AIから返答があるまでしばらく待ちます。
回答では、無事にバラであると答えてくれました。
さらにバラの特徴や完璧さと美しさの象徴であることなど、プラスの情報も教えてくれています。
まだ日本語では使えない
GoogleBardの画像認識は、現時点では英語のみでの実装となっています。
日本語で使おうとすると、画像を認識させるためのボタンが表示されません。
これは英語バージョンへの先行実装が原因であり、いずれ日本語を含めて様々な言語で使えるようになると見られています。
人物など使えない画像もある
人物や動物など一部の画像を認識させようとすると、「まだ認識できません」という表示が出ます。
またそもそも画像を選んでも、読み込みすらされずに手順を進められない場合もあります。
これらは「まだ認識できません」という表記なので、現時点では使えず、いずれ実装されるものと考えられます。
GoogleBard画像認識のやり方
GoogleBardの画像認識は、現時点では英語でしか使えません。
そのためまずはGoogleの言語設定を英語にする必要があります。
言語設定を英語にしてもGoogleの自動翻訳で、回答などは日本語にする事が可能です。
GoogleBardを開いて右上のアカウントアイコンをタップして下さい。
対象のアカウントのGoogleアカウントを管理を押します。
個人情報をタップし、言語に進みます。
他の言語を追加を押して、検索バーにEnglishと入力してください。
Englishをタップし、United Statesを選んで下さい。
保存を押して、Englishの↑を押すことで言語が英語になります。
GoogleBardを開き直すと英語表示になっているので、必要であれば日本語を押して自動翻訳を日本語にしておきましょう。
英語表示になると画像を認識させる+ボタンが表示されるので、タップして下さい。
ファイルをアップロードをタップし、認識させたい画像を選んで下さい。
対応画像形式
- JPEG
- PNG
- WebP
画像を選んだら完了を押し、質問文を入力します。
質問は英語で入力する必要があります。
紙飛行機マークを押す事で、質問を送ることができます。
GoogleBard画像認識の活用方法
下記ではGoogleBardの画像認識の活用方法を紹介していきます。
グラフを読み取って計算
GoogleBardでは、画像の読み込みの精度が高いです。
棒グラフや折れ線グラフなどを読み込ませても、かなり正確に認識してくれます。
しかもそのまま計算をしたり、軽い分析なども行う事が可能です。
表やイラストからタスクを行う
表やイラストを読み込んで、タスクを行う事も可能です。
たとえば順列の問題やひっ算の穴埋め問題など、画像だけで作られた問題でも解くことができます。
また画像の問題解決のための手順を示したり、解決に必要な計算を代わりに行ったりも出来ます。
サイトのスケッチからプログラミング
GoogleBardでは画像を読み込んでプログラミングに変換する事も出来ます。
たとえば作りたいサイトの表示を、スケッチに起こしてGoogleBardに読み込ませます。
そうするとGoogleBardはそのスケッチのサイトを作るためのプログラミングをhtml形式などで表示してくれます。
高度な図入りの問題を解く
チャットGPTでは司法資格の試験に合格する事も出来る高度なAIだと謳われています。
このように人間が苦労する試験問題を解けることが性能の高さを証明する1つの指標となっている訳です。
今回のGoogleBardでは図形の入った医師国家試験の問題にも挑戦できるレベルとなっています。
まだ正答率が高い訳ではありませんが、学習によって正答率が上がっていくと見られています。
キャラの名前を教えて貰う
SNSで気に入ったキャラを見付けた時、そのキャラの名前が何か分からずに困ってしまう時もあります。
そうした時、GoogleBardに画像を読み込ませて質問すれば、回答を得ることができます。
キャラの名前を含めた説明や登場するアニメの説明などを聞くことができます。
ただし人物と判断されると、認識されないことがあります。
レントゲンなどを診断してもらう
GoogleBardではレントゲン写真を読み込ませ、どこに病理があるかを診断する事も出来ます。
まだ実用的な範囲とは言え無さそうですが、今後学習によって実用的になっていく事もあり得ます。
またこれは正しい画像を把握したうえで、どこが誤っているのか判断しているという事でしょう。
画像の真偽の確認やトレスの確認など、様々な事に使える様になっていくことも期待されています。
どこが面白いのか説明して貰う
GoogleBardではネタ画像を読み込ませ、その画像のどこか面白いのか説明して貰う事ができます。
特に活用法がある訳ではありません。
しかしAIがネタの面白さを理解していると言うのは、かなり興味深いと注目されています。
GoogleBardの詳細や使い方を解説
新しい対話型AIのGoogleBardが、日本でも使える様になりました。 今回はGoogleBardの詳細やできることなど解説していきます。 Contents1 GoogleBardが日本でも使える様 ...
続きを見る