Googleはレンズ検索でAIモードにマルチモーダル機能を追加

ジャカルタ-Googleは、Googleレンズのビジュアル検索と統合されたAIモード機能でマルチモーダル機能を開始しました。この機能を使用すると、ユーザーは画像を撮影またはアップロードしたり、画像に関連する質問をしたり、さらなる探索のための関連リンクを含む完全な文脈豊富な回答を受け取ったりできます。さらに、AIモードは現在、米国の何百万人もの無料のGoogleラボユーザーが利用できます。

先月、GoogleはGoogle One AIプレミアム加入者専用の実験的なAIモード機能をリリースしました。現在、検索エンジンの巨人は、米国の何百万人ものGoogle Labsユーザーへのアクセスを拡大しています。

それだけでなく、Googleはマルチモーダル機能を追加することでAIモード機能も改善しており、ユーザーは画像をアップロードしたり写真を撮ったりしてから、画像の内容について直接尋ね、Googleの検索結果から詳細な説明を受け取ることができます。

Googleは、このマルチモーダル検索機能は、GoogleレンズとGemini AIモデルの特別バージョンによってサポートされていると述べています。これで、システムは、画像内のオブジェクト、材料、色、形式、および配置間の関係など、画像のコンテキスト全体を理解できます。

ビジュアル検索におけるGoogleの専門知識により、Lensは写真の各オブジェクトを正確に識別できます。このテクノロジーは、クエリファンアウトと呼ばれるアプローチを使用しており、AIはより詳細な洞察を提供するためにさまざまな追加検索を実行します。

通常の視覚検索以上のもの

Googleが共有した例によると、AIモードは本棚の写真にある本全体を認識し、それらのタイトルに関する情報を検索し、高レビューを受けた同様の本を提案します。結果は、本のリストだけでなく、それを購入するためのリンク、および追加の詳細でもあります。

ユーザーは、「私は読めやすい本が欲しい。これらの推奨事項のうち、最も短いのはどれですか?」

この機能は、PerkecityやChatGPT SearchなどのAIベースの検索サービスに対するGoogleの対応と見なされており、検索インデックスからの回答の要約を提供します。Googleは、今後数カ月以内にこの検索エクスペリエンスを継続的に改善し、AIモード機能を拡張する予定です。

Tag: google google lens artificial intelligence

関連 :

米軍基地で白リン漏れ、住民に避難命令

SiCepatはB2B物流事業に参入し、1つのシステムでエンドツーエンドの流通をターゲットに

南東部DPRDのメンバーであるMoch Mahrusは、アンワル・サダッドの賄賂に巻き込まれたとされるKPKによって拘束された

イラン、反政府デモ参加者2人を公衆の前で死刑判決

BMKG:インドネシアには699の季節ゾーンがあり、天候の修正は均等化できません

人工降雨でダムを満たすことはより安価であると評価され、BMKGは費用は利益の10分の1にすぎないと主張