シェア:

ジャカルタ-Googleは、2か月前に発表された一連の人工知能(AI)モデルのアップグレードであるジェミニ1.5を導入しました。あるリクエストで、ユーザーはGoogleのAIに以前よりもはるかに多くのコンテンツ、つまり30,000行のコード、11時間のオーディオ、または1時間のフルビデオを分析するように依頼できます。

ファミリー中規模のモデルProは、100万のデータトークンを処理できます - アントロピック、おそらくそれに最も近い競争相手であるクロードネス21テクノロジーによって処理できる金額の5倍です。

OpenAIなどのリリースとともに、Googleのますます貪欲なAIは、シリコンバレーで最も有能で最も市場性の高いテクノロジーを構築するための急速な軍拡競争を反映しています。

ロイターとのインタビューで、アルファベットのCEOであるSundar Pichaiは、この進歩を、彼の会社の事業を支える「ブレークスルー」の1つとして歓迎しました。基本的に、検索業界の創設者は新しいタイプの調査を可能にした、と彼は言った。「あなたは劇的に人々が世界について尋ねるためのより広い見解を与えました」とピチャイは言いました。

Pichai氏によると、Googleが内部で議論している例の1つは、映画制作者がAIに批評家のように失礼な映画を判断するよう依頼する方法です。「これは、私たちがチームとして話している使用例の1つにすぎませんが、空はここでの限界です」と彼は言いました。

もう1つは、一度に複数の会社の財務諸表を提出することです、とPichaiは言いました。プレスデモは、AIが約59秒で44分のビデオから情報を抽出する方法と、ユーザーがAIにテキストと画像の組み合わせに反応するように求めるマルチモーダルリクエストを示しています。

アルファベットは、Google SearchとYouTubeに更新されたテクノロジーを提供するだけでなく、Gemini 1.5がクラウドユニットに顧客を引き付けることを望んでいます。マイクロソフトなどのより大きなライバルと競合する中で、アルファベットは最近、部門の売上成長が増加しています。

2月15日木曜日から、Googleは、そのような数百万トークンベースのAIを限られた数のビジネス顧客に開放し、各開発者はバージョン1.0で構築し、利用可能になったら最新世代に切り替えることができると述べています。

そのような強力なAIモデルがアルファベットにとっていつ利益になるのかと尋ねられたピチャイ氏は、「これらは私たちにとって有益なことです。また、時折、これらのモデルを実行する際に非常に効率的になります」と彼は言いました。

効率性は、Googleがジェミニ1.5で強調した他の改善点の1つです。Googleは、以前の調査と最近の競合他社の発表によると、AIが「専門家の混合物」として知られる情報を収集するためのそれほど負担の少ない方法を実装していると述べています。ある企業関係者は、私たちが知っているすべての人に電話するのではなく、質問に答えるために鉄の大物に電話することによってアプローチを例えました。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)