シェア:

ジャカルタ - ジェミニは近年多くの改善を受けています。今回、Googleは3つの新機能を立ち上げることで、大規模な言語モデル(LLM)のパフォーマンスを再び向上させました。

Googleが最初に明らかにした機能は、ユーザーの作業を容易にするように設計されたインタラクティブスペースであるCanvasでした。この機能は、ユーザーがドキュメントやコードを書き込むのに役立ちます。さらに、編集はリアルタイムで行うことができます。

Canvasボタンは、ディープリサーチボタンのすぐ横にあるコマンド入力バーの下部に表示されます。文書と直接統合された結果を得るには、ユーザーはコマンドを送信し、Canvasボタンをタップします。

Canvasでは、ユーザーはドキュメントをより簡潔、専門的、または非公式に設定できます。ユーザーは、Canvasでスピーチを編集したり、エッセイを修正したり、レポートを作成したり、その他の創造的な執筆を行うこともできます。編集結果は Google ドキュメントとしてエクスポートできます。

Canvasは書き込み媒体として機能するだけでなく、コードを開発するためにも使用できます。実際、この機能は、コーディングのアイデアを、Webアプリケーション、Pythonスクリプトなどに使用されるプロトタイプに変換できます。

「Canvasはコーディングプロセス全体を簡素化するので、複数のアプリ間をわざわざ移動することなく、単一の場所でコードとデザインを作成、編集、共有することに集中できます」とGoogleは公式ウェブサイトで述べています。

次に、Googleはオーディオ概要と呼ばれるポッドキャストフレンドリーなオーディオ機能を提供します。この機能は、無料または有料のGeminiユーザーが利用できると主張していますが、機能が適切に機能していないようです。

Geminiが表示するデモから、ユーザーはDeep Researchのドキュメント、スライド、またはレポートをポッドキャストスタイルのオーディオに変換できることがわかります。ジェミニは、興味深いトピックを説明する前に、材料を独自に要約します。

audio Overviewを作成するとき、ジェミニはそれを作成するのに数分かかり、最後にオーディオファイルを送信するべきだったと言います。しかし、VOIテストの結果から、ジェミニの無料バージョンはオーディオを作成しませんでした。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+