ジェミニはキャンバスを起動し、オーディオの概要、ポッドキャストのスタイルでコードを開発し、オーディオを聴くことができます

ジャカルタ - ジェミニは近年多くの改善を受けています。今回、Googleは3つの新機能を立ち上げることで、大規模な言語モデル(LLM)のパフォーマンスを再び向上させました。

Googleが最初に明らかにした機能は、ユーザーの作業を容易にするように設計されたインタラクティブスペースであるCanvasでした。この機能は、ユーザーがドキュメントやコードを書き込むのに役立ちます。さらに、編集はリアルタイムで行うことができます。

Canvasボタンは、ディープリサーチボタンのすぐ横にあるコマンド入力バーの下部に表示されます。文書と直接統合された結果を得るには、ユーザーはコマンドを送信し、Canvasボタンをタップします。

Canvasでは、ユーザーはドキュメントをより簡潔、専門的、または非公式に設定できます。ユーザーは、Canvasでスピーチを編集したり、エッセイを修正したり、レポートを作成したり、その他の創造的な執筆を行うこともできます。編集結果は Google ドキュメントとしてエクスポートできます。

Canvasは書き込み媒体として機能するだけでなく、コードを開発するためにも使用できます。実際、この機能は、コーディングのアイデアを、Webアプリケーション、Pythonスクリプトなどに使用されるプロトタイプに変換できます。

「Canvasはコーディングプロセス全体を簡素化するので、複数のアプリ間をわざわざ移動することなく、単一の場所でコードとデザインを作成、編集、共有することに集中できます」とGoogleは公式ウェブサイトで述べています。

次に、Googleはオーディオ概要と呼ばれるポッドキャストフレンドリーなオーディオ機能を提供します。この機能は、無料または有料のGeminiユーザーが利用できると主張していますが、機能が適切に機能していないようです。

Geminiが表示するデモから、ユーザーはDeep Researchのドキュメント、スライド、またはレポートをポッドキャストスタイルのオーディオに変換できることがわかります。ジェミニは、興味深いトピックを説明する前に、材料を独自に要約します。

audio Overviewを作成するとき、ジェミニはそれを作成するのに数分かかり、最後にオーディオファイルを送信するべきだったと言います。しかし、VOIテストの結果から、ジェミニの無料バージョンはオーディオを作成しませんでした。