未来のApple Vision Proは、リップムーブメントを読むだけでコマンドを受け取ることができます

ジャカルタ-Appleは将来、Apple Vision Pro用の新機能を開発しており、ユーザーのリップの動きを読み取るだけでコマンドやディクテを受け取ることができます。

この機能は、ユーザーがうなずいて通話を受け取ったり、頭を横に振って拒否したりできるAirPods Proにすでに存在する技術の拡張です。

新たに公開された特許文書によると、この機能は、ユーザーが話すことができない、または話したくない状況、たとえば騒々しい公共の場所にいる場合、またはプライバシーを維持したい状況を対象としています。

「ディクテーション構造を備えた電子機器」(Dikte構造を備えた電子機器)と題されたこの特許は、バックグラウンドノイズが音声認識を妨げる可能性があるため、コマンドを入力するには別のより信頼性の高い方法が必要であることを説明しています。

これを実現するために、Appleはいくつかのセンサーの組み合わせを提案しています。その一つが、口の動きを検知するために「画面フレームに取り付けられ、下向きに向かっているビジュアルセンサー」を使用することです。さらに、「顔の振動や変形を検出するための追加のセンサー」を使用することもできます。

追加オプションとして、このデバイスは内側を向いているカメラを使用して、目の動きに基づいて入力オプションを検出することもできます。実際、「入力の確認として手の動きを検出するための外部カメラを含むセンサー」もある可能性があります。そうすれば、ユーザーはダイクテーションプロセスを開始または終了するための手がかりを作成できます。

Appleはまた、Vision Proはユーザーのスピーチパターンを認識するように訓練できると述べました。トレーニングデータは、通常またはささやかな音量のオーディオ録音と、ユーザーの口に焦点を当てたさまざまな視点からの視覚データの形式で行うことができます。

この特許文書は、Vision Pro用のゲームコントローラーを含む、Appleの多くの特許で知られているPaul X. Wangという名前の発明者にクレジットされています。この特許は、さまざまな条件下でのユーザーの機能性と快適性を向上させるためのApple Vision Proの将来の開発の方向性の1つを示しています。