ジャカルタ-Nvidiaがサポートする人工知能(AI)スタートアップのSynthesiaは、AIアバターが人間の感情や動きを伝えることを可能にする新しいアップグレードを導入しました。
4月25日、同社は、企業プレゼンテーション、マーケティング、トレーニング目的のためのテキスト指示に基づいて感情を表現することを目的とした「表現型アバター」を明らかにしました。
ジェネレーティブAIは、OpenAIのSoraビデオジェネレータの場合と同様に、リアルなモバイル画像を作成する能力でしばしば賞賛されます。
ただし、AIには欠陥がないわけではなく、特に、歪んだ手や手足で表示されることが多い人間を説明する場合、背景のコラージュ、または唇は音声と調和していません。
Synthesiaは、スタジオで台本を読んでいる本当の人間によって開発された最新バージョンでこれを修正したいと考えています。これは、ボットがリップトラッキングをキャプチャし、感情的な表現をより正確にするために行われます。
Synthesiaの共同設立者兼CEOであるVictor Ribarbelliはビデオで、欠落している作品は、人間とは異なり、「アバターは彼らが何を言っているのか理解していない」ことであり、以前は感情に対する顔の反応の欠如につながっていたと述べました。
スタジオでは、「幸せです。悲しいです。私はイライラしています」と、与えられた感情に合った表情やトーンを伝えることで、簡単な指示に応えるように訓練されました。
新しいアバターは130以上の言語でも利用でき、独自のクローズドキャプションを提供したり、ユーザーの声をクローンしたりすることもできます。
しかし、シンセシアのウェブサイト上の、フランス語、ドイツ語、スペイン語などの英語以外の言語を話すアバターモデル例から、英語モデルは最も高度で人間のように見えます。
伝えられるところによると、このスタートアップは、顧客としてリストされているフォーチュン100企業の少なくとも半数を所有し、55,000社以上の企業にサービスを提供しています。これには、Zoom、Xerox、Microsoft、ロイターなどの業界のリーダーが含まれます。
シンセシアは、2017年に設立された英国を拠点とする会社です。昨年のAIブームのおかげで、同社は現在AI半導体チップの開発を支配しているNvidiaのような主要なサポートで、約10億ドルの評価額に達しました。
シンセシアは、その狭いアプローチ(ビジネス用に人間のようなアバターを作成する)のために、OpenAIのChatGPTやGoogleのGeminiチャットボットなどの競合他社のチャットボットモデル間で発生する騒動や激しい競争の一部を回避しました。
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)