AppleはAIモデルを練習するために「偽の」データを使用しています

ジャカルタ - 少し前に、Appleが人工知能(AI)の分野でその遅れに追いつこうとしていることが明らかになりました。Appleの取り組みの1つは、合成データを利用することです。

9to5macを通じて報告されたブルームバーグのレポートによると、Appleの研究者は人工的または偽のデータセットに大きく依存しています。このデータは第三者によってライセンスされており、AIモデルをトレーニングするために特別に設計されています。

最大の結果を得るために、AppleはiPhoneを使用して偽のデータも改善しました。これらは、第三者から取得した偽のデータを、電話に保存されている一連のユーザーの電子メールの言語と比較します。

このマッチメイキングアクションは、ユーザーに害を及ぼすことはありません。その理由は、Appleは開発したAIモデルにユーザー情報を含めないからです。

今日、Appleを含む多くの企業がユーザーのプライバシーを維持しようとしています。したがって、合成データや偽のデータの使用は新しいものではありません。Appleは、この種のデータに依存している最初の企業ではない。

OpenAI、Microsoft、Metaなどの他のいくつかの大手テクノロジー企業も同じことをしています。彼らは、ユーザーから取得しない特定のデータを使用して、洗練されたAIモデルの開発に成功しました。

合成データは、アルゴリズムによって生成されるため、使用がはるかに安全です。このデータは、技術者がラベルの精度を保証し、さまざまなシナリオでデータを調整し、ユーザーの個人データを保護できるように、内部で作成されています。

Appleは、合成データの使い方について議論していた。同社は、同じトピックで何千もの電子メールを作成し、その電子メールをユーザーがローカルで受信したメッセージと比較したと説明した。

その後、技術者はどの合成データが最も関連性が高いかを分析します。合成データは、適切に行われればAIモデルのパフォーマンスを向上させることができます。ただし、技術者はAIモデルの幻覚を減らすために、データを慎重にキュレーションする必要があります。