Appleの調査:LLMベースのAIモデルは、論理的に考えることができないため、依然として問題があります

ジャカルタ - Appleの人工知能科学者からの新しい研究は、メタとOpenAIによって開発されたような大規模な言語モデル(LLM)に基づく機械がまだ基本的な推論能力に欠けていることを発見しました。

Appleは、これらのモデルの推定能力を測定するために、GSM-Symbolicと呼ばれる新しいベンチマークを提案しています。

最初のテストでは、質問内の単語にわずかな変更が非常に異なる答えをもたらし、モデルの信頼性を損なうことがわかりました。この研究は、計算に影響を与えるべきではないコンテキスト情報を追加して異なる結果をもたらす数学的推論モデルの「確率」を強調しました。

特に、質問の数値がGSM-象徴ベンチマークで変更されると、すべてのモデルのパフォーマンスが低下します。この研究はまた、質問が複雑になるほど、より多くの主張があればあるほど、モデルのパフォーマンスが悪化することも示しました。

ある例では、Appleチームは、追加情報の影響を受けるべきではない単純な数学的問題をテストしました。しかし、OpenAIとMetaのモデルは、無関係な情報を誤って分類し、モデルが問題を本当に理解しておらず、言語パターンのみに依存していることを証明しています。

この研究は、現在のLLMモデルには重要な推定能力がなく、単語の変更に対して脆弱な照合パターンを使用する傾向があると結論付けました。Appleは、現在のLLMに存在する制限に対処するために、iOS 18.1から始まる独自のより高度なバージョンのAIを導入する予定です。

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: apple kecerdasan buatan

最も人気のあるタグ

#Prabowo Subianto #新年 #シリア #なたる #クリスマス

Appleの調査:LLMベースのAIモデルは、論理的に考えることができないため、依然として問題があります

最も人気のあるタグ

人気

関連

Korean Athlete Who Shooted John Wick Ala Is Now A Balenciaga Model

Kanci-Pejagan Toll Accident KM 223 Injures 5 People, Allegedly Due To Driver Negligence

Holds The 2024 Nataru Alert Apple, PLN Boss Ensures The Preparedness Of The Electricity System In The Regions

Government Officially Increases VAT 12 Percent In 2025, State Revenue Is Estimated To Increase Rp75 Trillion

Snow In Puncak Jayawijaya Is Predicted To Run Out In 2026, BMKG Explains The Trigger

Deputy Chairman Of The House Of Representatives Commission F-Golkar Rejects Prabowo's Proposal For Regional Head Elections Through DPRD