ChatGPT-4チューリングテストに合格し、同等の人間の知性を示す
ジャカルタ-UCサンディエゴの科学者たちは、ChatGPT-4が人間の知性を模するAIの能力を評価する有名なテストであるチューリングテストに合格した最初の人工知能(AI)であると主張しています。
プレ印刷プラットフォームに掲載された最近の研究では、ChatGPT-4が与えられた時間の54%もヒト試験対象を欺くことに成功したことが明らかになりました。
1950年にアラン・チューリングによって提案されたチューリング・テストは、テキストインターフェイスを介して人間と話すかどうかを人々が区別できない場合、コンピュータがインテリジェントと見なされる可能性があるかどうかを評価します。
この実験では、500人の参加者が3人のAIと1人の人間の4つの異なるエージェントと話すように招待されました。テストされたAIは、ChatGPT-4、ChatGPT-3.5、EL スと呼ばれる1960年代のチャットプログラムでした。
結果は、ELGPT-3.5が参加者を22%も欺くことができたのに対し、会話の50%で検出されることなく脱出に成功したことを示しました。ChatGPT-4は54%の成功率でさらに優れていたため、このAIはランダムな機会から予想以上に頻繁に人間のふりをすることができました。
研究者らは、これらの結果は、人工システムが2プレイヤーのインタラクティブなチューリングテストに首尾よく合格したという最初の実証的デモンストレーションを提供することに留意した。しかし、彼らはまた、このテストは、真の知性を示すよりも、人間を模したり欺いたりするAIの能力をよりよく反映している可能性があると強調しました。
エレクトリック・アンド・エレクトロニクス・エンジニアズ・インスティテュート(IEEE)のAI研究者であるネル・ワトソン氏は、ChatGPT-4のようなAIは人間のような特性を示しており、既存の応答リストしかない以前のAIモデルよりも高度になっていると述べた。
この研究はまた、AIに対する一般の認識の変化がチューリングテストの結果に影響を与える可能性があると指摘しています。過去には、高度なAIがなければ、人間のように聞こえるものはすべて人間と見なされていました。しかし、AIに対する意識が高まるにつれて、人々は人間をAIとして誤認する可能性が高まります。
それでも、AIが人間を模する能力は依然として大きな経済的および社会的影響を及ぼしており、チューリングテストは将来のAI開発における重要な評価ツールとなっています。