新しい研究は、科学論文におけるAI生成技術の使用の影響を明らかにする

ジャカルタ-ドイツのトゥビンゲン大学と北西大学の4人の研究者が主導した最近の研究では、大口語モデル(LLM)の使用が科学的執筆に及ぼす大きな影響が明らかになりました。過剰な単語分析方法を用いたこの研究は、2022年後半にLLMが導入されて以来、特定の単語の使用が急増していることを強調しています。

この研究は、2010年から2024年の間にPubMedに掲載された1400万以上の抽象的な記事を分析することによって実施されました。研究者らは、LLM時代前後の単語の相対頻度を比較し、語彙の選択の変化を特定しました。その結果、「デルブ」、「ショーケース」、「アンダースコア」など、これまでほとんど使用されなかった単語の多くが、LLMがより一般的に使用された後、使用が大幅に急増したことが示されました。

チュービンゲン大学の主任研究者の一人であるアンドレアス・ミュラー博士は、この増加は科学抽象的な執筆プロセスにおけるLLMの使用を示していると説明しました。「2024年までに公開された抽象の少なくとも10%がその過程でLLMを使用していることがわかりました」と彼は言いました。この新知見は、結果として得られたテキストが人道的に見える可能性があるにもかかわらず、不正確な参照や虚偽の主張が含まれている可能性があるため、LLMの使用を検出することの重要性を強調しています。

この研究はまた、LLM後の単語の使用の急増を、COVID-19パンデミックなどの重要な世界保健イベント中の単語の急増と比較しました。Mr.Lner博士は、LLM時代以前は、単語のスパイクは一般的に2015年のエボラ出血熱などの主要な世界的出来事や、2020年から2022年までのCOVID-19パンデミックに関連していたと説明しました。しかし、LLM後の単語の急増は、単語、性質、単語などのスタイルの単語に焦点を当てる傾向があります。

これらの単語の使用の増加は、言語の進化において自然に起こる可能性がありますが、研究者らは、このような突然の有意なスパイクはLLM時代の前にはめったに見られなかったことを強調しています。彼らはまた、LLMの使用は、英語のテキストの編集に助けを必要とする非原産的な作家の間でより一般的である可能性があると指摘した。

この発見は、LLMによって生成されたテキストから不自然なスタイルの単語を検出して削除する人間の能力を向上させる方法を開きました。研究者らは、LLMマーカーという単語に関する知識により、人間の編集者は、それが世界の科学社会に広がる前に、生成されたテキストをより効果的にスクリーニングできるようになることを期待しています。

この研究は今月初めに公表前の形で発表されており、世代AI技術が現代の科学通信に与える影響についてのさらなる議論を刺激することが期待されています。