DeepSeekは、AIのトレーニングにGoogleジェミニのアウトプットを使用したとされ、倫理論争を引き起こした

ジャカルタ-DeepSeek AIの最新のアップデートは、同社がAIモデルをトレーニングするためにGoogleジェミニモデルのアウトプットを使用しているという報告が出た後、大きな注目を集めています。蒸留として知られるこのテクニックは効率的であると考えられていますが、特にこの種の慣行はOpenAIサービスポリシーによって禁止されているため、倫理に関する深刻な疑問を提起します。 そしてDeepSeekは以前、ChatGPTモデルに似たことをしたとして非難されていました。

DeepSeekは、業界の巨人と競争できると主張するAIモデルが突然登場した後、今年初めから話題になっています。最新のアップデートでは、多くのテクノロジーオブザーバーが、DeepSeekが生データだけでなく、Google Geminiをトレーニングソースとして使用していると疑っています。

この疑惑は、プラットフォームXのユーザーであるSam Paechが、DeepSeekの最新モデルの声とトラック(意思決定時のAIモデルの思考トラック)がジェミニのように聞こえることを明らかにした後に提起されました。この意見は、DeepSeekとジェミニの間の共通の応答パターンを指摘する開発者SpeechMapによって強化されています。

それは以前に起こった

DeepSeekに対する告発は初めてではない。最初に発売されたとき、DeepSeekはトレーニングプロセスでOpenAIのChatGPTアウトプットを使用したとして非難されました。これらの主張は、DeepSeekのトレーニングコストが競合他社よりもはるかに低いと伝えられている理由です。

DeepSeekが使用する蒸留技術は、実際には新しいものではありません。この方法は、教師と生徒の関係のようなもので、「教師」(ジェミニのような高度なAIモデル)によって簡素化された知識が「新生児」(DeepSeekのような新しいモデル)の訓練に使用されます。結果は、リソースと時間の使用において非常に効率的です。

ただし、このような効率は、法律や倫理違反のリスクを伴います。OpenAIは、競合他社のモデルをトレーニングするためにモデルのアウトプットを使用することを明示的に禁止しています。DeepSeekに対する告発が真実であることが判明した場合、ポリシーに違反しています。

倫理に違反していると見なされているにもかかわらず、多くの専門家はDeepSeekのアプローチを戦略的観点から非常に合理的と呼んでいます。非営利のAI研究所であるAI2の研究者であるネイサン・ランバートは、DeepSeekのアプローチは特定の条件下では理にかなっていると述べています。

「もし私がDeepSeekだったら、私は間違いなく最高のモデルAPIから多くの合成データを作成するでしょう。彼らはGPUが不足していますが、現金はたくさんあります。これは基本的に間接的により多くの計算能力を与えます」とランバートは説明し、Android HeadlineのVOIによって引用されました。

米国と中国の貿易紛争は、特に中国が高度な半導体やその他の輸出技術へのアクセスを制限することによって、技術格差を悪化させていることに注意することが重要です。これにより、DeepSeekなどの中国のテクノロジー企業は、AI開発の代替手段を模索することを余儀なくされています。

地政学的な圧力、限られたリソース、そしてグローバルに競争する必要性から、DeepSeekは倫理的および法的にリスクがあっても実用的な道を選んだようです。

DeepSeekを取り巻くポレミックカバーは、急速に成長しているAI業界の規制における抜け穴を示しており、技術的効率は倫理的原則や知的財産権と衝突することがあります。このような慣行が新しい規範になるのか、それともより厳しい規制を奨励するのかは、グローバルなAIの世界では依然として大きな疑問です。