ディープシーク次世代アーキテクチャに向けた「中間」AIモデルのリリース

ジャカルタ - 中国の人工知能(AI)開発者DeepSeekは、最新の「実験的」モデルをリリースしました。このモデルは、トレーニングにおいてより効率的であり、以前のモデルよりも長いテキストの順序を処理するのに優れていると主張しています。

杭州に本拠を置くこのスタートアップは、モデルをDeepSeek-V3.2-Expと名付け、開発者フォーラムHugging Faceの投稿で「次世代アーキテクチャとの間のステップ」と呼んだ。

問題の新しいアーキテクチャは、シリコンバレーと中国以外の技術投資家に衝撃を与えたV3およびR1モデル以来、DeepSeekの最も重要な製品の発売である可能性が高い。

V3.2-Expモデルには、DeepSeekスパースアテンションと呼ばれるメカニズムが装備されており、いくつかの面でモデルのパフォーマンスを向上させながらコンピューティングコストを削減できると同社は述べています。9月29日(月)のXプラットフォームへの投稿で、DeepSeekはAPI価格を50%以上引き下げたことも発表しました。

DeepSeekの次世代アーキテクチャは、1月の以前のバージョンほど市場に衝撃を与えるとは予想されていませんが、DeepSeekが再び競合他社よりもはるかに低いコストで高性能性を発揮できれば、アリババのQwenなどの国内競合他社やOpenAIなどの国際的なプレーヤーに大きな圧力をかける可能性があります。