DeepSeek让硅谷恐慌:V3.2和V3.2-Speciale声称比GPT-5更好!
雅加达 - DeepSeek再次以一种令人感觉像是惊喜续集的方式震撼了人工智能行业:在让全球市场陷入混乱的一年后,这家中国公司发布了两款新车型 - DeepSeek V3.2和V3.2-Speciale。据称,这些版本能够挑战甚至超越当今最强大的AI系统,包括OpenAI的GPT-5和谷歌的Gemini 3 Pro。
它的战略仍然是一样的:不是追求模型的大小,而是效率。当美国实验室专注于最先进和最昂贵的芯片集群时,DeepSeek实际上证实了更有效的训练方法可以提供同等智能而无需苏丹级基础设施。
该公司还强调,标准版本的模型已经具备了本机使用该工具的推理能力,因此用户不需要启用特殊的推理模式。
最大亮点是V3.2-Speciale,DeepSeek表示,该模型在内部基准测试中已经超过了GPT-5,并在推理密集型任务中与Gemini 3 Pro进行了相当的战斗。
作为证明,DeepSeek在2025年国际数学奥林匹克和国际信息学奥林匹克中公布了其模型的性能结果,并附有可公开检查的最终条目。
性能跃升归因于两个重大创新:为长期上下文效率而设计的稀疏注意机制,以及使用85,000多个复杂多步骤任务扩展和训练的强化学习管道。所有任务都是通过他们的内部系统,即代理任务合成,生成的。
DeepSeek V3.2已经通过网站,移动应用程序和API提供给公众。但是V3.2-Speciale仅通过API端点开放,将在2025年12月15日之后关闭。该模型目前仅作为推理引擎运行,没有工具调用功能。
该行业仍在等待独立基准来证实这一重大声明。但有一点越来越清楚:梁文锋创造的第一个AI想要证明,顶级AI的质量不必以短命的代价来实现。这个消息就足以让该行业的巨头们开始重新审视他们在竞争日益激烈的技术领域作战的方式。