DeepSeek 在中国投资激增中加速推出新AI型号

雅加达 - 中国初创公司DeepSeek正准备比计划的时间表更快地推出最新一代的人工智能(AI)模型R2。据一些熟悉该公司运营的消息人士透露,原定于5月推出的发射现在正在加速,尽管没有关于其发布日期的具体细节。

此举是在之前的型号DeepSeek R1以超过许多西方AI型号的性能震撼全球市场之后做出的,尽管它是使用低计算能力的Nvidia芯片制造的。R1的推出甚至引发了各个技术领域超过1万亿美元的市场价值下降。

DeepSeek之所以成为人们关注的焦点,是因为它的方法与其他中国科技巨头不同。DeepSeek由知名封闭数量基金前经理梁文丰创立,比商业公司更具研究导向性。

梁于1985年出生于广东,周江大学毕业于通信工程,经营DeepSeek具有更平坦的管理结构。该公司的工作文化与中国科技产业不同,中国科技产业以其直教制度和“996”工作文化而闻名(工作时间从上午9点到晚上9点,每周六天)。在DeepSeek中,包括新毕业生在内的员工通过更灵活的工作时间完全控制了他们的项目。

“Liang给我们完全信任,并将我们视为各自领域的专家,”曾在DeepSeek工作的26岁研究员Benjamin Liu说。“我完全有自由开发他们的人工智能系统的重要部分。

百度和腾讯公司等基于AI的应用程序开发的重点不是DeepSeek更愿意提高其AI模型的质量。这一策略被证明是成功的,因为他们的R1型号可以以更低的成本与世界级的AI模型竞争。

DeepSeek的增长要归功于梁拥有的定量基金公司High-Flyer的大量投资。自2020年以来,High-Flyer已将其约70%的收入用于AI研究,并建造了两组超级计算机。其中之一,Fire-Flyer II,拥有10,000个Nvidia A100芯片,并在开发最新的AI模型方面发挥着重要作用。

巨额投资人工智能计算的决定引起了中国监管机构的注意,主要是由于大量芯片的积累。然而,当局最终没有干预,当美国于2022年禁止向中国出口A100芯片时,这一决定被证明是至关重要的。

现在,中国政府全力支持DeepSeek,甚至已指示该公司在与媒体互动时保持谦逊,以避免西方国家的过度关注。

DeepSeek的成功的主要因素之一是他们更有效地设计人工智能架构的方法。他们的模型使用Experts(MoE)和多头 Latent Attention(MLA)混合技术,这使得数据处理的计算能力消耗降低。根据伯尔尼斯坦分析师的估计,这种方法使DeepSeek的服务价格比OpenAI便宜20到40倍。

然而,DeepSeek的成功也引起了西方的担忧。韩国和意大利等一些国家由于隐私问题而从其国家应用商店中删除了DeepSeek应用程序。与此同时,西方的一些AI企业家,包括Squale AI首席执行官Alexandr Wang,声称DeepSeek拥有最多50,000个高端Nvidia芯片,禁止出口到中国,尽管没有具体的证据证明这一说法。

DeepSeek现在已被各种中国政府实体和公司采用,包括13个市政府和10家国有能源公司。联想、百度、腾讯等科技巨头也将DeepSeek型号集成到其产品中。

中国政府认为DeepSeek证明,他们的国家能够与全球人工智能的主导地位竞争,特别是在贸易紧张局势和美国实施的技术禁运中。

与此同时,西方的DeepSeek竞争对手开始调整其策略。OpenAI最近降低了其服务的价格,而Google Gemini推出了更便宜的订阅计划。DeepSeek还推动了人工智能行业的创新,一些公司已经开始采用更具成本效益的方法。

随着R2加速推出的计划,世界现在正在等待,看看DeepSeek将如何继续刺激全球人工智能产业。