DeepSeek-R2 于8月下旬推出,中国人为独立于人工智能

雅加达 - 中国在人工智能(AI)领域实现独立的努力中越来越积极。其特征是,下一代大语言(LLM)模型DeepSeek-R2将于2025年8月15日至30日期间推出。

这个时间表是从与DeepSeek AI模型本身的互动中透露的,这意味着在ChatGPT-5发布几天后,非常接近的发布。

DeepSeek-R2 预计将为建筑物带来重大飞跃。该模型将采用更先进的专家混合(MoE)结构,并集成更智能的钻井网络以应对严重的衍生工作量。

知情其发展的消息人士称,该模型可以达到1.2万亿个参数的规模,几乎是DeepSeek-R1的两倍,该参数为6710亿个参数。这个数字仍然低于CatGPT-4/5,该参数超过1.8万亿个。

独立于西方硬件

作为AI自给自足的战略步骤,DeepSeek-R2使用华为的Ascend 910B芯片进行了全面培训。据报道,华为的计算集群生产了512 PFLOPS的FP16性能,实用性为82%,达到Nvidia A100集群性能的91%。分析师认为,这是减少中国对美国制造的AI硬件的依赖的关键步骤。

DeepSeek-R2 培训的成本比 GPT-4 低97%,这要归功于使用本地硬件和优化技术。分析师预测,DeepSeek将以更便宜的价格提供API接入,这可能会动摇目前由OpenAI和Anthropic主导的价格模型。

DeepSeek-R2推出的预期引发了中国科技股市的走势。人工智能芯片制造商坎布里康(Cambricon)的股价飙升20%,将其市值推高至3550亿元人民币(约合801.2万亿盾)。

相关新闻中,华为还推出了新的AI衍生品框架UCM。UCM旨在加速模型的衍生品,以优化KV Cache数据在HBM,DRAM和SSD等所有存储级别的处理方式。

在与中国银联的测试中,华为报告的延迟减少了90%,透明度增加了22倍。该公司计划在9月之前将UCM作为开源。

总体而言,DeepSeek-R2的推出和华为推出UCM框架标志着中国人工智能雄心壮志的重大转变。这一发展导致了一个未来,中国可以在不依赖来自西方国家的芯片或软件的情况下构建和运行高性能人工智能系统。