DeepSeek 由于华为芯片组而推迟R2 型号
雅加达 - DeepSeek 将推迟其最新的人工智能 (AI) 模型的推出。这种延迟是在AI 公司未能用华为的芯片训练其AI 模型之后进行的。
据《金融时报》援引知情人士透露,DeepSeek受到当局的鼓励,被华为采用Ascend处理器。然而,这家中国公司实际上遇到了持续的技术问题。
DeepSeek 执教 R2 模型 期间感受到了这个问题。随着持续的问题,DeepSeek最终切换到NVIDIA制造的芯片。但是,DeepSeek仍然使用华为芯片来判断或使用训练有素的模型。
由于这些问题,DeepSeek被迫推迟推出其最新的AI型号。这表明,中国制造的芯片在重要任务中仍然远远落后于美国芯片。这也表明中国仍然面临着巨大的挑战。
另一方面,华为已派出一组技术人员前往DeepSeek办公室。这样做是为了帮助该公司使用其AI芯片开发R2型号。
不幸的是,他们仍然没有成功用Ascend芯片训练R2。除了延迟的训练外,DeepSeek的创始人梁文芬也对AI模型的发展并不满意。
R1的推出震惊了公众,因此公众对R2的期望更加高涨。因此,DeepSeek更愿意花更多时间建造能够保持公司优势的先进模式。