英伟达首席执行官:最新一代芯片已全面生产,AI性能提高五倍
杰森·黄(Jensen Huang)表示,英伟达的最新一代芯片现已进入全面生产阶段。据称,这款新芯片可以提供比上一代高出五倍的人工智能(AI)计算性能,特别是用于运行聊天机器人和各种AI应用程序。
黄在拉斯维加斯消费电子展(CES)上的讲话中发表了这一声明。他透露,英伟达最新的芯片计划于今年晚些时候推出,目前正在英伟达实验室进行测试,由许多AI公司进行测试。这一举措是在英伟达与传统竞争对手和开始开发自己的AI芯片的大型客户日益激烈的竞争中采取的。
英伟达最新的芯片平台名为Vera Rubin。该平台由六块独立的芯片组成,其中高端服务器配备了72个新一代图形处理单元(GPU)和36个新一代中央处理单元(CPU)。黄仁勋解释说,该系统可以组装成一个单元或“pod”,包含1000多个Rubin芯片,能够将AI“令牌”制造效率提高10倍。
为了实现这种性能跃升,Nvidia使用了一种专有数据类型,预计该行业将更广泛地采用该数据类型。黄说,尽管晶体管数量仅比上一代增加约1.6倍,但这种性能改进非常显着。
尽管Nvidia仍然主导着AI模型培训市场,但在向数亿用户提供AI服务方面,竞争正在加剧。竞争对手来自AMD等公司,以及开发内部AI芯片的谷歌等大型客户。为了应对这一挑战,Nvidia推出了名为context memory storage的新技术,旨在帮助聊天机器人在长时间和复杂对话中更快地提供响应。
除了计算芯片,英伟达还展示了具有共同封装光学技术的最新一代网络交换机。该技术对于将数千台机器连接到一个统一的系统中至关重要,并将与博通公司和思科的解决方案直接竞争。
英伟达表示,CoreWeave将成为首批使用Vera Rubin系统的公司之一。此外,微软、甲骨文、亚马逊和Alphabet也预计将采用该技术。
在另一份声明中,黄仁勋还强调了自动驾驶汽车的新软件,该软件可以帮助系统做出路线决策,同时为工程师提供数据跟踪。这款名为Alpamayo的软件将以更广泛的形式发布,并附带开源训练数据,以便汽车制造商可以评估和信任结果。
黄仁勋还回应了上个月从初创公司Groq收购芯片人才和技术的举动。据他介绍,此举不会影响英伟达的核心业务,但有可能在未来产生新产品。
另一方面,英伟达希望表明其最新芯片能够超越旧芯片的性能,例如中国市场仍然需求的H200。黄仁勋承认,中国对H200的需求仍然强劲。英伟达首席财务官科莱特·克雷斯补充说,该公司已申请了该芯片的运输许可,并仍在等待美国和其他相关政府的批准。