杰克逊维尔 - NVIDIA宣布了一款名为Alpamayo-R1的新型人工智能(AI)模型。该技术旨在构建物理AI设备,如机器人或自动驾驶汽车。

在NeurIPS AI会议上推出,Alpamayo-R1是第一个专注于自动驾驶的视觉语言动作模型。该视觉语言模型能够同时处理文本和图像。

凭借这种能力,自动驾驶汽车可以很好地看到和识别周围的环境。这样,自动驾驶汽车可以做出更自然的驾驶决策,就像人类一样。

Alpamayo-R1是NVIDIA Cosmos-Reason模型的扩展,Cosmos模型是一个推理模型,在作出反应之前,它会深入考虑决策。Cosmos模型系列最初于2025年1月发布。

通过推出这款新车型,NVIDIA希望其推理模型能够提供所需的“常识”自动驾驶汽车。这种能力对于更复杂的驾驶决策至关重要。

与这种新的视觉模型一起,NVIDIA还推出了一个名为Cosmos Cookbook的一系列资源。这些资源包括GitHub上的新培训后工作流程和逐步指南。

本指南旨在帮助开发人员更好地使用和训练 Cosmos 模型。食谱包括数据选择,合成数据的创建,模型评估,并且可以在 GitHub 和 Hugging Face 上使用。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)