阿里巴巴推出了Qwen3-Max,这是最强的LLM模型,具有1万亿参数

雅加达 - 在Apsara Conference 2025上,阿里巴巴云正式推出了Qwen3-Max,这是阿里巴巴最新的最大大语言模型(LLM)模型,具有超过1万亿的参数。

阿里巴巴的最新车型采用指示(非思维)和思考模式,在各种基准中取得了令人印象深刻的表现,特别是在代码和代理商能力的一代中。

在Instruct模式下,Qwen3-Max在SWE-Bench上取得了69.6的比分,这是衡量LLM解决现实世界软件问题的能力的重要评估标准。

此外,该模型还显示了Tau2-Bench的非凡性能,Tau2-Bench是一种测试对话代理的基准,特别是在使用工具方面 - 构建能够操作的智能代理人的基本技能。

Qwen3-Max 除外,阿里巴巴还推出了最新的Qwen3 型号行列,其中包括视觉语言和多元元素处理:

Qwen3-VL: Qwen家族中最先进的视觉语言模型。它所拥有的Experts混合(MoE)架构可实现灵活的应用,支持从图像或视频到3D映射的视觉编程。

Qwen3-Omni:一端到端多语言模型,能够处理文本、图像、音频和视频,同时以文本和自然言语的形式提供实时流媒体响应。

Qwen3-Coder和Qwen3-Image-Edit也有更新的功能。这个新版本的Qwen3-Coder提供了更快的衍生速度和更高的代码安全性。

同时,Qwen3-Image-Edit 已更新以支持多图像编辑,视觉一致性显着提高。

阿里巴巴还推出了Fun,一个声音LLM模型家族,具有多语言声音引入和合成的先进能力。

该系列包括Fun-ASR,优化的端到端自动语音识别(ASR)模型,以及Fun-CosyVoice,这是一种高质量的声音合成模型,旨在用多种语言产生自然听觉的声音。