シェア:

ジャカルタ - アプサラカンファレンス2025で、Alibaba Cloudは、1兆以上のパラメータを持つAlibabaの最新かつ最大の大言語モデル(LLM)モデルであるQwen3-Maxを正式に発売しました。

インストーラ(考えない)モードとシンキングモードが付属するAlibabaの最新モデルは、特にコードとエージェント機能の世代において、さまざまなベンチマークで印象的なパフォーマンスを記録することに成功しました。

インストラクションモードでは、Qwen3-MaxはSWE-ベンチで69.6のスコアを達成し、実際のソフトウェア問題を解決するLLMの能力を測定するための重要な評価基準です。

さらに、このモデルは、会話エージェントをテストするベンチマークであるTau2-Benchにおいても、特に行動可能なインテリジェントを構築するための基本的なスキルのツールを使用する際に、並外れた性能を示しています。

Qwen3-Maxに加えて、アリババは視覚言語処理とマルチモーダル処理を含む最新のQwen3モデルのラインナップも導入しました。

Qwen3-VL:これまでのQwenファミリーで最も先進的なビジョンランジェンモデル。そのMixture-of-Experts(MoE)アーキテクチャは、柔軟な適用を可能にし、画像またはビデオから3Dマッピングへの視覚的プログラミングをサポートします。

Qwen3-Omni:テキスト、画像、オーディオ、ビデオを処理しながら、テキストと自然の音声の両方の形でリアルタイムのストリーミング応答を提供できる、エンドツーエンドの多言語モデルです。

Qwen3-Coder と Qwen3-Image-Edit のアップデートもあります。この新しいバージョンの Qwen3-Coder は、より高速なリプレイ速度と強化されたコードセキュリティを提供します。

一方、Qwen3-Image-Editは、視覚の一貫性が大幅に向上し、多画像編集をサポートするように更新されました。

アリババはまた、多言語音声認識と合成の高度な機能を備えたボイスLLMモデルファミリーであるFunを導入しました。

このシリーズには、最適化されたエンドツーエンドの自動音声認識(ASR)モデルであるFun-ASRと、さまざまな言語で自然に聞こえる音を生成するために設計された高品質の音合成モデルであるFun-CosyVoiceが含まれます。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+