9月24日晚,通义千问 Qwen3-Max-Instruct 正式版上线阿里云 API 平台,网心算力云已率先接入。
图 | 模型广场
据悉,Qwen3-Max 系列模型是通义千问迄今为止规模最大、能力最强的模型,模型总参数超 1 万亿,提供指令(Instruct)和推理(Thinking)两大版本。其在最权威的 LMArena 文本排行榜上力压GPT-5,进入全球前三:
图 | LMArena 文本排行榜
✅ Qwen3-Max-Instruct
Qwen3-Max-Instruct 正式版在代码能力和智能体能力方面进一步提升。其在解决现实编程挑战的基准测试 SWE-Bench Verified 上,取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,以74.8分超越 Claude Opus 4与 DeepSeek-V3.1。
图 | 基准测试
✅ Qwen3-Max-Thinking
Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上均取得了满分成绩。据悉,目前该模型仍在训练阶段,我们将紧跟官方节奏,同步上线模型 API 服务。
图 | 基准测试
这次,我们让模型在“旋转的六边形中进行多球随机物理模拟”,看看 Qwen3-Max-Instruct 与 Qwan3-2356-A228-Instruc-2507 的代码能力如何:
图 | Qwen3-Max-Instruct 生成结果
图 | Qwan3-2356-A228-Instruc-2507 生成结果
综合来看,Qwan3-2356-A228-Instruc-2507在增加小球的过程中(已多次抽卡的情况下),出现了小球随机掉出六边形的情况;而Qwen3-Max-Instruct 更好地理解和执行指令,并兼具视觉美感完成了本次任务。
Qwen3-Max-Instruct正式版现已上线网心算力云平台,仅需3步即可快速接入:
步骤一:访问网心算力云官网,完成新用户注册。(新人注册立得5元代金券,学生认证&企业实名可得20元代金券)
步骤二:获取开发者密钥。登录OneThingAI平台,进入账户管理,选择「API密钥」自主创建。(通过平台密钥可与第三方建立通信,拉取平台提供的模型API列表)
步骤三:OneThingAI平台提供curl、Python、Node.js三种技术方案,以便快速接入模型Qwen3-Max-Instruct,满足多样化开发场景及开发者使用习惯。