网心算力云上线 Qwen3.5 系列模型

首页

技术趋势

新闻详情

网心算力云上线 Qwen3.5 系列模型

2026年03月20日

不拼参数，拼效率：3970 亿总参数，推理仅激活 170 亿，Qwen3.5 用约 4.3% 的参数量，跑出超越上代万亿稠密模型的性能，这才是下一代大模型该有的样子！

图 | 通义千问 Qwen3.5

目前，网心算力云（OneThingAI）已接入 Qwen3.5 系列模型 API 服务，企业用户专享 9 折优惠，让高性能大模型也能低成本、零门槛、快速落地。

Qwen3.5 核心技术创新

✅ 极致的“智能密度”：MoE 架构再进化

Qwen3.5 系列创新采用了 Gated DeltaNet（线性注意力）+ 高效稀疏 MoE 混合架构，在 397B 总参、仅激活 17B 的前提下，多项核心测试实现对行业顶级模型的全面赶超：

图 | 模型基准测试

其系列还覆盖 122B-A10B、35B-A3B 等多款型号，35B 模型仅激活 30 亿参数，性能即可超越旧版 235B 旗舰，真正做到“少参数、高激活、强性能”。

✅ 原生多模态：视觉 - 语言深度一体化

Qwen3.5 是全球首个原生多模态 MoE 大模型，视觉与文本从底层统一编码、联合训练，彻底杜绝信息损耗与理解割裂。它支持图文理解与长视频时序分析，既能精准感知物理规律与像素级细节，也能读懂复杂图表，自动拆解逻辑生成代码。

比如，你可以问它：

在下图中，电话亭在黄色货车的左侧还是右侧？它会识别并帮你在图片上标注出来。

又或者让它画一画，帮你找出红球到绿球的最短路线

当然，氛围编程，小游戏开发也不在话下：

还能当你的全能办公助手，帮你高效整理数据、处理表格～

据悉，它还支持超 201 种语言和方言，跨语言理解与交互能力大幅强化，号称全场景适配的视觉 - 语言一体化智能体。

✅ 双模式切换：效率与速度的精准平衡

Qwen3.5 在面对数学计算、编程开发、多步逻辑推理等复杂任务时，可自主完成分步推理；针对日常对话、信息查询等轻量化需求，可精简推理步骤，实现更快响应、更低算力消耗。全程智能适配各类场景，让算力利用更高效，使用体验也更流畅。

✅ 推理效率飞跃：最高提升 19 倍

官方实测显示：32K 上下文下推理吞吐量较上代提升 8.6 倍，256K 超长上下文下最高提升 19 倍。模型原生支持 256K 上下文，并可扩展至百万级 tokens，轻松适配长文档分析、长篇代码处理、长视频解析等重度场景。

图 | 32K/256K 吞吐量倍数对比柱状图

总的来说，Qwen3.5 扔掉了参数包袱，专攻实用效能，再搭配网心算力云的高性价比算力，让开源大模型真正实现高效、低成本、可落地。

快速接入 Qwen3.5

Qwen3.5 系列 API 文档：

https://console.onethingai.com/modelApi/list/detail/qwen3.5-397b-a17b

https://console.onethingai.com/modelApi/list/detail/qwen3.5-122b-a10b

https://console.onethingai.com/modelApi/list/detail/qwen3.5-35b-a3b

https://console.onethingai.com/modelApi/list/detail/qwen3.5-27b

https://console.onethingai.com/modelApi/list/detail/qwen3.5-plus

https://console.onethingai.com/modelApi/list/detail/qwen3.5-flash

开箱即用！FireRed、Kling 3.0、Seedream 5.0 Lite 全预装

网心技术 | AI Agent 上岗，从能用 → 敢用

反馈类型*	产品咨询需求建议
内容描述*
联系方式*
姓名：
联系邮箱：
电话号码：
验证码:

OneThingAI →

星域云 →

网心云 →

智能硬件 →

AI应用解决方案→

音视频解决方案→

云游戏解决方案→

客户中心→

帮助中心→

API文档 →

公司新闻 →

技术趋势→

媒体报道 →

公司简介 →

荣誉奖项→

联系我们 →

网心算力云上线 Qwen3.5 系列模型

Qwen3.5 核心技术创新

产品咨询与意见反馈

联系我们