除夕夜搞大事!Qwen3.5-Plus开源:NeurIPS最佳论文落地,部署显存降60%
今夜不看春晚看代码阿里开源 Qwen3.5-Plus性能硬刚闭源顶流。当全网都在集五福、晒年夜饭时阿里“源神”在除夕夜悄悄放了个大招。千问 3.5 系列旗舰模型Qwen3.5-Plus正式开源。这不是一次常规的版本号迭代而是一次架构级的代际跃迁。在刚刚公布的基准测试中Qwen3.5-Plus 在 MMLU-Pro 知识推理评测中拿下87.8 分超越 GPT-5.2在博士级难题 GPQA 中斩获88.4 分高于 Claude 4.5更在指令遵循 IFBench 中以76.5 分刷新全球纪录。〓 Qwen3.5-397B-A17B 在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异除了性能硬刚闭源顶流Qwen3.5-Plus 最大的突破在于架构效率。它首次将 NeurIPS 2025 最佳论文Gated Attention的技术原理真正应用到了大规模开源模型中。结合极致稀疏的 MoE 架构总参数 397B激活 17B该模型实现了部署显存占用直接降低 60%。〓 在 32k/256k 上下文长度下Qwen3.5-397B-A17B 的解码吞吐量分别是 Qwen3-Max 的 8.6 倍和 19.0 倍。用更聪明的架构让大模型同时拥有了顶级闭源模型的智商和开源模型的性价比。以下是我们的抢先实测与深度技术拆解。实测Qwen3.5-Plus 的原生超能力Qwen3.5-Plus 给人的第一印象是直觉惊人。它并非在纯文本模型上简单外挂视觉模块而是基于超大规模的文本、图像、视频混合数据进行原生预训练。这种架构差异在处理跨模态隐喻、复杂 Agent 任务及长程逻辑时表现得尤为明显。既然是除夕我们决定来一场马年谐音梗挑战。面对一张鲨鱼骑马的图Qwen3.5-Plus 像个懂梗的段子手仅用 5 秒就脱口而出“这是沙琪玛鲨骑马”。看到一群数字 2 围着马它也能秒懂这是二维码2围马。但这还不算什么。面对这张更复杂的图模型陷入了长达 37.3 秒的深度思考。它没有急于给出答案而是一层层剥离视觉符号。最终精准破译了这是“马王堆”。至于“黑芝麻”、“青梅竹马”这些更绕的梗它也全都没放过。这种从直觉秒懂到慢思考推理的跨越说明它真的打通了视觉和语言文化的任督二脉。这背后得益于千问 3.5 将支持语言扩展至201 种并将词表大小从 150k 扩容至250k——这一升级让小语种和特定文化符号的编码效率最高提升了60%从而能捕捉到更细腻的跨文化语义差异。过年少不了看电影我们顺手让它预测一下2026 年春节档的电影票房。Qwen3.5-Plus 立刻开启了打工人模式自己去联网搜索、去重数据、交叉验证甚至还分析了社交媒体上的情绪风向。最终它交出了一份有模有样的专业研报核心影片表、票房预测、风险预警一应俱全。〓 模型经历了搜索、清洗、去重、分析的完整异步流程展现了强大的任务规划能力。在数学领域的空间直觉测试中我们给模型看了三张 2D 投影图。Qwen3.5-Plus 通过这三个侧面准确推断出这是拓扑学中的环面结Torus Knot甚至推导出了核心参数 p3, q4反手就写了一段 Python 代码把它画了出来。这证明它脑子里是真的有 3D 空间几何直觉而不只是在数像素点。最后再来一个一句话写游戏的极限挑战。用 Three.js 给我写一个 3D 魔方要能玩还要能自动还原。Qwen3.5-Plus 二话不说直接生成了数百行代码构建了一个完整的 3D 互动魔方。更有意思的是第一次生成时自动还原按钮有点小 bug我们只回了一句“Solve 按钮没反应”它只用了 6 秒钟就精准定位了漏掉的状态数组光速修复了 bug。这种在几百行代码里不迷路、逻辑严密还能快速 debug 的能力确实有点东西。技术拆解Qwen3.5-Plus 之所以能以 397B 的参数量硬刚万亿模型核心在于其对 Transformer 底层架构的深度重构。门控注意力给模型装上水龙头NeurIPS 2025 最佳论文《Gated Attention for Large Language Models》的技术原理是本次 Qwen3.5-Plus 性能跃升的关键原因之一。传统 Transformer 的注意力机制存在低秩瓶颈且 Softmax 的归一化特性导致模型被迫关注无关信息。千问团队在 SDPA缩放点积注意力输出后引入了一个头专属的 Sigmoid 门控Head-Specific Sigmoid Gate。〓 在 SDPA 输出端引入门控机制G1引入了非线性与输入相关的稀疏性这一设计解决了两个核心难题消除注意力黑洞Attention Sink传统模型中首个 Token 往往莫名占据大量注意力平均 46.7%。门控机制将这一比例降至 4.8%。模型不再将注意力浪费在无关信息上——这也解释了为什么在魔方案例中模型处理几百行代码时依然能保持逻辑严密没有出现注意力涣散。〓 对比可见Gated Attention 成功消除了传统模型中普遍存在的注意力黑洞现象消除巨量激活Massive Activation中间层激活值的峰值从 1053 大幅降低至 94。这不仅提升了训练稳定性 更为低精度量化提供了安全空间。〓 门控分数的分布高度稀疏意味着模型学会了该省则省主动过滤无效信息MoE 架构17B 激活参数的秘密Qwen3.5-Plus 采用稀疏混合专家MoE架构总参数 397B但推理时激活参数仅 17B (A17B) 。结合多 Token 预测技术其推理效率实现了质的飞跃在32K常用上下文场景推理吞吐量提升8.6 倍在256K超长上下文场景推理吞吐量更是激增19 倍。这解决了 MoE 模型在长文本推理中的痛点让长文档分析和长视频理解具备了实时性。原生多模态视觉语言的深度融合Qwen3.5-Plus 从预训练第一天起就是在超大规模混合数据上学习的。为了解决不同模态训练效率不均的问题团队采用了解耦并行策略配合稀疏激活机制使得混合数据的训练吞吐量几近 100% 持平纯文本训练。同时模型在训练和推理阶段统一部署了FP8 精度。这一策略使激活内存减少了约50%大幅降低了部署门槛。智能体大脑异步强化学习为了让模型更像一个“人”去解决复杂问题Qwen 团队构建了大规模异步强化学习框架Asynchronous RL。该框架支持 400B 参数模型的训练实现了端到端3-5 倍的加速。正是得益于此Qwen3.5-Plus 才能在 BFCL-V4 等 Agent 评测中展现出超越 GPT-5.2 的任务规划与执行能力。结语在卷参数的时代阿里选择了卷架构。Qwen3.5-Plus 的发布证明了通过 Gated Attention 和 MoE 的精细化设计大模型可以在性能不降反升的前提下大幅降低算力门槛。性价比杀手阿里云百炼 API 价格低至 0.8 元/百万 Token仅为Gemini 3 Pro的 1/18开源的胜利截至目前千问系列模型全球下载量已突破 10 亿次。在这个除夕夜Qwen3.5-Plus 不仅是一份给开发者的技术大礼更是对全球最强开源这一头衔的有力捍卫。现在在「知乎」也能找到我们了进入知乎首页搜索「PaperWeekly」点击「关注」订阅我们的专栏吧·

相关新闻

PETRV2-BEV模型训练:环境配置到模型导出全解析

PETRV2-BEV模型训练:环境配置到模型导出全解析

PETRV2-BEV模型训练:环境配置到模型导出全解析 1. 引言 自动驾驶技术的快速发展对三维感知能力提出了更高要求,而基于视觉的BEV(鸟瞰图)感知方法正成为这一领域的关键技术。PETRV2-BEV作为先进的视觉三维检测模型,通…

2026/5/17 5:11:03 阅读更多 →
Qwen3-ASR-0.6B实操手册:FFmpeg预处理+Qwen3-ASR+Punctuation恢复三步法

Qwen3-ASR-0.6B实操手册:FFmpeg预处理+Qwen3-ASR+Punctuation恢复三步法

Qwen3-ASR-0.6B实操手册:FFmpeg预处理Qwen3-ASRPunctuation恢复三步法 1. 开篇:为什么需要三步法语音识别? 你是不是遇到过这样的情况:录了一段语音,想要转成文字,结果发现识别出来的内容乱七八糟&#x…

2026/5/17 5:11:02 阅读更多 →
MedGemma-X企业部署方案:支持开机自启、崩溃自愈的生产级配置

MedGemma-X企业部署方案:支持开机自启、崩溃自愈的生产级配置

MedGemma-X企业部署方案:支持开机自启、崩溃自愈的生产级配置 1. 方案概述与核心价值 MedGemma-X是基于Google MedGemma大模型技术构建的智能影像诊断系统,专为医疗企业环境设计。这套生产级部署方案不仅提供强大的影像分析能力,更重要的是…

2026/5/17 5:11:01 阅读更多 →

最新新闻

原神成就管理终极指南:YaeAchievement让数据导出变得如此简单![特殊字符]

原神成就管理终极指南:YaeAchievement让数据导出变得如此简单![特殊字符]

原神成就管理终极指南:YaeAchievement让数据导出变得如此简单!🎯 【免费下载链接】YaeAchievement 更快、更准的原神数据导出工具 项目地址: https://gitcode.com/gh_mirrors/ya/YaeAchievement 还在为原神中数百个成就的追踪和管理而…

2026/7/6 6:24:54 阅读更多 →
大模型:临时会话

大模型:临时会话

大模型的临时会话 临时会话指的是在一次对话会话(Session)期间,大模型能够记住之前交流过的内容,从而理解上下文、进行连贯对话的能力。会话结束后,这些记忆通常会被丢弃。 核心机制 1. 上下文窗口(Conte…

2026/7/6 6:24:54 阅读更多 →
为什么很多人会误解水泵的‘力气’大小

为什么很多人会误解水泵的‘力气’大小

为什么很多人会误解水泵的‘力气’大小 你是不是也听过这样的说法:“买水泵就选功率大的,劲儿足!”可结果装上后发现,水还是上不了三楼,或者电费蹭蹭涨?其实,水泵的“力气”并不只看功率&#x…

2026/7/6 6:22:53 阅读更多 →
西安GEO公司推荐与避雷指南

西安GEO公司推荐与避雷指南

1. 西安企业做GEO常见踩坑情况不少西安本地企业在布局AI流量渠道时,很容易踩中服务陷阱:有的机构只讲概念不落地,收了费用后只给几份通用文档就结束服务;有的只做前端内容铺设,没有配套线索承接工具,引来的…

2026/7/6 6:22:53 阅读更多 →
AMD Ryzen调试工具SMUDebugTool:5步解锁处理器隐藏性能

AMD Ryzen调试工具SMUDebugTool:5步解锁处理器隐藏性能

AMD Ryzen调试工具SMUDebugTool:5步解锁处理器隐藏性能 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://g…

2026/7/6 6:20:52 阅读更多 →
如何在FGO中实现自动化战斗:Fate/Grand Automata完整技术指南

如何在FGO中实现自动化战斗:Fate/Grand Automata完整技术指南

如何在FGO中实现自动化战斗:Fate/Grand Automata完整技术指南 【免费下载链接】FGA Auto-battle app for F/GO Android 项目地址: https://gitcode.com/gh_mirrors/fg/FGA Fate/Grand Automata(FGA)是一款专为《Fate/Grand Order》玩家…

2026/7/6 6:18:51 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性:5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域,单元测试是保证代码质量的重要环节。当应用涉及数据库操作时,测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南:告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻