Qwen3-Coder: 在世界中自主编程
Qwen3-Coder: 在世界中自主编程2025/07/22 · 17 分钟 · 3363 词 · QwenTeam丨翻译: English今天我们正式发布Qwen3-Coder这是我们迄今为止最具代理能力的代码模型。Qwen3-Coder 拥有多个尺寸但我们迫不及待地给大家提供当前最强大的版本Qwen3-Coder-480B-A35B-Instruct。这是一个总参数量 480B激活 35B 的 MoE 模型原生支持 256K token的上下文并可通过 YaRN 扩展到 1M token拥有卓越的代码和 Agent 能力。Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果可以与Cluade Sonnet4 媲美。与此同时我们还推出并开源了一款用于代理式编程的命令行工具Qwen Code。Qwen Code 基于Gemini Code 进行二次开发但我们进行了 prompt 和工具调用协议适配使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding任务上的表现。另外Qwen3-Coder 可以和社区优秀的编程工具结合如Claude Code、Cline 等作为一款基础模型我们期待在数字世界的任何角落都可以使用它Agentic Coding in the World!Qwen3-CoderPre-Training我们在预训练阶段上仍然在努力这次Qwen3-Coder 我们从不同角度进行 Scaling以提升模型的代码能力数据扩展总计 7.5T代码占比 70%在保持通用与数学能力的同时具备卓越的编程能力上下文扩展原生支持256K 上下文借助 YaRN 可拓展至 1M专为仓库级和动态数据如 Pull Request优化助力 Agentic Coding合成数据扩展利用 Qwen2.5-Coder 对低质数据进行清洗与重写显著提升整体数据质量Post-TrainingScaling Code RL: Hard to Solve, Easy to Verify与当前社区普遍聚焦于竞赛类代码生成不同我们认为所有的代码任务天然适合执行驱动的大规模强化学习。因此我们选择在更丰富的真实代码任务上扩展 Code RL 训练。通过自动扩展测试样例我们构造了大量高质量的训练实例成功释放了强化学习的潜力不仅显著提升了代码执行成功率还对其他任务带来增益。这将鼓励我们继续寻找 Hard to Solve, Easy to Verify 的任务作为强化学习的土壤。Scaling Long-Horizon RL在真实世界的 Software Engneering Task比如 SWE-Bench模型需要在环境中不断交互自主规划、选择工具调用、接受反馈不断做出新决策这是一个典型的 Long-Horizon RL 任务。我们在 Qwen3-Coder 的后训练阶段执行了 Agent RL鼓励模型通过多轮交互的方式利用工具解决问题。Agent RL 的主要挑战在于 Environment Scaling我们实现了可验证环境的扩展系统借助阿里云的基础设施实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。Code with Qwen3-CoderQwen CodeQwen Code 是一个 CLI 工具修改自 Gemini CLI针对 Qwen3‑Coder系列的模型增强了解析器和工具支持。确保已安装 Node.js 20 及以上版本可以通过以下命令安装bash1curl -qL https://www.npmjs.com/install.sh | sh然后通过 npm 管理器安装 Qwen Code另一种方式是从源码安装Qwen Code 支持 OpenAI SDK 调用 LLM你可以导出以下环境变量或者简单地将其放在.envfile中。bash123export OPENAI_API_KEYyour_api_key_hereexport OPENAI_BASE_URLhttps://dashscope.aliyuncs.com/compatible-mode/v1export OPENAI_MODELqwen3-coder-plus现在你可以通过简单地输入qwen来享受 Qwen-Code 和 Qwen 带来的编程体验。Claude Code除了 Qwen Code 之外现在还可以将 Qwen3‑Coder 与 Claude Code 搭配使用。只需在阿里云百炼平台申请 API Key并安装 Claude Code即可开始畅享编码体验。bash1npm install -g anthropic-ai/claude-code我们提供了两种接入方式帮助你无缝地用 Qwen3‑Coder 进行编码。使用dashscope提供的代理 API只需要将Anthropic的base url替换成dashscope上提供的endpoint即可。可选方案 2使用 claude-code-config 自定义路由Optional 2: 使用 claude-code-config 自定义路由claude-code-router 是一个第三方的路由工具用于为 Claude Code 灵活地切换不同的后端 API。dashScope平台提供了一个简单的扩展包 claude-code-config可为 claude-code-router 生成包含 dashScope 支持的默认配置。生成配置文件和插件目录该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整 ~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最后通过 ccr 开始使用 Claude Code至此你即可通过 ccr 使用 Claude Code 畅享 Qwen3‑Coder 的强大编码能力。祝开发顺利Cline配置 Qwen3-Coder-480B-A35B-instruct 以使用 cline‒ 进入 cline 的配置设置‒ 选择“OpenAI Compatible”模式‒ 在 OpenAI Compatible API tokens处输入从 Dashscope 获取的密钥‒ 勾选“使用自定义基础 URL”并输入https://dashscope.aliyuncs.com/compatible-mode/v1‒ 输入模型名称qwen3-coder-plusUse Cases演示案例演示1Example: Physics-Based Chimney Demolition Simulation with Controlled Explosion1 / 700:08API如您希望通过百炼 API 平台 Alibaba Cloud Model Studio 调用 Qwen3-Coder欢迎使用以下示例代码进行测试:python12345678910111213141516171819202122⌄import osfrom openai import OpenAIclient OpenAI(api_keyos.getenv(DASHSCOPE_API_KEY),base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1,)prompt Help me create a web page for an online bookstore.# Send request to qwen3-coder-plus modelcompletion client.chat.completions.create(modelqwen3-coder-plus,messages[{role: system, content: You are a helpful assistant.},{role: user, content: prompt}],)# Print the responseprint(completion.choices[0].message.content.strip())Further Work我们仍在继续努力提升 Coding Agent 的效果我们希望它能承担更多复杂软件工程中的繁琐任务解放人类的生产力。Qwen3-Coder 仍有更多尺寸在路上在保证良好效果的同时降低部署的开销。另外我们也在积极探索 Coding Agent 是否能够实现 self-improving这是一个令人激动的话题。

相关新闻

HarmonyOS 项目中如何拆分共用层与形态模型

HarmonyOS 项目中如何拆分共用层与形态模型

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…

2026/5/17 1:48:33 阅读更多 →
Linux基础指令(一)

Linux基础指令(一)

文章目录 Linux的版本以及应用Linux的发行版本Linux在企业中的应用 Linux的基础指令计算机系统(特别是类Unix/Linux系统)的经典分层架构基础指令 Linux的版本以及应用 Linux的发行版本 Debian Debian运⾏起来极其稳定,其“稳定”意味着软件…

2026/7/3 5:49:43 阅读更多 →
深入探讨 .ConfigureAwait() 的实际用途

深入探讨 .ConfigureAwait() 的实际用途

在现代的异步编程中,ConfigureAwait 方法常常被开发者提及和使用,但它的实际用途和使用场景却常常被误解。本文将通过一个具体的例子,深入探讨 ConfigureAwait 的用法和其背后的逻辑。 什么是 ConfigureAwait? 在 C# 中,await 关键字用于异步方法,它允许代码异步等待某…

2026/5/17 1:48:32 阅读更多 →

最新新闻

从Unity场景搭建到IoT数据驱动:我的数字孪生入门路径分享

从Unity场景搭建到IoT数据驱动:我的数字孪生入门路径分享

本文分享一个非科班出身的开发者,如何在15天内走通数字孪生全流程,并附上技术栈拆解和学习建议。 写在前面 2026年,数字孪生赛道持续升温。全球市场规模预计达到339.7亿美元(Fortune Business Insights数据)&#xff0…

2026/7/3 7:38:04 阅读更多 →
Flash Attention 安装地狱六重崩溃:CUDA_HOME not set、undefined symbol、预编译轮子不兼容、pip 编译两小时失败——逐一击破

Flash Attention 安装地狱六重崩溃:CUDA_HOME not set、undefined symbol、预编译轮子不兼容、pip 编译两小时失败——逐一击破

Flash Attention 安装地狱六重崩溃:CUDA_HOME not set、undefined symbol、预编译轮子不兼容、pip 编译两小时失败——逐一击破 如果你在 pip install flash-attn 之后见过以下任何一条报错——这篇文章就是写给你的。Flash Attention 是 AI 推理加速最重要的依赖&a…

2026/7/3 7:38:04 阅读更多 →
B站缓存视频转换工具终极指南:3步拯救你的珍贵视频收藏

B站缓存视频转换工具终极指南:3步拯救你的珍贵视频收藏

B站缓存视频转换工具终极指南:3步拯救你的珍贵视频收藏 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾为B站缓存视频无法在…

2026/7/3 7:36:03 阅读更多 →
机器学习生产化:从模型部署到可运维工程系统的实战指南

机器学习生产化:从模型部署到可运维工程系统的实战指南

1. 为什么“模型上线”不是终点,而是系统性风险的起点?你有没有经历过这样的场景:凌晨两点,手机突然震动,钉钉消息一条接一条弹出来——“风控决策延迟超时”“用户申请失败率飙升至32%”“实时反欺诈服务响应时间突破…

2026/7/3 7:34:02 阅读更多 →
仅限首批读者:ChatGPT CoT黄金提示库V2.1(含17个经A/B测试验证的思维链变体,失效率<1.2%)

仅限首批读者:ChatGPT CoT黄金提示库V2.1(含17个经A/B测试验证的思维链变体,失效率<1.2%)

更多请点击: https://codechina.net 第一章:ChatGPT思维链(CoT)的核心原理与演进脉络 思维链(Chain-of-Thought, CoT)并非ChatGPT原生内置的模块化功能,而是通过提示工程激发大语言模型显式生成…

2026/7/3 7:32:01 阅读更多 →
从零到CI/CD内嵌:ChatGPT生成单元测试,7步落地法,含可直接运行的Prompt工程+边界值校验脚本

从零到CI/CD内嵌:ChatGPT生成单元测试,7步落地法,含可直接运行的Prompt工程+边界值校验脚本

更多请点击: https://kaifayun.com 第一章:ChatGPT 生成 单元测试 代码 大型语言模型如 ChatGPT 已成为开发者编写单元测试的高效辅助工具,尤其适用于快速生成覆盖边界条件、异常路径和典型业务逻辑的测试用例。其优势在于理解自然语言描述的…

2026/7/3 7:30:00 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻