蚂蚁开源万亿思考模型Ring-2.5-1T:超强代码与Agent能力,适配Claude Code、OpenClaw
2月13日蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T在长文本生成、数学推理与智能体任务执行上达到开源领先水平为智能体Agent时代的复杂任务处理提供高性能基础支撑。在生成效率上Ring-2.5-1T在32K以上长文本生成场景中对比上代模型访存规模降低10倍以上生成吞吐提升3倍以上。在深度思考能力方面该模型在国际数学奥林匹克竞赛IMO 2025和中国数学奥林匹克CMO 2025自测均达到金牌水平IMO 35分、CMO 105分。同时可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理支持多步规划与工具调用。Ring-2.5-1T在数学、代码、逻辑等高难推理任务和智能体搜索、软件工程、工具调用等长程任务执行上均达到开源领先水平在多项权威基准测试中Ring-2.5-1T 与 DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking 等主流开源与闭源模型进行了系统对比在数学推理、代码生成、逻辑推理和智能体任务执行等高难场景中达到开源领先水平。尤其在深度思考Heavy Thinking模式下该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型展现了强大的复杂推理与跨任务泛化能力。Ring-2.5-1T基于Ling 2.5架构通过优化注意力机制显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B但在混合线性注意力架构的支持下推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比在1T总参数量下Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著且随着生成长度增加效率优势持续扩大。在不同生成长度下的效率对比示意生成长度越长吞吐优势越明显随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力为行业提供了高性能、高效率的智能体时代基础模型新选择。目前Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。

相关新闻

大数据与AI重塑英国金融科技

大数据与AI重塑英国金融科技

个性化时代 大数据使金融科技机构能够精准分析用户现金流的各项关键要素,通过衡量收入、支出与交易历史,结合人工智能与机器学习工具生成可执行的洞察。 机器学习是大数据的天然搭档,该技术能从结构化和非结构化数据集中无缝学习模式&#xf…

2026/7/4 3:08:35 阅读更多 →
中文文本相似度神器StructBERT:一键部署与使用详解

中文文本相似度神器StructBERT:一键部署与使用详解

中文文本相似度神器StructBERT:一键部署与使用详解 1. 背景与价值:为什么需要文本相似度计算? 在日常工作和生活中,我们经常遇到需要判断两段文字是否相似的情况。比如,电商平台要判断用户评论是否重复,客…

2026/7/5 4:20:28 阅读更多 →
Meixiong Niannian画图引擎多轮迭代实践:从V1到Turbo版性能提升300%复盘

Meixiong Niannian画图引擎多轮迭代实践:从V1到Turbo版性能提升300%复盘

Meixiong Niannian画图引擎多轮迭代实践:从V1到Turbo版性能提升300%复盘 1. 项目背景与演进之路 如果你是一个喜欢用AI画图的人,可能遇到过这样的烦恼:想生成一张高清、细节丰富的图片,要么得花大价钱租用云端算力,要…

2026/7/5 0:22:13 阅读更多 →

最新新闻

贝叶斯决策实战:从最小错误到最小风险,如何为你的AI模型选择最优策略?

贝叶斯决策实战:从最小错误到最小风险,如何为你的AI模型选择最优策略?

1. 贝叶斯决策:从直觉到数学公式第一次听说贝叶斯决策时,我正坐在工位上调试一个图像分类模型。当时遇到一个奇怪的现象:模型在测试集上准确率很高,但实际部署时总把一些重要客户照片误分类。主管走过来看了一眼说:&qu…

2026/7/5 12:07:44 阅读更多 →
SVM 核技巧实战:3步验证自定义核函数正定性(附Gram矩阵代码)

SVM 核技巧实战:3步验证自定义核函数正定性(附Gram矩阵代码)

SVM核函数实战:从零验证自定义核的正定性(附Python代码)引言在机器学习领域,支持向量机(SVM)因其出色的分类性能而广受青睐。但当面对非线性可分数据时,传统的线性SVM就显得力不从心。核技巧&am…

2026/7/5 12:07:44 阅读更多 →
Simulink RL Agent 模块实战:5步连接物理模型与DDPG智能体

Simulink RL Agent 模块实战:5步连接物理模型与DDPG智能体

Simulink RL Agent 模块实战:5步连接物理模型与DDPG智能体在工业控制和机器人领域,将物理系统模型与强化学习算法相结合已成为实现智能控制的重要途径。MATLAB/Simulink平台凭借其强大的建模能力和与强化学习工具箱的无缝集成,为工程师提供了…

2026/7/5 12:07:44 阅读更多 →
大模型训练实战:从入门到部署的完整指南

大模型训练实战:从入门到部署的完整指南

1. 大模型训练入门:为什么每个程序员都应该掌握这项技能 2026年的技术圈,不会训练大模型就像2010年不会写网页一样尴尬。我花了三个月从零开始啃下这块硬骨头,现在可以负责任地告诉你:训练自己的大模型没有想象中那么难&#xff0…

2026/7/5 12:05:44 阅读更多 →
TensorFlow模型优化:量化感知训练与剪枝实战指南

TensorFlow模型优化:量化感知训练与剪枝实战指南

1. 为什么需要量化感知训练和剪枝在移动端和嵌入式设备上部署深度学习模型时,我们常常面临两个核心挑战:模型体积过大和计算资源受限。一个典型的ResNet-50模型参数规模超过90MB,在树莓派这类设备上运行需要数秒的推理时间。这直接催生了模型…

2026/7/5 12:05:44 阅读更多 →
7个核心功能解析:WindowsCleaner如何彻底解决C盘空间不足问题

7个核心功能解析:WindowsCleaner如何彻底解决C盘空间不足问题

7个核心功能解析:WindowsCleaner如何彻底解决C盘空间不足问题 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner WindowsCleaner是一款专为Windows系统设…

2026/7/5 12:03:43 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻