字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构
字节Seed在论文《The Molecular Structure of Thought》中首次给大模型的长链思维定义了分子式结构。字节Seed都开始用化学思想搞大模型了——深度推理是共价键、自我反思是氢键、自我探索是范德华力传统的大模型长思维链推理基本把AI的思考过程等同于线性结构。但很多情况下后续的一个关键结论可能需要回过头去验证早早提出的假设。CoT把这种非线性的依赖关系忽略了。字节Seed在论文《The Molecular Structure of Thought》中首次给大模型的长链思维定义了分子式结构。在这种分子拓扑中三种键是怎么相互配合的好的推理像分子结构团队把DeepSeek-R1、gpt-OSS等强推理模型的长链思维拆成一步一步的然后给每一步之间的“跳跃”打上标签。打完标签发现所有有效的长链思维里其实就三种基础动作来回组合。第一种叫深度推理像共价键一样结实。通俗来说就是类似“因为A所以B因为B所以C”的硬逻辑推进。团队在语义空间里做了一个很形象的量化分析把模型的每一步思考都当成一个点看这些点最后会散成多大一个圈。圈子越小说明模型越没跑题思考越聚焦。结果发现加上深度推理之后这个散点圈直接缩水22%。深度推理确实起到了收束杂念、锁定核心逻辑的关键作用。第二种叫自我反思像氢键一样有弹性但稳定。类似于“等等我刚才那步是不是想错了”“让我重新检查一下前面的假设”能把后面的思考拐回来跟前面的节点呼应上形成一种折叠感。团队测了模型自我反思时的思维轨迹把每一步思考都看成语义空间里的一个点然后计算反思时会跳回多远、落在哪里。发现81.72%的反思步骤都会精准落回之前已经形成的靠谱思路区域里。还对比了反思前后的思维范围反思前语义空间体积是35.2反思后直接压缩到31.2。再看聚类结果就更清楚了反思之后同一类正确思路的点会紧紧抱团而那些零散、跑偏的分支会被自动推开。也就是说自我反思氢键能把靠谱逻辑揉得更紧实、把跑偏想法筛出去、稳住整个推理大局让长链思考不再松散混乱。第三种叫自我探索像范德华力一样弱但覆盖面广。这个就类似于“要不咱们试试这个角度”“有没有另一种可能性”在语义空间里找新的解题路径。量化分析显示加上探索行为之后模型在语义空间里的思维覆盖范围能从23.95扩大到29.22。虽然思路一打开稳定性就会下降容易跑偏想歪但能让模型跳出死胡同不卡在局部最优解里真正找到全新的解题路线。研究发现所有强推理模型的三种思维行为比例和转换规律都高度一致相关性超过0.9说明有效长链推理存在通用的稳定拓扑结构。你可能觉得“共价键”“氢键”只是个比喻但论文发现这个比喻背后藏着严格的数学对应。在Transformer里注意力权重的计算方式长这样眼熟吗这和统计力学里的玻尔兹曼分布一模一样如果把负注意力分数看作能量那么注意力权重就是模型在语义空间里按“能量”高低选择路径的概率就是能量越低被选中的概率越高。论文进一步分析了三种行为对应的“注意力能量”。深度推理通常发生在相邻步骤之间能量最低;自我反思会跳回较远的步骤能量中等;自我探索跳得更远能量最高.这就解释了为什么强推理模型的三种键比例如此稳定。因为模型的注意力机制本身就在追求最低能量的推理路径而深度推理、反思、探索正好对应了不同距离下的能量层级。语义同分异构体和智能熵减接着团队还抛出了语义同分异构体的概念。这词儿是借的化学同样的分子式原子连接方式不同就能搞出性质完全不同的物质。放到推理里就是同样的题目同样的概念点用不同的”化学键“组合去解出来的推理链条可以完全不一样但都能解对。但不是所有异构体都适合拿来教模型。这里就要引入一个关键概念熵减。在热力学里孤立系统总是自发走向混乱熵增而一个有效的长链推理过程本质上就是在语义空间里不断降低不确定性——从一堆可能的方向中逐步收敛到唯一正确的答案。这个过程就是“熵减”。而“注意力能量”机制正是模型实现熵减的工具。模型的注意力天然偏好能量更低的路径。当深度推理低能量被反复选中反思中等能量把前后逻辑折叠起来探索高能量偶尔探路但不喧宾夺主整个系统的“推理熵”就会快速下降逻辑火速收敛。这如论文里说的只有那些能推动熵快速降低的“化学键”组合才是模型真正能学会、能持续进化的稳定态。这在实验中有个很典型的现象从R1和OSS两个不同强推理模型中蒸馏出的推理轨迹语义层面的内容相似度高达95%但混在一起训练模型反而崩溃了。这说明长链推理的关键是思路结构必须稳定、统一模型才能学得会。MoLE-Syn从零合成稳定推理结构发现问题就要解决问题。基于这一整套发现团队搞了个叫MoLE-Syn的方法来从零合成稳定的推理结构。具体操作就两步。第一步从强推理模型比如R1、QwQ、gpt-OSS的推理链里抽出一张行为转移概率图。这张图里每个节点是一种推理行为化学键每条边是从一个行为跳到另一个行为的概率。第二步拿着这张图让普通的指令模型照着图上画的概率去生成推理链。用这个方法从零合成的训练数据喂给Llama或者Qwen效果逼近直接蒸馏R1的水平。而且这么做有一个大好处就是成本低。只要拿到那张行为转移图普通模型就能自己生产合格的长链推理数据。团队把用MoLE-Syn初始化过的模型拿去做强化学习发现跑起来还特别稳。相比直接用蒸馏数据初始化的模型MoLE-Syn版的在RL过程中收益持续增长震荡也小得多。这说明一开始植入的思维结构够稳后面的强化学习就不会出现逻辑偏移。这项研究的负责人为字节Seed算法专家黄文灏曾在微软亚洲研究院担任研究员。第一作者是哈尔滨工业大学博士、字节Seed实习研究员陈麒光。合作单位还包括北京大学、2077AI Foundation、南京大学、M-A-P、中南大学。不得不说这波操作有点当年薛定谔拿物理学公式推生物学那味儿了。给大模型推理这个卷得飞起的领域开了个挺清爽的新脑洞。论文地址https://arxiv.org/abs/2601.06002

相关新闻

硕士论文 “轻舟” 计划:Paperzz 如何用智能辅助重构你的学术写作效率

硕士论文 “轻舟” 计划:Paperzz 如何用智能辅助重构你的学术写作效率

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿paperzz - 毕业论文-AIGC论文检测-AI智能降重-ai智能写作https://www.paperzz.cc/dissertation 在硕士研究生的学术生涯中,毕业论文无疑是最具分量的里程碑。它不仅是对两到三年研究成果的系统总…

2026/7/5 17:08:14 阅读更多 →
UE5 C++(72):文件与文件夹的删除

UE5 C++(72):文件与文件夹的删除

(311) (312) 谢谢

2026/5/17 6:46:58 阅读更多 →
CrushFTP AS2 身份验证绕过漏洞(CVE-2025-54309)研究与利用工具集

CrushFTP AS2 身份验证绕过漏洞(CVE-2025-54309)研究与利用工具集

CrushFTP AS2 身份验证绕过漏洞(CVE-2025-54309)研究与利用工具集 ⚠️ 重要提示: 此漏洞已于 2025年11月被 CrushFTP 官方修复。本研究成果仅用于 教育和防御目的,请勿用于非法攻击。 📝 说明: 本研究基于…

2026/7/5 8:10:38 阅读更多 →

最新新闻

图论算法之深度遍历岛屿问题

图论算法之深度遍历岛屿问题

200. 岛屿数量 - 力扣&#xff08;LeetCode&#xff09; class Solution {public int numIslands(char[][] grid) {int res 0;for(int r 0; r< grid.length; r){for(int c 0; c<grid[0].length; c){if(grid[r][c] 1){res;dfs(grid, r,c);}}}return res;}//从岛屿位置…

2026/7/6 3:07:59 阅读更多 →
Lemos:动态知识网络新范式

Lemos:动态知识网络新范式

Ima 与 Lemos 在知识组织方式上的本质区别在于&#xff0c;Ima 追求精确、静态、可推理的知识结构&#xff0c;而 Lemos 则致力于构建动态、关联、可生长的智能知识网络。Lemos 的核心优势在于其“AI知识图谱”双引擎驱动的范式&#xff0c;将知识库从被动的存储中心转变为主动…

2026/7/6 3:07:58 阅读更多 →
AI智能伴侣开发实战:从零构建你的专属聊天机器人

AI智能伴侣开发实战:从零构建你的专属聊天机器人

一、引言&#xff1a;当AI走进生活 在2026年的今天&#xff0c;人工智能早已不再是科幻电影中的遥远概念。从ChatGPT到DeepSeek&#xff0c;从Gemini到Qwen&#xff0c;大语言模型正以前所未有的速度改变着我们与计算机交互的方式。然而&#xff0c;对于大多数开发者而言&…

2026/7/6 2:59:57 阅读更多 →
避开 Playwright 常见陷阱,让你的 UI 测试更快更稳

避开 Playwright 常见陷阱,让你的 UI 测试更快更稳

做UI自动化测试的朋友应该都有过这种体验——本地跑得好好的&#xff0c;一上CI就挂&#xff1b;周一全绿&#xff0c;周二莫名其妙红一片&#xff1b;加了sleep能过&#xff0c;不加就报元素找不到。 如果你也遇到过这些情况&#xff0c;别急着怀疑是自己的代码写得不够好。很…

2026/7/6 2:57:57 阅读更多 →
AI Agent Skills:从代码补全到智能开发的效率革命

AI Agent Skills:从代码补全到智能开发的效率革命

&#x1f680; 30款热门AI模型一站整合&#xff0c;DeepSeek/GLM/Qwen 随心用&#xff0c;限时 5 折。 &#x1f449; 点击领海量免费额度 如果你还在用 AI 编程助手只是让它帮你补全代码行&#xff0c;那你可能只发挥了它 10% 的潜力。真正的效率革命&#xff0c;发生在你教…

2026/7/6 2:57:57 阅读更多 →
SONiC 2024 容器化架构解析:10个核心Docker容器如何驱动网络转发

SONiC 2024 容器化架构解析:10个核心Docker容器如何驱动网络转发

SONiC 2024容器化架构深度解析&#xff1a;10个核心容器如何构建下一代云网络1. 现代网络操作系统的容器化革命当微软在2016年首次开源SONiC项目时&#xff0c;很少有人能预料到这个基于Linux的网络操作系统会彻底改变数据中心网络的构建方式。八年后的今天&#xff0c;SONiC已…

2026/7/6 2:55:56 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性&#xff1a;5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域&#xff0c;单元测试是保证代码质量的重要环节。当应用涉及数据库操作时&#xff0c;测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南&#xff1a;用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南&#xff1a;告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况&#xff1a;下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools&#xff1a;5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱&#xff0c;支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里&#xff0c;参与了关于混合后量子密码学的讨论&#xff0c;应付端点攻击找茬的人&#xff0c;还参与留言板讨论后&#xff0c;发现“威胁模型”对多数人仍是陌生概念&#xff0c;且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”&#xff1a;我理解的渗透测试到底是什么&#xff1f;每次看到新闻里说某个大公司的数据被“黑”了&#xff0c;或者某个网站被攻击导致服务瘫痪&#xff0c;你是不是和我一样&#xff0c;心里会冒出两个念头&#xff1a;一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻