深度学习搜索Agent架构精讲:从迭代到递归,一篇就够了,值得反复研读
深度搜索Agent核心问题其实就有两个怎么把复杂问题拆得合理以及怎么判断搜索结果够不够用。近两年深度搜索Agent发展很快各家的实现思路也越来越成熟围绕这两个问题业界逐渐沉淀出几种主流架构从最基础的Planner-Only到加入评估反馈的双模块设计再到Sentient Labs提出的递归式方案。这篇文章将整理这些架构并顺便附上一些实用的prompt模板。迭代式搜索Agent在讨论更复杂的架构之前先回顾一下最基础的迭代式搜索Agent。这类Agent通常基于ReActReasoning and Acting范式工作流程很简单接收问题→思考→调用工具搜索→观察结果→继续思考→再搜索…如此循环直到找到满意的答案。但是这种简单的迭代模式有个问题当面对复杂查询时单线程一步步搜效率太低。于是就有了并行工作流的思路把一个大问题拆成多个子查询让多个搜索任务同时跑。Planner-Only架构但并行工作流又有个明显的短板子查询数量是写死的。实际情况是简单问题拆2-3个子查询就够了而复杂问题可能要拆5-6个甚至更多。也就是说子查询的拆分应该是动态的而不是预先固定。Planner LLM就是为解决这个问题产生的。它的作用很简单就是分析用户问题的复杂度决定应该拆成多少个子任务每个子任务负责什么以及应该调用哪些工具。一个典型的Planner提示词结构如下# MAKE A STRATEGY/PLAN, YOU HAVE ACCESS TO FOLLOWING TOOLS ↳ describe tools their input parameters here # GUIDELINES FOR QUERY COMPLEXITY, TOOL CALLS #SUBAGENTS ↳ simple fact finding queries requires just 1 subtask with 3-10 tool calls. ↳ direct comparison queries might need 2-5 subtasks with 10-15 tools call each. ↳ complex research might use more than 10 subtasks with clearly divided responsibilities # CLEARLY DEFINE EACH SUBAGENTS ROLE IN FOLLOWING FORMAT { objective :- output_format :- tool_guidance :- rationale :- } # HEURISTICS FOR TOOL GUIDANCE (basically here we are doing Tool RAG) examine all available tools first, match tool usage to subagent objective, search the web only for broad external information or prefer specialized tools over generic ones.这个提示词模板的设计思路值需要注意的是首先告诉Planner有哪些工具可用然后给出不同复杂度问题的拆分参考标准最后要求它为每个子Agent明确定义目标、输出格式和工具使用指导。这样Planner输出的计划才足够具体下游的执行Agent才能照着执行。Planner承担的任务复杂度高是整个架构的核心节点。所以强烈建议用推理能力强的模型来做Planner比如GPT-4o、Claude 3.5 Sonnet或者专门的推理模型如o1、DeepSeek-R1等。停止条件的处理有了Planner问题拆分的问题解决了但还有另一个老问题ReAct循环什么时候该停传统做法是手动设一个固定阈值靠经验调参比如最多跑5轮但这显然不够灵活因为复杂查询需要更多轮迭代简单查询几轮就够了。固定阈值要么会让简单问题跑太多轮浪费资源要么会让复杂问题提前结束拿不到完整答案。所以解决办法是引入一个评估器LLM每轮迭代后让评估器判断当前答案是否已经足够好如果够好就停不够就继续跑。评估器的提示词可以这样写# TASK Your task is to analyse and determine if following information is sufficient or there are knowledge gaps?? Provide reasoning for your answer # Question add here the user question # Generated Answer add here the answer generated by this iteration of ReAct # OUTPUT FORMAT { is_sufficient: true/false reasoning: knowledge_gap: }评估器需要做两件事判断当前答案是否充分以及如果不充分的话缺的是什么。knowledge_gap字段很关键它可以指导下一轮迭代应该往哪个方向搜。澄清问题机制OpenAI在评估器的基础上又加了一层设计。他们观察到有些特别刁钻的问题LLM怎么搜都找不到满意的答案评估器一直返回is_sufficient false循环就没完没了。这种情况往往不是搜索能力的问题而是问题本身定义不清比如用户问最好的笔记本电脑是哪个这里的最好指什么性价比最高性能最强便携性最好不同的理解会导向完全不同的搜索方向。所以OpenAI的方案是当评估器发现反复搜索都无法得到充分答案时不如让Agent主动问用户几个澄清问题把人拉进来帮忙明确需求。这就是所谓的human-in-the-loop设计。检查清单评分而SamayaAI提出了另一种评估思路检查清单评分这个方案对长篇幅答案特别有效。传统评估器面对长答案容易晕单个LLM很难在一大段文本里保持完整的推理链上下文一长就开始丢信息评估结果也就不太靠谱了。SamayaAI的想法是与其让评估器去理解和评判整个答案的内容质量不如换个角度来评估答案是否符合预设的结构规范这个结构规范就是所谓的检查清单。比如说如果用户问的是对比A和B两个产品检查清单可能包括是否分别介绍了A和B的特点是否有价格对比是否有优缺点总结是否给出了推荐建议评估器只需要逐项打勾比从头读完整个答案再打分要简单得多。# TASK Your task is to analyse and determine if the answer follows following checklist or not. If not the identify knowledge gaps. Provide reasoning for your answer. # Question add here the user question # Generated Answer add here the answer generated by this iteration of ReAct # Checklist add your checklist here # OUTPUT FORMAT { is_sufficient: true/false reasoning: knowledge_gap: }Planner Plan Evaluator双模块架构前面说的评估器主要是评估搜索结果但其实Planner生成的计划本身也可能有问题。于是就有了Planner Plan Evaluator的双模块设计先让Planner生成计划再让评估器审核这个计划靠不靠谱通过了再执行。Plan Evaluator有几种典型的设计思路。思路一多计划竞争。让Planner并行生成多个执行计划评估器从中挑最优的那个。这样能提高计划质量但代价是成本和延迟都会上升——多生成几个计划就多几倍的token消耗。思路二单计划审核。先生成一个计划评估器判断好坏好就执行不好就打回去重新生成。这个思路成本更可控但可能需要多轮打回-重生成才能得到合格的计划。计划出问题一般都会是以下几种情况目标失败Agent没完成任务或者完成了但违反了约束条件。比如让模型规划一趟从旧金山到印度的两周旅行预算5000美元结果它给你规划到越南去了或者确实规划了印度行程但预算直接超了。工具失败这又分好几种情况。可能是生成了根本不存在的工具名比如调用bing_search但工具库里压根没这个可能是工具对了但参数个数不对lbs_to_kg只需要一个参数,它传了俩也可能是参数个数对了但值填错了该传120传成了100。Plan Evaluator需要针对这些常见问题设计检查逻辑在计划执行前就把明显的错误拦住避免浪费执行资源。递归搜索Agent前面介绍的架构本质上都是迭代式的但从算法角度看迭代能做的事递归也能做而且递归天然适合处理可分解的层次化问题。Sentient Labs就按照这个思路搞出了ROMARecursive Open Meta Agent。ROMA的核心思想是把复杂问题递归地分解成子问题每个子问题再独立处理。和普通的并行拆分不同ROMA的子问题之间可以有依赖关系——某个子问题的答案可能是另一个子问题的输入。这种设计更符合复杂研究任务的实际结构。上图是ROMA的简化版本完整架构还有一层基于依赖图的信息抽取机制。依赖图用来管理子问题之间的前后关系确保有依赖的任务按正确顺序执行。递归架构的优势在于理论上可以处理任意深度的复杂查询只要问题能被合理分解。但工程实现上也更有挑战需要处理好递归深度控制、子问题结果合并、错误传播等问题。总结–这几种架构并不是非此即彼的关系。Planner-Only适合入门实现简单调试方便加上评估器后系统变得更智能但复杂度和成本也跟着上来检查清单评分这类方案对长文档输出效果不错值得在特定场景下尝试而ROMA的递归思路理论上能处理更深层次的复杂查询不过工程实现的门槛也更高。实际落地时可以先从简单架构跑通再根据具体问题逐步叠加模块。毕竟Agent系统的调试本身就不容易一上来就搞太复杂容易把自己绕进去。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事‌02适学人群应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】

相关新闻

多种优化算法优化WSN网络覆盖附Matlab实现

多种优化算法优化WSN网络覆盖附Matlab实现

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…

2026/7/6 2:35:39 阅读更多 →
【前端发展】2026+ 年的前端行业发展:想吃蛋糕,别只会切页面/架子工

【前端发展】2026+ 年的前端行业发展:想吃蛋糕,别只会切页面/架子工

2026 年的前端行业发展:想吃蛋糕,别只会切页面/架子工 一、整体概览:前端,不止“切页面/架子工” 如果你在 2026 年还跟别人介绍自己是“写页面的前端”,那基本相当于在朋友圈公开表示: “我只会写 div&a…

2026/7/6 2:33:52 阅读更多 →
招标风险防范流程

招标风险防范流程

招投标领域历来是涉法涉纪的高发地带,围标串标行为隐蔽性强、手段多样,稍有疏漏就可能让违规者钻了空子。2026年2月,国家发改委等八部门联合发布《关于加快招标投标领域人工智能推广应用的实施意见》,明确提出到2026年底实现围串标…

2026/5/17 6:48:29 阅读更多 →

最新新闻

WIN11 64位系统编译ameba-rtos-d,260705

WIN11 64位系统编译ameba-rtos-d,260705

这次调试确实经历了相当漫长曲折的过程,帮你做一个完整的问题清单和修改记录,方便你以后归档或者需要在别的电脑上重新配置环境时参考。问题一:32位 Cygwin 检测被拦截现象: Makefile 检测到当前 Cygwin/bash 环境是 64 位&#x…

2026/7/6 2:35:52 阅读更多 →
多人格的记忆,有共用有不共用

多人格的记忆,有共用有不共用

最近听到一个多人格案例,引起我的兴趣。大意是某人考试时切换到考试人格,考完再切换回来。我的兴趣在哪里?在于记忆。主人格切换到后台(暂停),相当于睡了一觉。所以主人格对于副人格的做事经历,…

2026/7/6 2:33:52 阅读更多 →
【嵌入式C语言】07.二级指针+函数

【嵌入式C语言】07.二级指针+函数

一、二级指针1.概念概念:二级指针也是个指针,该指针用来存放另外一个一级指针在内存中的地址(指向指针的指针)二级指针解引用一次,变成一级指针2.定义二级指针int a88;int *p&a;int **q&p;3.使用二级指针*q --》二级指针解引用一次&a…

2026/7/6 2:31:52 阅读更多 →
Unity AssetBundle 加密方案对比:3种主流方法性能开销与安全性实测

Unity AssetBundle 加密方案对比:3种主流方法性能开销与安全性实测

Unity AssetBundle加密方案深度评测:异或、AES与文件头偏移的实战对比 在游戏开发领域,AssetBundle作为资源打包和动态加载的核心技术,其安全性问题一直备受关注。未经加密的AssetBundle可以被AssetStudio等工具轻易解析,导致游戏…

2026/7/6 2:31:52 阅读更多 →
基于AI Agent框架与DeepSeek构建智能副业顾问:从原理到实践

基于AI Agent框架与DeepSeek构建智能副业顾问:从原理到实践

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 这次我们来看一个很有意思的项目:如何用 AI Agent 框架,结合 DeepSeek 等大模型,打造一个能帮你分…

2026/7/6 2:29:51 阅读更多 →
3 种景观格局指数计算工具对比:ArcGIS、Fragstats 与 Python 脚本效率实测

3 种景观格局指数计算工具对比:ArcGIS、Fragstats 与 Python 脚本效率实测

3 种景观格局指数计算工具对比:ArcGIS、Fragstats 与 Python 脚本效率实测景观格局分析是生态学研究中的重要工具,尤其在土地利用规划、生物多样性保护和生态系统服务评估中扮演关键角色。面对海量空间数据,如何高效准确地计算各类景观指数&a…

2026/7/6 2:29:51 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性:5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域,单元测试是保证代码质量的重要环节。当应用涉及数据库操作时,测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南:告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻