AgentCPM系列开源项目由多机构联合打造重点解决传统AI智能体在长程任务、自主性及泛化性上的不足。AgentCPM-Explore以4B小模型实现长程深度搜索支持100轮连续交互AgentCPM-Report则提供8B端侧写作智能体支持离线部署和本地知识库。该项目全流程开源包含训练框架、工具沙盒等降低搭建私有化AI助手的门槛特别适合追求数据安全和高效参数利用的用户。如果你这两年用过各种“智能体”大概会有同感让它查点资料、写份报告前两三步还行一旦任务一长、步骤一多就开始乱来瞎编、跑偏、卡死。很多号称“深度研究”的其实只是套了个壳背后还是云端大模型在跑数据一上云企业就不太敢用。想自己搭一个能长期跑在本地、又足够聪明的智能体门槛高得离谱。最近由清华大学自然语言处理实验室THUNLP、中国人民大学、面壁智能和 OpenBMB 社区联合开源的AgentCPM 系列算是把“长程、自主、泛化性不足”这几块硬骨头啃得比较狠的一套方案。尤其是刚发布的AgentCPM-Explore 深度搜索大语言模型智能体直接把“4B 小模型 长程深度搜索”这件事做到了同尺寸 SOTA、越级打 8B 级 SOTA甚至在部分任务上能跟 30B 闭源模型掰手腕还支持 100 轮连续环境交互让“大模型长程任务跑在端侧”这件事离现实又近了一大步。今天就来聊聊这个项目是怎么来的AgentCPM-Explore 到底强在哪跟其他类似平台比它有什么不一样 为什么需要 AgentCPM先简单说下背景。这两年大家都在说“AI 智能体Agent是下一个大趋势”。一个典型的 Agent其实就是Agent 大语言模型 规划 记忆 工具使用它不再只是“你问我答”而是理解目标你丢给它一个目标比如“帮我调研一下 A 行业 2025 年的技术趋势并输出一份结构清晰的报告”。自主规划它自己拆任务、想步骤、决定先查什么、再查什么。调用工具它会去搜网页、读 PDF、跑代码、查数据库把结果拿回来。反思调整发现不对就回头改多源交叉验证直到任务完成。听起来很美好但真落到实际场景问题就来了长程性不足任务一旦超过 5-10 步很多 Agent 就开始“失忆”或“乱走”路径规划能力很弱。自主性不够稍微环境一变或者工具返回个异常它就懵了不会自己调整策略。泛化性一般在公开榜单上表现不错一到真实业务场景就各种水土不服。更关键的是很多“深度研究”类应用本质上是“云端大模型 搜索 人工润色”对数据隐私、网络依赖、成本都非常敏感。所以 AgentCPM 这个项目就是想从根上解决这些问题能不能做一个真正长程、能深度探索的智能体能不能把能力做到端侧可部署让私有化、本地化真正可行能不能全流程开源让社区一起共建而不是只给个黑盒 API于是就有了 AgentCPM 系列以及这次重点要聊的AgentCPM-Explore和AgentCPM-Report。 AgentCPM-Explore4B 参数如何做到“以小博大”先说结论模型规模40 亿参数4B全量参数参与训练。核心定位深度搜索 / 深度调研Deep Research智能体主打长链路、多步推理、工具调用与信息交叉验证。性能表现简单来说就是参数不大但“做事”的能力很强而且能长时间稳定干活。“深度搜索”到底在搜什么很多人一听“深度搜索”以为是“多搜几页百度”。AgentCPM-Explore 的“深度”主要体现在几个层面长链路推理不是一问一答而是把一个复杂问题拆成几十甚至上百步的子任务每一步都基于前一步的结果做决策。多源交叉验证它会主动从多个渠道获取信息比如不同网站、不同 API然后对比、去重、找矛盾而不是“谁先搜到就用谁的”。动态调整策略如果发现某个方向走不通或者信息不够它会自己调整搜索关键词、换工具、甚至回溯到之前的步骤重新规划。实时核验最新信息对于一些时效性强的任务它会优先去查最新的网页、文档而不是死守训练数据。这种“研究员式”的工作方式让它特别适合做复杂问题的多源调研与对比分析需要多轮检索、推理、验证的深度报告对准确性和可追溯性要求高的任务4B 参数为什么能打这里其实有个很有意思的点过去大家总觉得“参数越大能力越强”但 AgentCPM-Explore 用结果说明——在智能体任务上参数效率可能比参数规模更重要。它的“以小博大”主要靠几点任务导向的训练它不是为了“通用聊天”去堆砌参数而是围绕“深度搜索”这个核心场景做针对性的能力构建和强化学习。高质量数据与强化学习通过大规模高质量的交互轨迹数据加上异步强化学习AgentRL让模型学会“如何更好地规划、如何更有效地使用工具、如何在长链路中保持正确”。端侧友好的模型设计从模型结构到推理优化都考虑了端侧部署的需求比如显存占用、推理延迟、能耗等。简单来说就是它没把力气花在“背更多知识”上而是花在“如何用好工具、如何做对决策”上。100 轮连续交互意味着什么很多 Agent 号称“多步推理”但真跑起来超过 10 步就开始掉链子。AgentCPM-Explore 能做到 100 轮连续交互意味着真正的长程任务成为可能比如“调研某个技术领域的十年发展脉络并分析未来趋势”这种任务可能需要几十甚至上百步的检索、整理、推理。更强的容错与自我修正能力在长链路中错误是难免的。AgentCPM-Explore 能在每一步都做校验发现问题及时调整而不是一条路走到黑。更接近人类的“工作流”人类做研究也是“查资料 → 整理 → 发现不足 → 再查 → 再整理”的循环。AgentCPM-Explore 把这个循环做到了模型层面。全流程开源不止是模型权重这一点对开发者来说可能比模型本身更重要。AgentCPM 团队开源了一整套智能体基础设施AgentRL智能体全异步强化学习训练框架用来训练像 AgentCPM-Explore 这样能长时间稳定干活的 Agent。AgentDock工具沙盒统一管理调度平台相当于 Agent 的“手脚”负责工具的注册、调用、容错、负载均衡等。AgentToLeaP智能体工具学习能力一键测评平台用来评估 Agent 在不同任务上的工具使用能力方便开发者迭代优化。这意味着你不仅可以拿 AgentCPM-Explore 的模型权重直接用还可以基于这套框架训练自己的端侧智能体或者接入自己的工具和数据。 AgentCPM-Report8B 端侧写作智能体深度调研也能本地化除了 AgentCPM-Explore团队还发布了AgentCPM-Report一个专注于“深度调研写作”的 8B 端侧智能体。如果说 AgentCPM-Explore 是“深度搜索专家”那 AgentCPM-Report 就是“深度写作专家”模型规模80 亿参数8B基于 MiniCPM4.1-8B 进行深度后训练。核心定位本地部署、支持私有化运行的深度调研型写作智能体能生成逻辑严密、见解独到的万字级深度报告。性能表现核心创新“写作即推理”到底强在哪传统的深度写作大多是“先规划再写作”先让模型生成一个详细大纲然后按照大纲逐段填充内容。这种方式的问题在于大纲的质量直接决定了最终报告的质量而生成高质量大纲本身就需要很强的推理能力。一旦大纲定了后续很难调整容易出现“前面写得太浅后面补不上”的情况。AgentCPM-Report 的 WARP 框架把“规划”和“写作”融合到了一起基于证据的起草Evidence-Based Drafting基于当前大纲执行“检索 → 写作”策略将结构化计划转化为实质性内容重点是信息整合而不是简单聚合。推理驱动的深化Reasoning-Driven Deepening周期性地从局部起草转向全局规划将新生成的草稿作为推理和诊断的新观察检测逻辑差距或肤浅论证如果某部分缺乏深度就生成局部子部分来分解主题并触发针对性的起草循环。这种“边写边想、动态迭代”的方式让模型在写作过程中不断发现新的洞察从而突破“静态规划”的天花板。完全离线安全可控对于企业来说数据安全是“深度调研”类应用的“生死线”。AgentCPM-Report 从设计之初就考虑了这一点完全离线部署支持纯本地、无联网的敏捷部署从根本上规避云端传输与存储带来的数据泄露风险。本地知识库支持基于开源的 UltraRAG 框架可高效接入并深度理解用户本地私有知识库如 PDF、TXT、报告、制度文件等在“数据不出域”的前提下将核心资产安全转化为高价值的专业分析报告。这意味着企业可以用 AgentCPM-Report 在本地构建自己的“专家级调研助手”而不用担心核心数据泄露。部署便捷上手门槛低AgentCPM-Report 的部署和使用也非常友好Docker 一键启动不需要写代码通过 Docker Compose 就能启动管理面板、数据库和工具节点。本地文档拖拽导入支持拖拽方式将 PDF、TXT 等本地文档导入后台系统自动完成切片、索引、向量化。输入研究课题生成专业报告用户输入研究课题后就能得到一份结构清晰、带引用的专业报告。官方还展示了一个很有意思的案例基于《三体》原文知识库AgentCPM-Report 自动完成了“面壁计划”的深度调查报告从线索挖掘、大纲规划到万字长文撰写全流程自动完成。 AgentCPM 与其他平台的对比说了这么多AgentCPM 到底跟其他类似平台有什么不一样这里从几个维度简单对比一下与云端深度研究平台如 OpenAI DeepResearch、Gemini Deep Research对比数据隐私AgentCPM-Report 支持完全离线部署数据不出域适合对数据安全要求高的企业云端平台需要将数据上传到云端存在数据泄露风险。模型控制权AgentCPM 开源了模型权重和训练框架用户可以完全控制模型的训练和部署云端平台是黑盒 API用户无法控制模型的内部细节。成本AgentCPM 可以在本地部署长期来看成本可能更低云端平台需要按调用量付费长期使用成本可能更高。性能AgentCPM-Report 在 DeepResearch Bench、DeepConsult、DeepResearch Gym 等评测基准上综合评分达到甚至超越顶级闭源系统性能上不输云端平台。与其他端侧智能体框架如 AutoGPT、BabyAGI对比任务复杂度AgentCPM-Explore 专注于长程、深度搜索任务支持 100 轮连续交互能处理更复杂的任务AutoGPT、BabyAGI 更多是“玩具级”的演示长程任务能力较弱。工具调用能力AgentCPM 提供了 AgentDock 工具沙盒统一管理调度平台支持工具的注册、调用、容错、负载均衡等工具调用能力更强AutoGPT、BabyAGI 的工具调用能力相对较弱更多是“调用一个工具得到一个结果”。训练框架AgentCPM 开源了 AgentRL 全异步强化学习训练框架支持训练自己的端侧智能体AutoGPT、BabyAGI 没有提供训练框架用户无法训练自己的模型。与其他国内一站式 Agent 平台如 Coze、AgentBuilder对比部署方式AgentCPM 支持本地部署适合对数据安全要求高的企业Coze、AgentBuilder 是云端平台需要将数据上传到云端。模型控制权AgentCPM 开源了模型权重和训练框架用户可以完全控制模型的训练和部署Coze、AgentBuilder 是黑盒 API用户无法控制模型的内部细节。任务复杂度AgentCPM-Explore 专注于长程、深度搜索任务支持 100 轮连续交互能处理更复杂的任务Coze、AgentBuilder 更多是“低代码/零代码”的平台适合快速搭建简单的 Agent。成本AgentCPM 可以在本地部署长期来看成本可能更低Coze、AgentBuilder 需要按调用量付费长期使用成本可能更高。 五、总结AgentCPM 的意义在哪里总的来说AgentCPM 系列的意义主要体现在三个层面技术层面它证明了“小模型 智能体架构”可以在长程、深度搜索等复杂任务上挑战甚至超越大模型。这为“高效参数利用”提供了一个很好的范例。产业层面它让“深度调研、长程任务处理”这些原本只能在云端实现的能力变得可以在端侧、本地化部署。这对数据安全要求高的企业如金融、医疗、政府来说是一个非常重要的突破。社区层面它开源了模型权重、训练框架、工具沙盒、评测平台等一整套基础设施为开发者提供了一个“从 0 到 1”构建端侧智能体的完整解决方案。这有助于推动整个 Agent 生态的发展。如果你对“长程深度搜索”、“端侧智能体”、“深度调研写作”感兴趣或者想自己搭建一个私有化、本地化的智能助手AgentCPM 系列绝对值得关注。最后我在一线科技企业深耕十二载见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包✅AI大模型学习路线图✅Agent行业报告✅100集大模型视频教程✅大模型书籍PDF✅DeepSeek教程✅AI产品经理入门资料完整的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】为什么说现在普通人就业/升职加薪的首选是AI大模型人工智能技术的爆发式增长正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议到全国两会关于AI产业发展的政策聚焦再到招聘会上排起的长队AI的热度已从技术领域渗透到就业市场的每一个角落。智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200%远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。资料包有什么①从入门到精通的全套视频教程⑤⑥包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图还有视频解说全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤ 这些资料真的有用吗?这份资料由我和鲁为民博士共同整理鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。所有的视频教程由智泊AI老师录制且资料与智泊AI共享相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念通过动态追踪大模型开发、数据标注伦理等前沿技术趋势构建起前沿课程智能实训精准就业的高效培养体系。课堂上不光教理论还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】**