从 RAG 到 Agent学习笔记
大模型LLM的能力正在逐渐趋同真正的技术壁垒正在向 Harness Engineering驾驭工程转移。本文将结合近期技术探讨系统梳理大模型应用开发中的核心工程化技术涵盖 RAG 结构化输出、约束解码原理、工具调用范式、Agent 编排框架以及沙箱环境构建。一、 RAG 结构化输出的“三道防线”在 RAG检索增强生成流程中将大模型从不可控的“文本生成器”改造为稳定的“结构化数据提取器”需要建立严密的质检与交付体系提示工程软引导在 Prompt 组装阶段通过角色设定、格式定义和 Few-Shot 示例在语义层面与模型达成“契约”诱导其输出目标格式。格式约束硬控制在模型推理Inference过程中实施硬性拦截。通过 RAG 框架调用底层推理引擎将 JSON Schema 注入在模型生成每一个 Token 时进行 Logits Masking概率屏蔽将不符合语法的 Token 概率强制设为负无穷从数学上剥夺模型犯错的可能性。后处理兜底修复在拿到模型返回值后执行闭环校验。包括自动解析捕获、自我修正循环将错误信息重新封装 Prompt 让模型修正以及业务逻辑校验确保最终数据逻辑有效。二、 约束解码的底层原理有限状态机与 Logits Masking在不修改大模型的前提下控制其输出的每一个 Token核心在于约束解码。其底层原理是将 JSON Schema 编译成有限状态机FSM在模型每生成一个 Token 时用状态机判断哪些 Token 语法合法把不合法的 Token 概率强制归零。1. 有限状态机FSMFSM 是一种描述系统行为的数学模型由有限个状态、状态之间的转移规则和输入事件组成。在结构化输出中FSM 用于实时校验每一步输出的合法性例如初始状态允许输出{若已输出key则下一状态只允许:。2. Logits Masking 机制大模型生成文本是自回归的。约束解码在模型计算出所有 Token 的 logit 分数后、Softmax 归一化之前插入一个“语法警察”合法 Token 的 mask 值为 0保留原始 logit非法 Token 的 mask 值为 -∞经过 Softmax 后概率变为 0。模型全程以为自己在自由生成但推理引擎只从中挑选合法的 Token实现了“不碰大脑只控制嘴巴”的物理隔离。三、 工具调用范式MCP 与 CLI 的抉择在 AI Agent 调用外部工具时MCP 与 CLI 代表了两条不同的技术路线两者并不互斥而是互补MCP标准化协议路线被称为“AI 的 USB-C 接口”本质是标准化的 Client-Server 协议。适用于跨系统、跨模型、企业级集成提供安全可控的鉴权与沙箱隔离但需要额外开发和维护 MCP Server。CLI环境控制路线模型直接生成并执行系统命令行指令。具有零开发成本、极其轻量、组合性强的优势适用于单机任务、脚本执行和快速原型但安全风险较高且缺乏标准化。当前业界的最佳实践是两者融合MCP 负责提供标准化的工具发现与调用框架而 CLI 负责在 MCP Server 内部执行具体的系统级操作。四、 Agent 编排LangChain 与 LangGraph 的定位在智能体编排中LangChain 与 LangGraph 承担着不同的工程角色LangChain作为 Agent Framework框架能实现基础的流程编排。通过 Chains 和 Agents 将多个步骤组合成工作流支持线性流水线、条件分支等标准化业务流程。LangGraph作为 Agent Runtime运行时专为复杂、有状态、多智能体协作的场景设计。提供基于有向图的编排能力支持 Supervisor 模式、Fan-out 扇出模式、Human-in-the-Loop人工审批以及 Checkpointing断点恢复与状态回溯。简而言之LangChain 是“零件”LangGraph 是“组装工厂”。构建复杂、可中断、可恢复的生产级智能体系统LangGraph 是更合适的选择。五、 智能体沙箱操控页面与软件部署在智能体沙箱中操控页面完成软件部署是通过“隔离沙箱容器 无头浏览器CDP协议 大模型 ReAct 决策循环”三者协同完成的沙箱层通过 Docker 容器或云沙箱提供完全隔离的执行环境确保智能体的操作不影响外部系统。浏览器层沙箱内启动无头浏览器通过 CDPChrome DevTools Protocol建立 WebSocket 连接赋予智能体“看”获取 DOM/截图和“做”点击/输入/执行 JS的能力。决策层大模型通过 ReAct 框架不断执行“感知→思考→行动→反馈”循环。为节省 Token通常对页面 DOM 进行精简表示仅提取可交互元素。若操作失败智能体还能进行自动重试、重新规划甚至现场编写新函数进行自我修复。大模型应用开发正在从“拼模型能力”走向“拼工程架构”。无论是通过约束解码实现 100% 格式正确的结构化输出还是通过 MCP/CLI 融合打通工具链亦或是利用 LangGraph 和沙箱构建复杂任务的执行环境其核心思想都是把不可控的大模型装进可控的工程框架里。掌握这套 Harness Engineering 体系是构建生产级 AI 应用的必经之路。

相关新闻

文旅伴手礼场景,白酒包装定制如何融合地方特色元素

文旅伴手礼场景,白酒包装定制如何融合地方特色元素

文旅伴手礼视角下的白酒包装定制策略在文旅产业与地方酒文化深度融合的背景下,白酒包装定制已不再局限于简单的瓶身印刷,而是演变为承载地域文化、提升伴手礼附加值的关键载体。对于景区管理机构、地方酒企及文创开发团队而言,如何将地方特色…

2026/7/5 6:09:48 阅读更多 →
如何轻松管理Minecraft游戏体验:PCL启动器完整指南

如何轻松管理Minecraft游戏体验:PCL启动器完整指南

如何轻松管理Minecraft游戏体验:PCL启动器完整指南 【免费下载链接】PCL Minecraft 启动器 Plain Craft Launcher(PCL)。 项目地址: https://gitcode.com/gh_mirrors/pc/PCL 如果你是一位Minecraft玩家,是否曾为复杂的游戏…

2026/7/5 6:07:48 阅读更多 →
WPS-Zotero插件:5分钟搞定跨平台文献引用,科研写作效率翻倍

WPS-Zotero插件:5分钟搞定跨平台文献引用,科研写作效率翻倍

WPS-Zotero插件:5分钟搞定跨平台文献引用,科研写作效率翻倍 【免费下载链接】WPS-Zotero An add-on for WPS Writer to integrate with Zotero. 项目地址: https://gitcode.com/gh_mirrors/wp/WPS-Zotero 还在为Windows和Linux之间切换文献管理软…

2026/7/5 6:05:48 阅读更多 →

最新新闻

2026深度评测!7款AI论文写作平台,哪款才是你的心头好

2026深度评测!7款AI论文写作平台,哪款才是你的心头好

AI写论文工具介绍 在2026年的学术写作智能化浪潮中,越来越多人选择使用AI写论文工具。许多现有的工具在撰写硕士和博士论文等长篇作品时,往往面临一些难题。它们的理论深度常常不足,逻辑结构也显得松散。这使得普通的AI论文写作工具无法满足…

2026/7/5 7:26:09 阅读更多 →
如何在原神中突破60帧限制:终极帧率解锁完整指南

如何在原神中突破60帧限制:终极帧率解锁完整指南

如何在原神中突破60帧限制:终极帧率解锁完整指南 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 你是否厌倦了原神60帧的限制,想要在提瓦特大陆体验更流畅的战斗和…

2026/7/5 7:24:06 阅读更多 →
STM32驱动WS2812智能LED的硬件设计与固件优化

STM32驱动WS2812智能LED的硬件设计与固件优化

1. 项目背景与硬件选型考量WS2812智能LED与STM32L432KC的组合在嵌入式灯光控制领域堪称黄金搭档。作为一名长期从事嵌入式开发的工程师,我最初选择这套方案是看中了STM32L432KC的低功耗特性(运行模式下仅100μA/MHz)与WS2812的高集成度优势。…

2026/7/5 7:24:06 阅读更多 →
XUnity.AutoTranslator深度解析:Unity游戏自动翻译技术指南

XUnity.AutoTranslator深度解析:Unity游戏自动翻译技术指南

XUnity.AutoTranslator深度解析:Unity游戏自动翻译技术指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 在全球化游戏体验日益重要的今天,语言障碍成为许多玩家面临的现实问题。…

2026/7/5 7:22:05 阅读更多 →
Python xhs库终极指南:5分钟上手小红书数据采集完整教程

Python xhs库终极指南:5分钟上手小红书数据采集完整教程

Python xhs库终极指南:5分钟上手小红书数据采集完整教程 【免费下载链接】xhs 基于小红书 Web 端进行的请求封装。https://reajason.github.io/xhs/ 项目地址: https://gitcode.com/gh_mirrors/xh/xhs 小红书作为中国最受欢迎的社交电商平台,每天…

2026/7/5 7:20:04 阅读更多 →
YOLOv11 改进 - SPPF模块   替代SPP,FFocal Modulation焦点调制:即插即用轻量设计优化全局语义捕获

YOLOv11 改进 - SPPF模块 替代SPP,FFocal Modulation焦点调制:即插即用轻量设计优化全局语义捕获

前言 本文介绍了焦点调制网络(FocalNets)及其在YOLOv11中的结合应用。FocalNets完全用焦点调制模块替代自注意力,该模块由焦点上下文化、门控聚合和逐元素仿射变换组成,能有效建模视觉中的标记交互。它通过局部特征聚焦、全局信息…

2026/7/5 7:16:03 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻