aiAgent整体梳理
LLM是有 Context 概念的但这个 Context 只存在于“当前一次推理中”。LLM没有跨请求的 Context不会自己记住历史。请求开始 → 模型读取Context → 生成回答 → 请求结束 → Context消失AI Agent 项目80%的复杂度其实都在 Context 层而不是模型层。Agent其实就是在 不断重建上下文循环。构建Context→ 调用LLM→ 得到结果→ 更新Context→ 再调用LLM架构分层AI Agent 架构与 Context 机制笔记1. LLM 与 Context 的核心概念LLM 是有Context上下文概念的但这个 Context只存在于当前一次推理中。LLM不会跨请求记住历史。流程请求开始 → 模型读取 Context → 生成回答 → 请求结束 → Context 消失因此AI Agent 项目80% 的复杂度其实都在 Context 层而不是模型层。Agent 本质是在不断重建上下文循环构建 Context → 调用 LLM → 得到结果 → 更新 Context → 再调用 LLMAgent 架构分层一、Agent 基础模型层Model Layer核心大模型组件包括 - 大模型典型模型GPT-4Claude 3Gemini 1.5职责语言理解推理内容生成工具调用决策二、Prompt / Context 管理层核心上下文构建Prompt / Context 管理层的本质把世界的信息压缩成模型能理解的一段文本上下文。工作流程收集信息 → 选择信息 → 组织结构 → 生成最终输入 → 发送给 LLM什么是 ContextContext 发送给模型的一整段输入信息Context Prompt 其他信息LLM 在推理时只看到一整段文本 → 生成下一段文本因此 Context 就是整段输入文本。Context 的组成Context 不只是历史对话还可能包含Context System Prompt Conversation History User Query Retrieved Knowledge (RAG) Memory Tool Description Instructions示例System: 你是一个专业金融分析师 History: User: 帮我分析苹果公司 Assistant: 好的 User: 这个公司去年收入多少 Knowledge: Apple 2023 revenue: 383 billion USD Instruction: 如果有数据直接回答这一整块文本就是Context。Context 管理模块常见模块Prompt TemplateContext Window 管理RAG 上下文拼接Prompt 策略Context 优化策略Few-shotChain-of-ThoughtSystem PromptTool Prompt最终目标Context Prompt History Knowledge Memory Tools三、记忆层Memory LayerAgent 的长期与短期记忆系统。Memory 的三种类型Agent 系统通常有三种记忆。1. 短期记忆Short-term Memory本质当前会话的历史对话。示例User: 你好 Assistant: 你好 User: 我刚刚说什么系统会保存history [ User: 你好 Assistant: 你好 ]然后拼进 Context。特点生命周期当前会话存储内容聊天记录常见实现数组 / Redis2. 长期记忆Long-term Memory本质保存用户的长期信息。例如User profile: Name: Tom Interest: Python Job: Data Scientist特点生命周期长期存储数据库用于个性化回答3. 语义记忆Vector Memory这是 Agent 系统中最重要的一种记忆。本质把文本转换为向量并进行语义检索。流程文本 ↓ Embedding ↓ 向量数据库 ↓ 相似度检索常见向量数据库PineconeWeaviateMilvusMemory 工作流程用户输入 ↓ 读取 Memory ↓ 检索相关记忆 ↓ 加入 Context ↓ LLM 推理 ↓ 生成回答 ↓ 写入新记忆流程图User ↓ Agent ↓ Memory Retrieval ↓ Context 构建 ↓ LLM ↓ Response ↓ Memory UpdateMemory 写入策略不是所有信息都会被存储。常见策略1. 用户信息例如用户名字兴趣职业2. 重要事件例如用户完成任务用户设定目标3. 知识总结例如会话总结Memory 压缩非常重要随着对话增加历史记录会变得很长因此需要压缩。常见方法Conversation Summary示例原始20轮对话总结用户在讨论 AI Agent 架构这样可以显著节省 Token。四、工具与环境层Tools / Environment Layer这一层负责Agent 执行任务的能力。工具类型API 工具例如搜索天气金融数据软件工具例如代码执行数据分析文档处理外部系统例如CRM数据库SaaS 系统典型工具Wolfram AlphaSlackGoogle Search五、规划与推理层Planning Reasoning Layer这是 Agent 与普通 Chatbot最大区别的层。核心能力Task Decomposition任务拆解Planning规划Reflection自我反思ReAct Loop1. ReAct 推理模式ReAct Reason Act含义思考 → 行动循环结构Thought Action Observation示例Thought: 我需要查天气 Action: search_weather(Tokyo) Observation: 20°C Thought: 我可以回答用户2. Chain-of-Thought 推理逐步推理。示例问题小明有3个苹果又买2个一共有多少推理3 2 53. Tree-of-Thought复杂任务时模型会探索多个方案。示例方案A 方案B 方案C然后选择最优方案。常见研究来源Google BrainStanford University常见方法ReActPlan-and-ExecuteTree of ThoughtsGraph of Thoughts六、Agent 控制与编排层Orchestration LayerOrchestration Layer控制整个 Agent 如何运行的系统。主要组件Agent LoopTool RouterWorkflow EngineMulti-Agent Coordination典型框架LangChainAutoGPTCrewAISemantic KernelAgent 执行流程User Input ↓ Plan ↓ Tool Selection ↓ Execution ↓ Memory Update ↓ Next Step核心模块1. Agent LoopAgent 的循环执行机制思考 → 行动 → 观察 → 再思考示例Thought: 我需要天气 Action: 调用天气 API Observation: 20°C Thought: 可以回答用户2. Tool Router负责选择调用哪个工具。例如系统有多个工具search_apiweather_apidatabase_query用户问东京天气Router 会选择weather_api3. Workflow Engine负责管理复杂任务流程。示例任务写市场分析报告WorkflowStep1 搜索行业数据 Step2 分析竞争对手 Step3 生成报告4. Multi-Agent Coordination用于多 Agent 协作。示例Research Agent → 收集资料 Writer Agent → 写报告 Reviewer Agent → 修改Orchestration 负责协调。七、应用层Application Layer最终面向用户的产品形态。常见类型Chat AgentCoding AgentData AgentResearch AgentCustomer Service Agent典型产品ChatGPTDevinPerplexity AI常见 Agent 总体架构Application Layer │ Orchestration Layer │ Planning Reasoning │ Memory Layer │ Tools / Environment │ Model Layer

相关新闻

计算机网络基础(三)

计算机网络基础(三)

一、URL 基础结构 URL(统一资源定位符)是用于定位互联网上资源的地址,完整结构如下(中括号【】内为可选部分): 协议:// 主机名(IP地址)【:端口号】/[路径]【&…

2026/7/3 2:30:09 阅读更多 →
深空探测数据接口篇(四):LVDS接口

深空探测数据接口篇(四):LVDS接口

目录 前言 1. LVDS 技术概述 2. 物理层架构与工作原理 2.1 差分信号与低摆幅机制 2.2 电流驱动模式 2.3 终端匹配的重要性 3.常见的LVDS传输架构 4. 典型协议芯片及 SerDes 技术 4.1 驱动器与接收器:SN65LVDS / DS90LV 系列 4.2 串行/解串器 (SerDes) 4.…

2026/5/17 9:24:00 阅读更多 →
Claude Code 小白快速入门学习指南

Claude Code 小白快速入门学习指南

一、核心需求本文为仅掌握软件基础的小白设计,围绕“先搭框架、再重实操、快速落地”思路,系统梳理Claude Code的学习路径。核心框架为“需求拆解→精准Prompt编写→代码生成与解读→本地调试优化→落地复用”四步闭环;实操重点推荐从自动化&…

2026/7/3 13:33:19 阅读更多 →

最新新闻

sql语法- MyBatis 中 <association> 标签的作用 1对1的情况

sql语法- MyBatis 中 <association> 标签的作用 1对1的情况

之前我们都是普通查询, 现在我们有个疑问如果出现下面的定义的model 数据库能直接查询么, 就是sql查询出来能够映射 对象作为另外一个对象的属性 // 主对象 public class ProjInfoModel {private Long projId;private String projName;private ProjAppInfoModel projAppInfoMod…

2026/7/3 17:27:54 阅读更多 →
打造你的终极数字伙伴:用DyberPet桌面宠物框架重新定义桌面互动体验

打造你的终极数字伙伴:用DyberPet桌面宠物框架重新定义桌面互动体验

打造你的终极数字伙伴:用DyberPet桌面宠物框架重新定义桌面互动体验 【免费下载链接】DyberPet Desktop Cyber Pet Framework based on PySide6 项目地址: https://gitcode.com/GitHub_Trending/dy/DyberPet 你是否厌倦了单调的桌面背景?是否渴望…

2026/7/3 17:25:54 阅读更多 →
PIC18F8722外部EEPROM存储扩展实战指南

PIC18F8722外部EEPROM存储扩展实战指南

1. 为什么需要外部EEPROM存储扩展在嵌入式系统开发中,PIC18F8722这类微控制器自带有限的内部存储空间。以PIC18F8722为例,其内部EEPROM容量仅为1024字节(1KB),这对于需要存储大量配置参数、历史数据或日志记录的应用场…

2026/7/3 17:21:52 阅读更多 →
高效低查重!AI教材生成工具助力教师轻松完成教材编写

高效低查重!AI教材生成工具助力教师轻松完成教材编写

谁没有在编写教材时感到困惑呢? 面对一页空白的文档,沉思了半个多小时,知识点的整理似乎毫无头绪——是先讲解基本概念,还是先分享案例呢?章节的划分该按照逻辑、还是依据课时呢?不断修改的大纲总是无法符…

2026/7/3 17:21:52 阅读更多 →
从8万美元跌至千元级,车载激光雷达成本暴跌96%背后:芯片化、规模化与全场景落地实战

从8万美元跌至千元级,车载激光雷达成本暴跌96%背后:芯片化、规模化与全场景落地实战

目录 摘要 一、行业综述:激光雷达从天价科研设备到民用标配的蜕变 1.1 十年价格迭代核心数据 1.2 市场格局与产业现状 二、核心降本逻辑一:芯片化架构重构,从分立器件到单芯片集成 2.1 传统分立架构的致命成本缺陷 2.2 芯片化自研的核心降本原理 2.3 头部厂商差异化…

2026/7/3 17:19:52 阅读更多 →
结构化数据 + GEO:让 AI 真正“读懂”你的网站

结构化数据 + GEO:让 AI 真正“读懂”你的网站

如果你的网站内容连 AI 都“看”不明白,再好的产品和服务也会在生成式搜索时代石沉大海。而让 AI 精准理解你的第一步,就藏在看似不起眼的 Schema 标记里。 一、当搜索引擎变成“答案引擎” 过去十年,SEO 的核心是取悦搜索引擎的爬虫——让它…

2026/7/3 17:17:52 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻