大模型RAG 架构图解：从基础到高级的7种模式！-尧图手机网站定制

前言「RAG 技术通过在 AI 生成过程中引入外部知识检索从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构让 AI 回答更准确、更全面」「核心组件」嵌入模型将文本转换为向量表示生成模型负责最终的内容生成重排序模型优化检索结果的相关性向量数据库存储和检索向量化的内容提示模板规范化的查询处理模板AI Agent 智能决策和任务协调图例 1Naive RAGNaive RAGRetrieval-Augmented Generation是最基础的一种架构用于结合检索和生成来处理复杂的任务比如问答或内容生成。其基本架构如下1.检索模块Retriever负责从知识库如文档集合或数据库中找到与输入查询相关的上下文。通常基于向量检索技术使用嵌入模型如 Sentence Transformers 或 OpenAI Embeddings将查询和文档嵌入到向量空间中计算相似性并返回最相关的文档。2.生成模块Generator接收用户输入和检索到的上下文生成最终的回答或内容。通常使用大型语言模型如 GPT 或 T5来生成自然语言输出。3.流程用户输入一个查询如问题。检索模块从知识库中找出与查询相关的文档片段。将检索结果连同查询一起传递给生成模块。生成模块基于上下文生成回答或内容。特点简单高效由于模块化设计容易实现和调试。可扩展性强检索模块和生成模块可以独立优化或替换。存在局限性Naive RAG 通常假设检索的上下文是完备的这在知识库更新不及时或检索效果不佳时可能导致生成结果不准确。应用场景文档问答基于企业内部文档或外部知识库回答用户提问。内容生成辅助生成新闻、摘要等需要结合外部信息的内容。技术支持从常见问题解答FAQ库中检索答案并生成自然语言响应。Naive RAG 是 RAG 系列架构的起点更复杂的变种如使用多轮交互或强化学习优化通常在此基础上扩展。Retrieve-and-rerankRetrieve-and-Rerank是在基础 RAG 架构上的增强版本通过引入重排序Reranking步骤进一步优化检索结果的相关性。这种方法非常适合在需要高精度答案的任务中使用。架构增强点重排序步骤在基础 RAG 的检索阶段Retriever之后加入一个额外的重排序模块以更好地筛选检索结果提高传递给生成模块Generator上下文的质量。核心流程初步检索Initial Retrieval检索模块从知识库中找到一批初步相关的文档例如前 50 个文档。使用向量检索如基于余弦相似度或欧几里得距离快速生成候选文档集合。重排序Rerank传统方法BM25、TF-IDF 等。深度学习模型基于 BERT 的交互式检索模型如 Cross-Encoder。混合方法将检索分数与语义模型得分结合。将初步检索到的候选文档集合交给一个专门的重排序模型。重排序模型可以是输出一个按相关性排序的高质量文档列表。生成模块Generator仅使用重排序后的前 N 个文档作为上下文生成回答或内容。高相关性的上下文能显著提升生成质量。Retrieve-and-Rerank 优势提升检索精度初步检索模块通常快速但粗略可能引入较多噪声重排序能更精准地选择最相关的文档。减少生成错误提供高相关性上下文避免生成模块在不相关或错误信息基础上生成答案。模块灵活性重排序模块可以独立优化例如微调 BERT 模型加入领域知识等。适配长尾查询对于少见或复杂的查询重排序能进一步优化初步检索效果。应用场景问答系统在文档问答中Retrieve-and-Rerank 常用于优化检索阶段确保提供与问题高度相关的上下文。推荐系统在搜索和推荐场景中重排序步骤可以显著提高最终推荐内容的相关性和用户满意度。技术支持从技术文档或 FAQ 中筛选最相关的答案减少生成模块的错误回答率。示例技术栈检索模块FAISS、ElasticSearch、BM25 等。重排序模块BERT、MiniLM、ColBERT使用 Cross-Encoder等。生成模块GPT、T5、LLaMA 等。通过这种方式Retrieve-and-Rerank 在原始 RAG 架构的基础上增强了检索的相关性显著提升了最终生成的质量。Multimodal RAG与基础 RAG 类似Multimodal RAG 也由检索模块Retriever和生成模块Generator组成但增强了对多模态数据的支持多模态检索模块能处理和索引不同模态的数据如图像、视频或音频的特征。通常利用预训练模型将非文本模态如图像转换为嵌入向量存储在统一的向量数据库中。检索时将用户输入文本或其他模态编码为嵌入向量与数据库中的嵌入进行匹配。多模态生成模块接受多模态的上下文例如文本和图像的组合。利用专门设计的多模态生成模型如 Flamingo、BLIP-2生成回答或内容。能够根据上下文模态灵活调整生成策略。流程用户输入可以是文本如问题或其他模态如图像。多模态检索模块找到与输入相关的多模态上下文。将检索结果传递给生成模块结合上下文生成多模态回答或内容。关键技术点模态对齐在多模态数据之间建立共同表示例如将图像特征和文本特征映射到同一个向量空间。常用技术CLIP、Align-before-Fuse、BLIP 等。模态融合将检索到的不同模态的上下文信息进行有效融合为生成模块提供统一的输入。方式早期融合将模态特征直接拼接、晚期融合分别处理后再结合。生成模型支持多模态生成需要具备同时处理文本和非文本模态的能力。模型Flamingo、BLIP-2、Visual ChatGPT 等。Multimodal RAG 的优势支持多种输入类型不仅可以回答文本问题还能处理图像相关的查询如“这张图片中的物体是什么”。丰富的信息来源检索和利用跨模态的信息比如从图片和相关描述中生成答案。增强的上下文理解将文本、图像等模态上下文结合起来生成更精确、更有深度的内容。广泛的应用场景可用于医学影像分析、教育、内容创作等需要多模态数据结合的任务。应用场景多模态问答结合文本和图像回答问题例如“这张 X 光片有什么异常”图像描述生成为图像生成自然语言描述适用于教育或辅助工具。跨模态搜索用户输入文本系统从图像库中检索相关图像或反之。医疗诊断结合医学文本和影像数据生成诊断报告或建议。内容生成从视频或音频中提取关键信息并生成摘要或分析报告。技术实现示例检索模块图像使用 CLIP、DINO 等模型提取图像特征。文本使用 Sentence Transformers 或 OpenAI Embeddings。生成模块使用多模态生成模型如 Flamingo、BLIP-2、Visual ChatGPT 等。数据库存储跨模态嵌入的向量数据库如 FAISS、Weaviate。通过 Multimodal RAG可以实现复杂的跨模态任务为各种应用提供更强大的解决方案。Graph RAGGraph RAG是对基础 RAG 架构的一种扩展通过引入图数据库来增强知识点之间的关联和文档间关系的理解。这种架构不仅提高了检索的精准性还能更好地利用知识的上下文和结构化信息。Graph RAG 架构Graph RAG 的核心思想是在知识检索过程中利用图数据库如 Neo4j、TigerGraph来存储和管理数据。通过将文档、实体和它们之间的关系建模为图结构可以更高效地处理复杂的知识连接和语义关系。核心模块图数据库Graph Database图数据库存储文档及其结构化关系节点和边提供上下文的关系视图。节点可以表示实体如人名、地名、文档或知识片段。边表示节点之间的关系如“引用”“从属”“因果”等。检索模块Graph-based Retriever查询不仅基于文档内容还利用图的结构进行关系推理。可通过图查询语言如 Cypher实现复杂的知识检索。生成模块Generator将检索到的多层次上下文文档和其相关节点输入到生成模型。生成模型结合图关系信息生成更精准、更上下文相关的输出。Graph RAG 工作流程知识建模文档“爱因斯坦提出了相对论。”节点爱因斯坦、相对论边提出从知识库或文档集合中提取实体、关系和文本内容构建图数据库。示例用户查询用户输入问题如“相对论的提出者是谁”。将查询转换为图查询例如搜索与“相对论”相关的节点和边。图查询检索与用户问题相关的子图例如“相对论”节点及其直接连接的节点和关系。上下文扩展将检索到的子图中的信息转化为文本上下文并传递给生成模块。内容生成生成模块结合用户问题和扩展上下文生成自然语言回答。Graph RAG 的优势知识点间关系的深度挖掘通过图结构捕捉文档或知识点之间的复杂关系如层次关系、因果关系等提高检索结果的质量。上下文的精准扩展在检索阶段图数据库可以帮助找到更相关的上下文而不仅仅依赖向量相似性。增强推理能力利用图的结构化数据可以进行关系推理例如多跳检索从一个节点找到间接相关的节点。动态更新与维护图数据库支持动态更新易于在知识库扩展时维护新数据的关系。Graph RAG 应用场景复杂问答需要跨文档或跨实体推理的问答任务如法律问答或科技文献分析。知识管理在企业或科研机构中利用图数据库管理和查询大量关联文档或研究成果。内容推荐基于用户查询利用图关系推荐相关内容或扩展知识。因果推理在科学或工程领域回答因果关系复杂的问题如“某实验的结果受到哪些因素的影响”。示例技术栈图数据库Neo4j、TigerGraph、ArangoDB 等。关系提取使用 NLP 模型提取实体和关系如 spaCy、OpenIE、REBEL。生成模型GPT 系列、T5、BART 等。检索与查询使用 Cypher 查询语言或专门的图查询 API。Graph RAG 将知识管理和自然语言生成相结合利用图数据库强大的关系建模能力大幅提升了文档间关系的理解和复杂问题的解决能力。Hybrid RAGHybrid RAG 结合了多种技术的优势包含图结构和传统检索方法Graph RAG 是对基础 RAG 架构的一种扩展通过引入图数据库来增强知识点之间的关联和文档间关系的理解。这种架构不仅提高了检索的精准性还能更好地利用知识的上下文和结构化信息。Graph RAG 架构Graph RAG 的核心思想是在知识检索过程中利用图数据库如 Neo4j、TigerGraph来存储和管理数据。通过将文档、实体和它们之间的关系建模为图结构可以更高效地处理复杂的知识连接和语义关系。核心模块图数据库Graph Database图数据库存储文档及其结构化关系节点和边提供上下文的关系视图。节点可以表示实体如人名、地名、文档或知识片段。边表示节点之间的关系如“引用”“从属”“因果”等。检索模块Graph-based Retriever查询不仅基于文档内容还利用图的结构进行关系推理。可通过图查询语言如 Cypher实现复杂的知识检索。生成模块Generator将检索到的多层次上下文文档和其相关节点输入到生成模型。生成模型结合图关系信息生成更精准、更上下文相关的输出。Graph RAG 工作流程知识建模文档“爱因斯坦提出了相对论。”节点爱因斯坦、相对论边提出从知识库或文档集合中提取实体、关系和文本内容构建图数据库。示例用户查询用户输入问题如“相对论的提出者是谁”。将查询转换为图查询例如搜索与“相对论”相关的节点和边。图查询检索与用户问题相关的子图例如“相对论”节点及其直接连接的节点和关系。上下文扩展将检索到的子图中的信息转化为文本上下文并传递给生成模块。内容生成生成模块结合用户问题和扩展上下文生成自然语言回答。Graph RAG 的优势知识点间关系的深度挖掘通过图结构捕捉文档或知识点之间的复杂关系如层次关系、因果关系等提高检索结果的质量。上下文的精准扩展在检索阶段图数据库可以帮助找到更相关的上下文而不仅仅依赖向量相似性。增强推理能力利用图的结构化数据可以进行关系推理例如多跳检索从一个节点找到间接相关的节点。动态更新与维护图数据库支持动态更新易于在知识库扩展时维护新数据的关系。Graph RAG 应用场景复杂问答需要跨文档或跨实体推理的问答任务如法律问答或科技文献分析。知识管理在企业或科研机构中利用图数据库管理和查询大量关联文档或研究成果。内容推荐基于用户查询利用图关系推荐相关内容或扩展知识。因果推理在科学或工程领域回答因果关系复杂的问题如“某实验的结果受到哪些因素的影响”。示例技术栈图数据库Neo4j、TigerGraph、ArangoDB 等。关系提取使用 NLP 模型提取实体和关系如 spaCy、OpenIE、REBEL。生成模型GPT 系列、T5、BART 等。检索与查询使用 Cypher 查询语言或专门的图查询 API。Graph RAG 将知识管理和自然语言生成相结合利用图数据库强大的关系建模能力大幅提升了文档间关系的理解和复杂问题的解决能力。Agentic RAG RouterAgentic RAG Router 使用 AI Agent 来路由和处理查询可以选择最适合的处理路径Agentic RAG Router是一种更高级的 Retrieval-Augmented Generation (RAG) 架构通过引入AI Agent作为路由器根据用户的查询动态选择最合适的处理路径或模块。它在复杂、多任务场景中具有明显优势因为不同查询可能需要不同的数据源或处理逻辑。Agentic RAG Router 架构Agentic RAG 的核心是一个智能路由器Agent负责理解用户查询并决定如何处理。整个系统通常由以下模块组成AI Router (Agent)使用大型语言模型如 GPT 或其他 LLM作为路由器分析查询的意图和类型。基于查询选择最合适的检索模块和生成模块。可以动态配置执行逻辑比如调用特定知识库或外部 API。多检索模块文本检索文档、FAQ。图像检索视觉数据库。图数据库复杂关系推理。不同的检索模块可以处理不同的数据源或模态Router 决定调用哪种检索模块或多模块组合。多生成模块自然语言生成文本。图像生成或描述视觉。表格生成或数据分析结构化数据。针对不同任务优化的生成模块执行路径直接回答无需检索。检索后回答RAG 流程。调用外部工具或 API如计算器或代码执行器。Router 分析用户查询可能的处理路径包括工作流程用户查询“这张图片中的内容是什么”“帮我从文档中找出关于技术趋势的摘要。”用户输入问题或任务描述例如路由决策任务分类问答、生成、推理等。数据模态识别文本、图像、表格等。优化目标速度优先或准确性优先。Router 分析查询的意图和模态可能包含模块选择文本问答调用文本检索模块 GPT 生成模块。图像问答调用图像嵌入模型如 CLIP 图像描述生成模块。多模态组合同时调用文本和图像检索模块结合生成。根据分析结果Router 调用最适合的检索模块和生成模块。示例内容生成通过生成模块输出结果可能是单一模态的回答也可能是多模态结合的内容。Agentic RAG 的优势动态任务适配Router 能根据不同任务动态调整执行路径无需固定流程适合复杂场景。多模态支持通过灵活调用不同模态的模块文本、图像、视频等支持更广泛的应用场景。智能资源管理仅在需要时调用复杂模块优化资源利用效率如避免在简单问题上使用冗余计算。增强用户体验通过选择最适合的路径提供高质量、个性化的回答。应用场景多任务问答系统支持用户提出多模态、多领域问题并动态调整处理逻辑。企业知识管理在大规模知识库中针对不同问题选择最相关的数据源和处理方法。医疗辅助动态调用医学图像分析模块、文献检索模块或诊断生成模块。教育与内容生成根据学生的问题选择合适的资料来源并生成解释。自动化工作流处理复杂查询时调用外部工具如计算器、翻译器、编程执行器完成多步骤任务。技术实现示例Router使用大型语言模型如 OpenAI GPT 系列、Claude、LLaMA微调理解用户意图。检索模块文本FAISS、ElasticSearch。图像CLIP、DINO。图数据库Neo4j。生成模块文本生成T5、BART、GPT。图像生成DALLE-2、Stable Diffusion。数据生成Pandas、NumPy。执行引擎调用工具链如 LangChain动态组织不同模块的调用。Agentic RAG Router 的灵活性使其成为解决复杂问题的强大工具。通过将智能路由与强大的检索和生成能力相结合它可以显著提升处理多模态、多任务场景的效率和准确性。Agentic RAG Multi-AgentAgentic RAG Multi-Agent 使用多个专门的 AI Agent 协同工作可以调用不同的工具如向量搜索、网页搜索、Slack、Gmail 等Agentic RAG Multi-Agent是 Retrieval-Augmented Generation (RAG) 的进一步进化版本它引入多个专门的 AI Agent每个 Agent 负责不同的任务或工具调用。通过这些 Agent 的协同工作系统能够在复杂、多源数据环境中灵活高效地处理任务比如同时检索向量数据库、执行网页搜索、查询第三方 API甚至与工具如 Slack、Gmail交互。Agentic RAG Multi-Agent 架构Agentic RAG Multi-Agent 的核心特性是多个专用 Agent 的协作每个 Agent 可以完成特定任务或调用特定工具。整个系统由以下组件组成Central Orchestrator (主控 Agent)作为中央调度器负责解析用户意图、分派任务并整合多个 Agent 的输出。主控 Agent 可以使用 LLM如 GPT-4来执行复杂的任务规划和路由。专用 AI Agent向量搜索 Agent从向量数据库中检索相关内容。网页搜索 Agent实时从互联网获取最新信息。通信工具 Agent与 Slack、Gmail 等进行交互。数据处理 Agent处理结构化数据如表格或数据库查询。模态特定 Agent如图像分析、语音识别等。每个 Agent 负责特定类型的任务或工具例如工具与数据接口每个 Agent 可调用专用工具或 API比如向量检索工具FAISS、Web 搜索引擎如 Google API、生产力工具Slack、Notion。输出整合模块主控 Agent 收集和整合来自各 Agent 的结果将最终答案以自然语言或多模态形式输出给用户。工作流程用户输入“帮我分析这份文件的摘要并用邮件发送给团队。”“找出过去一周相关的行业趋势并通知 Slack 频道。”用户提出一个复杂的请求例如任务分解提取摘要调用向量检索 Agent 或文本处理工具。搜索趋势调用网页搜索 Agent。发送通知调用 Slack 或 Gmail Agent。主控 Agent 将任务分解为子任务任务分配主控 Agent 将子任务分派给相关专用 Agent按优先级并行处理。执行任务专用 Agent 调用相应工具或接口完成任务返回结果。整合与反馈主控 Agent 收集所有 Agent 的结果整合为用户可以理解的最终输出。Agentic RAG Multi-Agent 的优势模块化设计各 Agent 独立工作便于扩展和优化。例如可新增图像处理 Agent 或语音处理 Agent。多任务并行处理多个 Agent 可并行运行大幅提高复杂任务的处理效率。工具支持广泛能调用多种工具和 API覆盖从数据检索到内容生成、任务执行等全流程。动态任务适配主控 Agent 可根据任务动态调整执行路径和 Agent 调用顺序。复杂任务自动化能自动化执行跨工具、跨数据源的多步骤任务例如从检索数据到生成报告并发送通知。应用场景企业知识管理检索企业文档、结合网页搜索实时更新信息并将结果发送至团队协作工具如 Slack。内容创作与分发从向量数据库中检索素材生成文章或报告并分发至邮箱或内容管理系统。多模态问答同时调用文本、图像和视频分析 Agent生成多模态回答。实时数据分析从网页和内部数据库中收集实时数据生成趋势分析报告。个人助理处理日常任务如查看邮件、管理日程、设置提醒等。复杂客户支持检索 FAQ、结合网页搜索和实时工具调用为用户提供高质量的支持。示例技术栈主控 Agent使用 GPT 系列或其他大型语言模型。专用 Agent向量检索FAISS、Weaviate。网页搜索Google API、Bing Search API。通信工具Slack API、Gmail API。数据分析Pandas、NumPy。协作框架LangChain支持 Agent 编排。Tools SDK实现与外部工具的接口。示例场景行业趋势通知用户输入 “帮我从数据库和互联网找出过去一周的行业趋势并用摘要发邮件给团队。”系统执行主控 Agent 分解任务检索数据库调用向量搜索 Agent。搜索互联网调用网页搜索 Agent。生成摘要调用文本生成 Agent。发送邮件调用 Gmail Agent。各 Agent 独立工作并返回结果向量搜索 Agent检索内部数据库的行业报告。网页搜索 Agent爬取过去一周的行业新闻。文本生成 Agent将数据整合为摘要。Gmail Agent将摘要发送给团队。主控 Agent 整合结果并完成任务。通过 Agentic RAG Multi-Agent复杂任务可以自动化完成显著提升效率和用户体验尤其在需要跨模态、跨工具协作的场景中表现尤为出色。最后唠两句为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200% 远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。那0基础普通人如何学习大模型深耕科技一线十二载亲历技术浪潮变迁。我见证那些率先拥抱AI的同行如何建立起效率与薪资的代际优势。如今我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理分享于此为你扫清学习困惑共赴AI时代新程。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能 ‌突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

大模型RAG 架构图解：从基础到高级的7种模式！

相关新闻

[嵌入式系统-216]：开关电源与PWM有异曲同工之妙

数据科学中的图计算：Neo4j和GraphX应用解析

nodejs+vue3的地方扶贫管理系统

最新新闻

波峰焊虚焊问题分析与解决方案

小型自动进给台钻设计与机械结构详解

知识管理实战：从用户故事驱动KARL框架落地

高速PCB信号完整性：眼图分析与工程实践

AI技能安全扫描实战：从威胁模型到CI/CD集成

3分钟解锁网易云音乐：NCM转MP3的完全免费解决方案

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻