本文详细介绍了22种先进的RAG技术从基础简单RAG到高级自适应RAG、图谱RAG等涵盖文档分块、查询优化、结果重排等多种策略。每种技术提供代码实现和应用场景帮助开发者根据需求选择合适的RAG方案提升生成模型的准确性和上下文相关性为知识密集型任务提供灵活解决方案。高质量RAG的常用优化策略实战项目落地必看 ❝检索增强生成RAGRetrieval-Augmented Generation是一种结合信息检索与生成模型的强大方法用于生成准确且上下文相关的回答。网络上的实战眼花缭乱先进的RAG高质量实战汇总却少之又少阿东带你了解22种advanced RAG欢迎关注阿东玩AI。本文将介绍 22 种先进的RAG技术灵感来源于all-rag-techniques仓库中的全面实现。这些实现使用 Python 库如 NumPy、Matplotlib 和 OpenAI 的嵌入模型避免使用LangChain或FAISS等依赖以保持简单性和清晰度。本文目录代码目录简单 RAG简单 RAG是一个基础的RAG实现为初学者提供了一个快速上手的起点。它包括以下核心步骤文档分割将输入文档分割成固定大小的文本块。嵌入生成使用预训练模型如 OpenAI 的嵌入模型为每个文本块生成向量表示。检索将用户查询嵌入到向量空间中通过余弦相似度检索与查询最相关的文本块。生成将检索到的文本块与查询一起输入到语言模型中中生成最终答案。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/01_simple_rag.ipynb应用场景快速原型设计、简单问答系统、基础知识检索。语义分块语义分块通过基于语义的相似性分割文本生成更有意义的片段。相比固定大小的分块语义分块使用嵌入模型评估相邻句子的语义相似度将语义相关的句子合并为一个片段。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/02_semantic_chunking.ipynb应用场景需要高质量上下文的任务如法律文档分析或学术论文检索。分块大小选择器分块大小选择器研究不同的分块大小如 256、512、1024 个字符对检索性能的影响。它通过实验比较不同分块大小下的召回率和生成质量帮助用户找到最佳分块策略。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/03_chunk_size_selector.ipynb应用场景优化RAG系统以适应不同文档类型如短新闻或长篇技术报告。上下文增强 RAG增强上下文增强 RAG通过检索与目标分块相邻的文本片段为生成提供更多上下文信息。这可以避免因分块分割导致的上下文信息提升答案的连贯性和准确性。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/04_context_enriched_rag.ipynb应用场景需要完整上下文的任务如长篇叙事性文档或技术手册问答。上下文分块标题上下文分块标题在嵌入每个分块之前为其添加描述性标题。这些标题由语言模型生成总结分块内容增强嵌入的语义表达能力。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/05_contextual_chunk_headers_rag.ipynb应用场景复杂文档的检索如多章节书籍或多主题报告。文档增强 RAG文档增强 RAG从文本分块中生成问题并将这些问题作为额外的查询嵌入向量库增强检索过程的语义覆盖范围。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/06_doc_augmentation_rag.ipynb应用场景需要深入挖掘文档内容的任务如教育问答或知识库查询。查询转换查询转换通过重写、扩展或分解用户查询来改善检索效果。它包括回溯提示生成更广义的查询以捕捉更广泛的上下文。子查询分解将复杂查询拆分为多个简单子查询分别检索。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/07_query_transform.ipynb应用场景复杂查询处理如多方面问题或模糊用户意图。重排器重排器使用大型语言模型LLM对初步检索结果重新排序根据查询的相关性对结果进行优化。它通过评估每个分块与查询的语义匹配度显著提高检索精度。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/08_reranker.ipynb应用场景高精度检索任务如医疗诊断支持或法律案例分析。相关段落提取RSE相关段落提取RSE识别并重构连续的文本段落保留完整的上下文信息。它通过分析检索到的分块合并相邻或语义相关的片段形成更连贯的上下文。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/09_rse.ipynb应用场景需要完整段落的任务如文献综述或故事性内容生成。上下文压缩上下文压缩过滤并压缩检索到的分块仅保留与查询高度相关的信息减少冗余内容优化生成效率。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/10_contextual_compression.ipynb应用场景实时问答系统或资源受限环境。反馈循环 RAG反馈循环 RAG结合用户反馈如答案评分或更正通过持续学习改进检索和生成过程。它使用反馈数据微调嵌入模型或调整检索策略。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/11_feedback_loop_rag.ipynb应用场景长期运行的交互系统如客户支持聊天机器人。自适应 RAG自适应 RAG根据查询类型如事实性、概念性或探索性动态选择最佳检索策略。例如事实性查询可能优先精确匹配而概念性查询需要更广泛的语义检索。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/12_adaptive_rag.ipynb应用场景多场景问答系统如企业知识库或教育平台。自我 RAG自我 RAG动态决定是否需要检索、如何检索并评估检索结果的相关性和答案的支持度。它通过自省机制优化整个RAG流程。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/13_self_rag.ipynb应用场景高自主性任务如智能助手或自动化研究工具。命题分块命题分块将文档分解为原子性的事实陈述如“地球是圆的”每个陈述独立嵌入以实现精确检索。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/14_proposition_chunking.ipynb应用场景需要高精度事实提取的任务如知识图谱构建或验证系统。多模态RAG多模态RAG结合文本和图像进行检索使用 LLaVA 等模型为图像生成描述性标题并将其嵌入向量空间与文本共同检索。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/15_multimodel_rag.ipynb应用场景多媒体内容检索如电商产品搜索或教育资源库。融合RAG融合 RAG结合向量搜索语义与基于关键词的 BM25 检索综合两者的优势以提高检索效果。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/16_fusion_rag.ipynb应用场景混合搜索场景如学术搜索或企业文档管理。图谱 RAG图谱 RAG将知识组织为图结构节点表示概念边表示关系支持通过图遍历检索相关信息。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/17_graph_rag.ipynb应用场景复杂知识网络如生物医学研究或法律案例分析。层次 RAG层次 RAG构建层次索引包含高层次摘要和详细分块支持从粗到细的检索策略。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/18_hierarchy_rag.ipynb应用场景大规模文档检索如技术文档库或法规数据库。HyDE RAGHyDE RAG使用假设性文档嵌入Hypothetical Document Embeddings生成与查询相关的虚拟文档嵌入改善语义匹配。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/19_HyDE_rag.ipynb应用场景语义模糊查询如探索性研究或创意写作支持。纠正性 RAGCRAG纠正性 RAG动态评估检索结果的质量若结果不佳则使用网络搜索作为后备确保答案的准确性。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/20_crag.ipynb应用场景需要高可靠性答案的场景如实时新闻问答或医疗咨询。带强化学习的RAG带强化学习的RAG使用强化学习优化RAG模型通过最大化奖励如答案准确性或用户满意度提升性能。**地址**https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/21_rag_with_rl.ipynb应用场景需要长期优化的系统如个性化推荐或智能问答。大数据知识图谱RAG大数据知识图谱 RAG专为大规模数据集设计使用知识图谱组织海量信息支持高效检索和复杂查询。地址https://github.com/FareedKhan-dev/all-rag-techniques/blob/main/22_Big_data_with_KG.ipynb应用场景大数据分析如企业级知识管理或科学研究。最佳RAG选择器除了上述技术all-rag-techniques仓库还提供了一个最佳RAG选择器通过结合简单 RAG、重排器和查询重写自动为给定查询选择最适合的RAG技术。这为开发者提供了一个灵活的工具用于快速评估和部署最优RAG策略。应用场景快速实验和生产环境中的RAG技术选择。总结这些RAG技术展示了从基础到高级的多种实现方式涵盖了不同的应用场景和优化目标。无论是需要高精度的事实检索、复杂上下文理解还是多模态信息处理all-rag-techniques仓库都提供了清晰的实现参考。开发者可以根据任务需求选择合适的RAG技术或组合多种技术以构建更强大的系统。通过这些技术RAG 不仅提升了生成模型的准确性和上下文相关性还为知识密集型任务提供了灵活的解决方案。未来随着嵌入模型和检索算法的进一步发展RAG技术将继续在智能问答、知识管理和多模态应用中发挥重要作用。最后我在一线科技企业深耕十二载见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包✅AI大模型学习路线图✅Agent行业报告✅100集大模型视频教程✅大模型书籍PDF✅DeepSeek教程✅AI产品经理入门资料完整的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】为什么说现在普通人就业/升职加薪的首选是AI大模型人工智能技术的爆发式增长正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议到全国两会关于AI产业发展的政策聚焦再到招聘会上排起的长队AI的热度已从技术领域渗透到就业市场的每一个角落。智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200%远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。资料包有什么①从入门到精通的全套视频教程⑤⑥包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图还有视频解说全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤ 这些资料真的有用吗?这份资料由我和鲁为民博士共同整理鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。所有的视频教程由智泊AI老师录制且资料与智泊AI共享相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念通过动态追踪大模型开发、数据标注伦理等前沿技术趋势构建起前沿课程智能实训精准就业的高效培养体系。课堂上不光教理论还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】**