简介
本书以实战为导向,系统性地讲解了RAG技术的构建与优化。全书内容从数据导入、文本分块、向量嵌入到向量存储、检索优化、响应生成,再到复杂RAG范式的探索,层层递进,帮助读者全面掌握RAG技术的核心知识点和实践技巧。首先聚焦于RAG系统的基础构建,包括数据加载、文本分块、信息嵌入和向量存储;其次深入探讨检索前处理、索引优化、检索后处理和响应生成等关键环节;随后提供了一套完整的RAG系统评估体系,帮助读者量化系统的性能;最后展望RAG技术的未来,介绍了GraphRAG、上下文检索、Modular RAG、Agentic RAG和Multi-Modal RAG等前沿范式。 在推进具身智能落地的实践中,RAG技术正在重构机器人的知识处理范式。本书既有手把手的代码级指导,又包含架构设计的顶层思考,可作为AI工程师的案头工具书,也可作为CTO规划技术栈的决策参考。相信每一位追求智能系统实用价值的读者,都能从本书中获得跨越技术鸿沟的桥梁。 ——宇树科技创始人兼CEO 王兴兴 本书系统构建了RAG技术的完整实施框架,涵盖从数据预处理、文本分块到向量存储与检索优化的全流程技术架构。书中深入解析了RAG核心组件的运行机制,并结合可落地的性能评估体系,为开发者提供了构建智能知识系统的全周期方法论。同时,本书还展望了GraphRAG、Multi-Modal RAG等新一代知识引擎的发展趋势。无论是希望了解大模型相关知识的专业人士,还是探索AI应用创新的实践者,都能从本书中获得兼具理论与实践的指导。 ——新浪微博首席科学家,AI研发部负责人 张俊林 RAG是一种非通用的实验性技术范式。在实际应用中,通常是为了满足具体业务需求而采用RAG,而非围绕RAG来设计业务。这意味着需要针对不同的场景和问题进行专门的调整、优化,甚至定制化处理。《大模型应用开发 RAG实战课》一书从实现原理到代码实践,全面介绍了RAG技术的应用方法,涵盖了数据导入、文本分块、信息嵌入、向量存储、检索、系统评估及复杂范式等全链路知识,非常适合初级者入门学习。理解这些原理是进行有效优化的基础,读者可以以本书为起点,通过大量实践来深化理解,一定会有所收获。 ——360人工智能研究院资深算法专家,老刘说NLP社区作者 刘焕勇 对大多数企业来说,要从大模型中获得生产力与提升运营效率,“招募”成千上万的数字员工是关键途径。然而,管理如此规模的数字员工队伍,即使对有管理万人团队经验的管理者来说,也是一个全新的挑战。企业不仅要借助大模型和流程编排工具,还需将这些技术与自身知识体系深度融合,具备幻觉对抗、权限控制、知识重构与解耦、自动更新以及过程可溯等能力,而实现这些目标的核心技术正是RAG。《大模型应用开发 RAG实战课》一书给我留下了深刻印象,尤其是咖哥精心绘制的技术图解。全书内容紧密贴合企业级RAG的实施路径,非常适合希望在企业中落地AI能力的朋友细读参考。 ——杭州萌嘉(TorchV)创始人兼CEO 卢向东(@土猛的员外) 将大模型的通用智能与特定领域知识有效结合,是AI应用落地的核心挑战。RAG为此提供了重要的工程框架。本书深入浅出地剖析了RAG的技术栈与实践要点,对致力于构建高性能、可信赖AI应用的工程师和架构师而言,极具参考价值。 ——谷歌AI开发者专家,极客时间“AI大模型系列训练营”作者 彭靖田