
详细提纲
- 内容简介:介绍本书是全面介绍基于大语言模型的RAG应用开发的专业图书,分为预备篇、基础篇和高级篇,适合不同层次对大模型及RAG技术感兴趣的人员阅读。
- 预备篇
- 了解大模型与RAG:介绍大模型发展、应用及存在的问题,阐述RAG产生的原因、基本思想、技术架构,探讨RAG与微调的选择以及与具有理解超长上下文能力大模型的关系。
- RAG应用开发环境搭建:介绍开发RAG应用的两种方式(低代码开发平台和大模型应用开发框架),并基于主流技术搭建开发环境,包括硬件环境、基础大模型、嵌入模型、Python虚拟运行环境、Python IDE与开发插件、向量库、LlamaIndex框架等的选择与配置。
- 基础篇
- 初识RAG应用开发:用原生代码、LlamaIndex框架、LangChain框架开发简单RAG应用,介绍跟踪与调试RAG应用的方法,以及基于LlamaIndex框架的RAG应用开发核心组件。
- 模型与Prompt:介绍大模型在RAG应用中的作用、组件接口、使用方式、参数设置及自定义组件,讲解Prompt模板的使用、更改,以及嵌入模型在RAG应用中的作用、组件接口、使用与自定义方法。
- 数据加载与分割:理解Document与Node概念,介绍数据加载(从本地目录和网络加载)、分割(使用方法和常见分割器)、摄取管道(概念、转换器、自定义及使用)相关知识。
- 数据嵌入与索引:介绍嵌入与向量的概念及生成方法,以及向量存储(简单向量存储和第三方向量存储)、向量存储索引(多种构造方式及深入理解)和其他索引类型(文档摘要索引、对象索引、知识图谱索引、树索引、关键词表索引)。
- 检索、响应生成与RAG引擎:介绍检索器(构造方法、检索模式与参数、递归检索)、响应生成器(构造方法、生成模式、参数及自定义),以及RAG引擎中的查询引擎(构造方法、内部结构与原理、自定义)和对话引擎(构造方法、内部结构与原理、对话模式),还介绍了结构化输出的两种方法。
- 高级篇
- RAG引擎高级开发:介绍检索前查询转换(简单查询转换、HyDE查询转换、多步查询转换、子问题查询转换)、检索后处理器(使用、自定义、常见预定义、Rerank节点后处理器)、语义路由、SQL查询引擎、多模态文档处理、查询管道等高级开发技术。
- 开发Data Agent:初步认识Data Agent,介绍构造与使用Agent的工具,以及基于函数调用和框架组件开发Agent的方法,还介绍了更细粒度控制Agent运行的方式。
- 评估RAG应用:阐述评估RAG应用的原因、依据与指标、流程与方法,以及评估检索质量和响应质量的具体方式,还涉及基于自定义标准的评估。
- 企业级RAG应用的常见优化策略:介绍选择合适知识块大小、分离检索与生成阶段知识块、优化大文档集知识库检索、使用高级检索方法等优化策略。
- 构建端到端的企业级RAG应用:考虑生产型RAG应用的要点,介绍端到端的企业级RAG应用架构及全栈应用案例。
- 新型RAG范式原理与实现:介绍自纠错RAG(C - RAG)、自省式RAG(Self - RAG)、检索树RAG(RAPTOR)的诞生动机、原理与实现。
中心思想
本书围绕基于大语言模型的RAG应用开发展开,先在预备篇介绍大模型与RAG的基础知识及开发环境搭建;基础篇通过多种方式开发简单RAG应用,深入讲解模型、Prompt、数据处理、索引、检索、响应生成及RAG引擎等核心内容;高级篇聚焦RAG应用的高级开发技术、Agent开发、应用评估、优化策略、企业级应用构建及新型范式,旨在帮助读者全面掌握RAG应用开发技术,从基础到进阶,逐步具备开发企业级RAG应用的能力 。
电子书下载地址:
通过网盘分享的文件:基于大模型的RAG应用开发与优化构建企业级LLM应用.pdf等2个文件
链接: https://pan.baidu.com/s/1_ueob2n6SvQRLhkOSYq_dA 提取码: 85ec
