当前位置:网站首页>推荐书籍 > 正文 >>

大模型应用开发 RAG实战课

图书信息

作者:黄佳著

出版社:人民邮电出版社

定价:99.80

ISBN:9787115671851

出版时间:2025-05-01

分类:图书,行业职业,计算机,工具书

商品介绍

目录

楔子闹市中的古刹001

开篇RAG三问003

一问从实际项目展示到底何为RAG003

文档的导入和解析005

文档的分块005

文本块的嵌入006

向量数据库的选择006

文本块的检索007

回答的生成008

二问如何快速搭建RAG系统008

使用框架:LangChain的RAG实现011

使用框架:通过LCEL链进行重构016

使用框架:通过LangGraph进行重构018

不使用框架:自选Embedding模型、向量数据库和大模型020

使用coze、Dify、FastGPT等可视化工具023

三问从何处入手优化RAG系统025

第1章数据导入028

……

内容简介

在大模型逐渐成为智能系统核心引擎的今天,检索增强生成(RAG)技术为解决模型的知识盲区以及提升响应准确性提供了关键性的解决方案。本书围绕完整的RAG系统生命周期,系统地拆解其架构设计与实现路径,助力开发者和企业构建实用、可控且可优化的智能问答系统。

首先,本书以“数据导入—文本分块—信息嵌入—向量存储”为主线,详细阐述了从多源文档加载到结构化预处理的全流程,并深入解析了嵌入模型的选型、微调策略及多模态支持;其次,从检索前的查询构建、查询翻译、查询路由、索引优化,到检索后的重排与压缩,全面讲解了提高召回质量和内容相关性的方法;接下来,介绍了多种生成方式及RAG 系统的评估框架;最后,展示了复杂RAG范式的新进展,包括GraphRAG、Modular RAG、 Agentic RAG和Multi-Modal RAG的构建路径。

本书适合AI研发工程师、企业技术负责人、知识管理从业者以及对RAG系统构建感兴趣的高校师生阅读。无论你是希望快速搭建RAG系统,还是致力于深入优化检索性能,亦或是探索下一代AI系统架构,本书都提供了实用的操作方法与理论支持。

作者简介

黄佳,笔名咖哥,现任新加坡科技研究局Lead Research Engineer,曾担任埃森哲新加坡公司资深顾问,拥有超过二十年的工作经验。主导并实施了涵盖政府部门、金融、医疗、电商及能源等领域的大型项目,积累了丰富的人工智能与大数据项目的实战经验。近年来,他的研究主要集中在NLP预训练大模型及FinTech应用方向。 著有《大模型应用开发 动手做AI Agent》《GPT图解 大模型是怎样构建的》《数据分析咖哥十话 从思维到实践促进运营增长》《零基础学机器学习》和《SAP程序设计》等多部畅销图书,其中,《大模型应用开发 动手做AI Agent》入选京东图书“2024年度好书”,《GPT图解 大模型是怎样构建的》则被CSDN评为“2023中国开发者影响力年度IT图书”。 同时,咖哥还在极客时间开设了“大模型RAG进阶实战训练营”。该训练营以案例为导向,强调实践教学,并通过紧密的群组互动学习方式获得了学员们的广泛认可和好评。

主编推荐

咖哥继AI Agent之后的又一力作,给程序员最实用的RAG实战课 从零开始,一步步搭建个人和企业的知识库 不使用任何框架,深入解析RAG的十大组件,纯手工打造RAG系统 基于DeepSeek、LangChain、LlamaIndex、开源嵌入模型和Milvus的知识库构建指南

媒体评论

在推进具身智能落地的实践中,RAG技术正在重构机器人的知识处理范式。本书既有手把手的代码级指导,又包含架构设计的顶层思考,可作为AI工程师的案头工具书,也可作为CTO规划技术栈的决策参考。相信每一位追求智能系统实用价值的读者,都能从本书中获得跨越技术鸿沟的桥梁。 ——宇树科技创始人兼CEO 王兴兴 本书系统构建了RAG技术的完整实施框架,涵盖从数据预处理、文本分块到向量存储与检索优化的全流程技术架构。书中深入解析了RAG核心组件的运行机制,并结合可落地的性能评估体系,为开发者提供了构建智能知识系统的全周期方法论。同时,本书还展望了GraphRAG、Multi-Modal RAG等新一代知识引擎的发展趋势。无论是希望了解大模型相关知识的专业人士,还是探索AI应用创新的实践者,都能从本书中获得兼具理论与实践的指导。 ——新浪微博首席科学家,AI研发部负责人 张俊林 RAG是一种非通用的实验性技术范式。在实际应用中,通常是为了满足具体业务需求而采用RAG,而非围绕RAG来设计业务。这意味着需要针对不同的场景和问题进行专门的调整、优化,甚至定制化处理。《大模型应用开发 RAG实战课》一书从实现原理到代码实践,全面介绍了RAG技术的应用方法,涵盖了数据导入、文本分块、信息嵌入、向量存储、检索、系统评估及复杂范式等全链路知识,非常适合初级者入门学习。理解这些原理是进行有效优化的基础,读者可以以本书为起点,通过大量实践来深化理解,一定会有所收获。 ——360人工智能研究院资深算法专家,老刘说NLP社区作者 刘焕勇 对大多数企业来说,要从大模型中获得生产力与提升运营效率,“招募”成千上万的数字员工是关键途径。然而,管理如此规模的数字员工队伍,即使对有管理万人团队经验的管理者来说,也是一个全新的挑战。企业不仅要借助大模型和流程编排工具,还需将这些技术与自身知识体系深度融合,具备幻觉对抗、权限控制、知识重构与解耦、自动更新以及过程可溯等能力,而实现这些目标的核心技术正是RAG。《大模型应用开发 RAG实战课》一书给我留下了深刻印象,尤其是咖哥精心绘制的技术图解。全书内容紧密贴合企业级RAG的实施路径,非常适合希望在企业中落地AI能力的朋友细读参考。 ——杭州萌嘉(TorchV)创始人兼CEO 卢向东(@土猛的员外) 将大模型的通用智能与特定领域知识有效结合,是AI应用落地的核心挑战。RAG为此提供了重要的工程框架。本书深入浅出地剖析了RAG的技术栈与实践要点,对致力于构建高性能、可信赖AI应用的工程师和架构师而言,极具参考价值。 ——谷歌AI开发者专家,极客时间“AI大模型系列训练营”作者 彭靖田

推荐书籍