探秘大模型应用开发
图书信息
作者:李瀚,徐斌著
出版社:电子工业出版社
定价:108.00
ISBN:9787121496561
出版时间:2025-02-01
分类:图书,行业职业,计算机,工具书
商品介绍
目录
第1章 AI 2.0时代到来 1
1.1 ChatGPT旋风 2
1.1.1 ChatGPT是什么 2
1.1.2 丰富的应用 3
1.1.3 有喜有忧 4
1.2 认识AI 2.0时代 5
1.2.1 何谓大模型 5
1.2.2 AI 1.0时代与AI 2.0时代特点分析 8
1.2.3 新“工业革命”来临 11
1.3 本章小结 12
第2章 基座大模型准备 13
2.1 大模型的历史与未来 14
2.1.1 发展史 14
2.1.2 未来趋势 15
2.2 基座大模型训练过程 16
2.2.1 预训练 17
2.2.2 人类反馈的强化学习 21
2.3 选择合适的基座大模型 22
2.3.1 主流基座大模型介绍 22
2.3.2 选型标准 25
2.4 本章小结 27
第3章 GPU相关知识 28
3.1 基础知识 29
3.1.1 显卡与GPU 29
3.1.2 GPU与CPU 30
3.2 GPU的优势 32
3.2.1 GPU与深度学习 32
3.2.2 CUDA编程 34
3.3 准备合适的GPU 36
3.3.1 选择合适的GPU(显卡)供应商 36
3.3.2 英伟达与AMD 37
3.3.3 英伟达GPU各项参数 39
3.3.4 选型建议 46
3.4 本章小结 47
第4章 应用开发概览 48
4.1 关键概念 49
4.1.1 提示 49
4.1.2 上下文学习 50
4.2 应用趋势 56
4.2.1 趋势变迁 56
4.2.2 产品形态 59
4.3 技术实现 60
4.3.1 对齐方法 60
4.3.2 优劣势比较 63
4.3.3 应用流程 65
4.4 本章小结 66
第5章 文档处理 67
5.1 分块 68
5.1.1 分块的作用 68
5.1.2 分块的策略 69
5.1.3 策略选择 72
5.2 词元化 73
5.2.1 概念和方法 73
5.2.2 Token采样策略 76
5.3 嵌入 78
5.4 本章小结 84
第6章 向量数据库 85
6.1 基本概念 86
6.2 相关算法 87
6.2.1 向量相似性算法 87
6.2.2 工程中常用的向量搜索折中算法 88
6.3 核心价值 92
6.4 定位 95
6.5 主流产品 97
6.6 本章小结 98
第7章 微调 99
7.1 背景与挑战 100
7.1.1 背景知识 100
7.1.2 技术挑战 102
7.2 参数高效微调技术 104
7.3 工具实践 113
7.3.1 开源工具包 113
7.3.2 模型微调服务 118
7.4 本章小结 121
第8章 推理优化概论 122
8.1 优化目标 123
8.2 理论基础 124
8.2.1 模型大小的指标 124
8.2.2 模型大小对推理性能的影响 127
8.2.3 大模型相关分析 131
8.3 常见优化技术 141
8.3.1 模型压缩 141
8.3.2 Offloading 147
8.3.3 多GPU并行化 147
8.3.4 高效的模型结构 148
8.3.5 FlashAttention 149
8.3.6 PagedAttention 149
8.3.7 连续批处理 150
8.4 本章小结 151
第9章 部署推理工具 152
9.1 推理架构概述 153
9.2 Web服务 156
9.2.1 Streamlit与Gradio 158
9.2.2 FastAPI与Flask 160
9.3 推理执行引擎 161
9.3.1 服务器端推理 161
9.3.2 端侧推理 176
9.4 推理服务 181
9.5 对话类系统 194
9.6 本章小结 196
第10章 提示工程 197
10.1 理论与技术 198
10.1.1 提示的价值 198
10.1.2 应用领域 198
10.1.3 提示工程技术 199
10.2 开发工具 208
10.2.1 OpenAI Playground 210
10.2.2 Dify 211
10.2.3 PromptPerfect 213
10.3 本章小结 214
第11章 编排与集成 215
11.1 相关理论 216
11.1.1 面临的问题 216
11.1.2 核心价值 217
11.1.3 功能构成 217
11.2 典型架构模式 218
11.2.1 RAG 218
11.2.2 Agent 222
11.3 常见编排框架 235
11.3.1 LangChain框架 235
11.3.2 LlamaIndex框架 248
11.3.3 Semantic Kernel框架 253
11.4 本章小结 264
第12章 应用示例 265
12.1 整体架构 266
12.2 开发过程 267
12.2.1 环境准备 267
12.2.2 实现解析 269
12.2.3 打包部署 276
12.2.4 示例演示 281
12.3 本章小结 284
参考文献 285
内容简介
以ChatGPT为代表的生成式对话产品席卷全球,技术圈迎来AI 2.0时代,基于大模型的应用将迎来大爆发,形成新的AI应用生态。AI工程师也当仁不让地成了炙手可热的就业方向,一大批对大模型感兴趣的开发者希望能够及时转型,投身到新一轮的“工业革命”浪潮中。在此背景下,本书系统、全面地介绍大模型应用开发相关的背景、概念、开发流程和工具使用方法,既包括基座大模型的训练过程、GPU基础知识、大模型应用开发的总体流程、大模型应用的发展趋势,也包括大模型应用开发涉及的文档处理、向量数据库、参数微调、模型压缩、推理性能优化、模型部署、提示工程、编排与集成等技术。本书不拘泥于某个产品细节,而是从大模型应用的落地痛点、理论知识、框架选型等长期和深层次的角度展开,提供完整的知识体系。除此之外,本书通过典型的RAG应用案例,结合具体代码,详细介绍大模型应用开发方法,帮助读者对开发过程有更深刻的体会。
本书适合对大模型应用开发感兴趣的企业管理者、产品研发人员阅读,也适合高等院校的学生、研究机构的研究者参考。
- 寻找施耐庵(弘虫 著,中国国际广播)
- 法律法规分类适用全书(刑法卷)(李佩佑主编;刘荣康本卷主编,河海大学)
- 英语口语教程(一)(留海燕主编,清华大学)
- 烟囱下的孩子(常新港 著,二十世纪)
- 董源潇湘图夏景山口待渡图(,上海书画)
- 汉语探索(未知)
- 有花为伴(A Tree in the house)([澳] 安娜贝拉·希克森,紫图图书出品 著,周晓)
- 文化创意产品项目实训教程(黄言涛 著,西安电子科技大学)
