基于深度学习的目标检测原理与应用
图书信息
作者:翟中华,电子工业 | 分类:科学技术,计算机/网络,计算机科学理论与基础知识
作者简介
作者简介 翟中华,清华大学硕士,曾就职于中国银行总行信息科技部等,2018开始创立AI火箭营,担任北京洪策元创智能科技有限公司CEO,获软件设计师国家级证书,在计算机视觉、深度学习、机器学习等方向已有多本著作出版。
内容简介
内容简介 本书遵循循序渐进、深入浅出的理念,引领读者夯实相关基础知识,掌握传统目标检测方法,再逐步过渡到深度学习的基本概念及分类用法,进而深入讲解目标检测的两阶段深度学习方法、一阶段学习方法,即从以R-CNN为代表的两阶段深度学习方法、以YOLO系列为代表的一阶段学习方法等,层层揭开深度学习用于目标检测的“神秘面纱”,探究其中的奥秘。本书适合目标检测领域的工程师、研究员阅读,也可作为深度学习相关专业本科生、研究生的重要参考书,还可作为互联网行业IT技术人员转型学习人工智能的参考用书。
目录
图书目录第1章 计算机视觉及目标检测 11.1 计算机视觉原理 11.1.1 人类视觉与计算机视觉比较 11.1.2 计算机视觉应用展现 21.2 目标检测概述 91.2.1 计算机视觉三大主要任务 91.2.2 目标检测的应用 111.2.3 目标检测面临的挑战 121.2.4 目标检测方法 13第2章 计算机视觉数学、编程基础 152.1 向量、矩阵和卷积 152.1.1 向量 152.1.2 矩阵 162.1.3 卷积 162.2 函数极值理论与非极大值抑制 182.2.1 函数极值理论 192.2.2 非极大值抑制 212.3 跨平台计算机视觉和机器学习软件库OpenCV 基础 242.3.1 OpenCV的历史起源 242.3.2 安装OpenCV 242.3.3 OpenCV图像和视频的读/写 242.3.4 OpenCV基本操作 282.3.5 OpenCV颜色空间转换 292.3.6 OpenCV几何变换 312.3.7 OpenCV图像简单阈值处理 342.3.8 OpenCV形态学转换 402.3.9 OpenCV图像梯度 432.4 PyTorch基础 462.4.1 PyTorch简介 462.4.2 PyTorch安装 472.4.3 张量 472.4.4 基本代码操作 492.4.5 PIL图像格式转换 512.4.6 PyTorch自动求导机制 522.4.7 PyTorch的神经网络nn包 55第3章 OpenCV目标检测实战 603.1 Haar特征与积分图像构建算法 603.1.1 Haar特征 603.1.2 积分图像构建算法 653.2 AdaBoost应用于Haar人脸特征分类 663.3 AdaBoost级联应用于Haar特征人脸检测 703.4 利用OpenCV进行基于Haar特征的人脸检测实战 73第4章 深度学习引入及图像分类实战 754.1 卷积神经网络的重要概念 754.2 卷积神经网络训练技巧及经典架构 794.3 设计卷积神经网络进行图像分类 824.4 选择卷积神经网络损失函数及优化器 854.5 改进卷积神经网络以提高图像分类准确率 88第5章 目标检测的两阶段深度学习方法 905.1 R-CNN目标检测思想 905.1.1 目标检测数据集 915.1.2 从滑动窗口到选择搜索 915.1.3 R-CNN网络架构及训练过程 935.2 目标检测指标——二分类器 975.3 R-CNN目标检测模型评估结果 1005.3.1 R-CNN用于细粒度类别检测 1085.3.2 R-CNN用于目标检测与分割 1095.4 R-CNN的缺陷和Fast R-CNN的改进 1105.4.1 R-CNN的缺陷 1105.4.2 感兴趣区域池化 1115.4.3 Fast R-CNN创新损失函数设计 1135.5 Fast R-CNN网络架构和模型评估 1155.5.1 Fast R-CNN模型工作流程 1155.5.2 Fast R-CNN网络架构 1165.5.3 RoI池化反向传播方法 1165.5.4 Fast R-CNN结果评估 1175.6 Fast R-CNN的创新 1185.6.1 Faster R-CNN的创新思想 1185.6.2 替代选择搜索的锚框 1195.6.3 区域建议网络 1205.7 深入剖析Faster R-CNN中边界框回归 1235.7.1 为什么使用边界框回归 1245.7.2 边界框回归的数学支撑 1255.8 Faster R-CNN的全景架构和损失函数 1275.9 Faster R-CNN的训练步骤及测试步骤 1295.9.1 Faster R-CNN的训练步骤 1295.9.2 Faster R-CNN的测试步骤 1315.10 详细讲解Faster R-CNN关键部分RoI代码 132第6章 目标检测的一阶段学习方法 1346.1 YOLO目标检测思想 1356.1.1 改进思想 1366.1.2 网格单元 1376.1.3 YOLO创新细节 1386.2 YOLO的网络结构、网络与损失函数 1406.2.1 YOLO的网络结构 1406.2.2 YOLO的网络训练与损失函数 1426.3 YOLO模型评估、优劣势分析 1446.3.1 YOLO数据集 1456.3.2 YOLO模型评估 1456.3.3 YOLO模型优缺点 1466.4 YOLOv2实现更好、更快、更强 1496.5 YOLOv2改进YOLOv1——更好 1496.5.1 批归一化 1506.5.2 高分辨率分类器 1506.5.3 预设锚框并采用全卷积 1506.5.4 框聚类 1516.5.5 约束边框位置 1536.5.6 细粒度特征 1546.5.7 多尺度训练 1546.5.8 实验对比 1566.6 YOLOv2 使用Darknet-19——更快 1586.6.1 Darknet-19 1586.6.2 三阶段训练 1596.6.3 YOLOv2的损失函数 1616.7 使用WordTree的YOLO9000——更强 1646.7.1 组合两种数据集的必要性 1646.7.2 构建WordTree进行分层分类 1656.7.3 在组合数据集上训练YOLO9000 167第7章 YOLOv3创新思想及整体架构 1707.1 YOLOv3的创新改进 1707.2 YOLOv3的关键创新点 1717.2.1 106层的Darknet-53主干网络架构 1717.2.2 三级检测 1767.2.3 更擅长检测较小的物体 1777.2.4 更多的锚框 1777.2.5 损失函数 1787.3 YOLOv3的三级检测输出过程 1797.4 YOLOv3的非极大值抑制 1837.5 YOLOv3的检测效果 1847.6 SSD多尺度特征图目标检测思想 1857.7 SSD网络架构 1917.7.1 SSD网络基础架构 1917.7.2 扩张卷积 1927.7.3 SSD与YOLOv3 1937.7.4 SSD网络检测物体方法 1937.8 SSD网络损失函数 1947.8.1 默认框匹配策略 1947.8.2 损失函数 1957.9 SSD较YOLOv3的劣势 196第8章 构建Darknet-53网络实践 1988.1 Darknet-53网络工程结构和配置 1988.2 实践代码 2008.3 构建Darknet-53网络前向传递过程 2038.3.1 构建Darknet-53的模块 2038.3.2 Darknet-53的模块详解 2058.4 YOLOv3 实现检测层特征图到边界的预测值转变 2098.4.1 参数讲解 2098.4.2 实现步骤和代码 2108.5 YOLOv3 演示边框生成过程 2128.6 YOLOv3 处理低阈值边框 2148.6.1 思路讲解 2158.6.2 代码实践 2158.7 YOLOv3 非极大值抑制过程 2188.7.1 延续上一节代码讲解NMS过程 2198.7.2 NMS后的整理 2208.8 YOLOv3演示NMS过程找到最优框 2208.8.1 运行检测代码演示 2208.8.2 运行结果分析 2218.9 YOLOv3实现工业工具检测 2248.9.1 YOLOv3工业实践需求分析及目标分析 2258.9.2 数据采集标注与数据预处理部分 2268.9.3 模型训练部分 2308.9.4 模型优化部分 239第9章 YOLOv4目标检测方法 2409.1 YOLOv4目标检测创新路径及技巧体系 2409.1.1 速度与精度双提升 2409.1.2 YOLOv4技巧汇总 2409.2 YOLOv4大型网络架构及其主要创新改进 2469.2.1 空间金字塔结构 2469.2.2 路径增强网络 2479.2.3 使用YOLOv4的网络详情 2489.2.4 CSPDarknet-53网络 2549.2.5 YOLOv4网络全景关系 2559.3 YOLOv4中的激活函数 2569.3.1 各激活函数的比较 2569.3.2 keras实现三种激活函数性能比较 2609.4 YOLOv4中的损失函数C-IoU 2639.4.1 L1和L2损失的缺陷 2649.4.2 IoU和IoU损失 2649.4.3 G-IoU、D-IoU和C-IoU 2659.5 YOLOv4中的新型批标准化 2689.5.1 各种批标准化 2689.5.2 跨迭代标准化 270第10章 EfficientDet目标检测方法 27210.1 复合缩放 27210.2 双向特征金字塔网络 27410.3 EfficientDet体系结构 27610.3.1 输入图像分辨率缩放 27610.3.2 BiFPN缩放 27710.3.3 框/类预测网络缩放 27710.3.4 主干网 27710.4 EfficientDet推理效果和不足之处 27910.4.1 EfficientDet推理效果 27910.4.2 EfficientDet不足之处 282参考文献 284
推荐书籍
- 一个行者的传奇:分文不带走美国(麦金太尔(Mclntyre.M.) 著,向晓红,)
- 中国历代画论大观:清代画论(第9编 四)(俞剑华,江苏凤凰美术)
- 简·爱(未知)
- 历年真题及全真模拟试卷英语(未知)
- 纳米物理化学(薛永强,崔子祥 著,科学)
- 棉花育种学:当代科技重要著作·农业领域(潘家驹主编,中国农业)
- EDA设计实验教程(艾明晶 著,清华大学)
- 无人机系统纯方位定位技术及应用(刘忠、黄亮、石章松等著,国防工业)
