MATLAB计算机视觉与深度学习实战

MATLAB计算机视觉与深度学习实战 pdf epub mobi txt 电子书 下载 2025

刘衍琦,詹福宇,蒋献文,周华英 著
图书标签:
  • MATLAB
  • 计算机视觉
  • 深度学习
  • 图像处理
  • 模式识别
  • 机器学习
  • 算法
  • 实战
  • 案例
  • 神经网络
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 电子工业出版社
ISBN:9787121315503
版次:1
商品编码:12209248
品牌:Broadview
包装:平装
开本:16
出版时间:2017-06-01
用纸:胶版纸
页数:424
字数:610000

具体描述

产品特色

编辑推荐

适读人群 :本书以案例为基础,结构布局紧凑,内容深入浅出,实验简捷高效,适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及广大从事数字图像处理的工程研发人员阅读参考。

《MATLAB计算机视觉与深度学习实战》详细讲解了30个MATLAB计算机视觉与深度学习实战案例,提供源码及在线支持。

几乎涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习的理论及其应用方面。

适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及广大从事数字图像处理的工程研发人员阅读参考。


内容简介

《MATLAB 计算机视觉与深度学习实战》详细讲解了30个 MATLAB 计算机视觉与深度学习案例(含可运行程序),涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织提取、全景图像拼接、小波图像融合、基于语音识别的音频信号模拟灯控、路面裂缝检测识别、视频运动估计追踪、Simulink 图像处理、胸片及肝脏分割、基于深度学习的汽车目标检测、基于计算机视觉的自动驾驶应用、基于深度学习的视觉场景识别等多项重要技术,涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习的理论及其应用方面。

工欲善其事,必先利其器,《MATLAB 计算机视觉与深度学习实战》对每个数字图像处理的知识点都提供了丰富生动的案例素材,并详细讲解了其 MATLAB 实验的核心程序,通过对这些示例程序的阅读理解和仿真运行,读者可以更加深刻地理解图像处理的内容,并且更加熟练地掌握 MATLAB 中各种函数在图像处理领域中的用法。

《MATLAB计算机视觉与深度学习实战》以案例为基础,结构布局紧凑,内容深入浅出,实验简捷高效,适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及广大从事数字图像处理的工程研发人员阅读参考。

作者简介

  刘衍琦,硕士,计算机视觉算法工程师,毕业于大连理工大学数学科学学院计算几何与图形图像实验室。长期从事图像、声纹、视频检索及其大数据应用,对以图搜图、图文识别等进行过深入研究并成功应用于工程项目中,曾主编和参与编写多套书籍。

  詹福宇,博士,飞行控制算法工程师,毕业于西北工业大学航空学院飞行器设计专业。拥有近10 年 M ATLAB/Sim ulink 开发使用经验,熟悉 Sim ulink 基于模型设计的流程。于 2008 年创建m atlabsky.com ,编写教程数百篇,解决问题数万个,积累了丰富的相关经验。

  蒋献文,硕士,资深专业医事放射师,毕业于中国医药大学医学院临床医学研究所。从事医学图像处理、放射线射影技术、手术房计算机断层与血管摄影技术,针对临床放射技术学与图像处理进行过深入研究并发表相关医学论文。

  周华英,硕士,新能源汽车技术专业讲师,毕业于北京交通大学交通运输规划与管理专业。长期进行纯电动及混合动力汽车系统建模与控制、汽车动力系统与控制、电动汽车能量管理和控制优化等研究,曾主编和参与编写多套书籍。


目录

第 1 章 基于直方图优化的图像去雾技术 1

1.1 案例背景 1

1.2 理论基础 1

1.2.1 空域图像增强 1

1.2.2 直方图均衡化 2

1.3 程序实现 3

1.3.1 设计 GUI 界面 4

1.3.2 全局直方图处理 4

1.3.3 局部直方图处理 7

1.3.4 Retinex 增强处理 9

1.4 延伸阅读 13

1.5 参考文献 13

第 2 章 基于 形态学的权重自适应图像去噪 14

2.1 案例背景 14

2.2 理论基础 15

2.2.1 图像去噪方法 15

2.2.2 数学形态学原理 16

2.2.3 权重自适应的多结构形态学去噪 16

2.3 程序实现 17

2.4 延伸阅读 22

2.5 参考文献 23

第 3 章 基于多尺度形态学提取眼前节组织 24

3.1 案例背景 24

3.2 理论基础 25

3.3 程序实现 28

3.3.1 多尺度边缘 28

3.3.2 主处理函数 29

3.3.3 形态学处理 31

3.4 延伸阅读 33

3.5 参考文献 33

第 4 章 基于 Hough 变化的答题卡识别 34

4.1 案例背景 34

4.2 理论基础 34

4.2.1 图像二值化 35

4.2.2 倾斜校正 35

4.2.3 图像分割 38

4.3 程序实现 40

4.4 延伸阅读 51

4.5 参考文献 51

第 5 章 基于阈值分割的车牌定位识别 52

5.1 案例背景 52

5.2 理论基础 52

5.2.1 车牌图像处理 53

5.2.2 车牌定位原理 57

5.2.3 车牌字符处理 57

5.2.4 字符识别 59

5.3 程序实现 61

5.4 延伸阅读 69

5.5 参考文献 69

第 6 章 基于分水岭分割进行肺癌诊断 70

6.1 案例背景 70

6.2 理论基础 70

6.2.1 模拟浸水的过程 71

6.2.2 模拟降水的过程 71

6.2.3 过度分割问题 71

6.2.4 标记分水岭分割算法 71

6.3 程序实现 72

6.4 延伸阅读 77

6.5 参考文献 78

第 7 章 基于主成分分析的人脸二维码识别 79

7.1 案例背景 79

7.2 理论基础 79

7.2.1 QR 编码简介 80

7.2.2 QR 编码译码 82

7.2.3 主成分分析方法 84

7.3 程序实现 86

7.3.1 人脸建库 86

7.3.2 人脸识别 87

7.3.3 人脸二维码 88

7.4 延伸阅读 93

7.5 参考文献 93

第 8 章 基于知识库的手写体数字识别 94

8.1 案例背景 94

8.2 理论基础 94

8.2.1 算法流程 94

8.2.2 特征提取 95

8.2.3 模式识别 96

8.3 程序实现 97

8.3.1 图像处理 97

8.3.2 特征提取 98

8.3.3 模式识别 101

8.4 延伸阅读 102

8.4.1 识别器选择 102

8.4.2 提高识别率 102

8.5 参考文献 102

第 9 章 基于特征匹配的英文印刷字符识别 103

9.1 案例背景 103

9.2 理论基础 104

9.2.1 图像预处理 104

9.2.2 图像识别技术 105

9.3 程序实现 106

9.4 延伸阅读 112

9.5 参考文献 112

第 10 章 基于不变矩的数字验证码识别 113

10.1 案例背景 113

10.2 理论基础 114

10.3 程序实现 114

10.3.1 设计 GUI 界面· 114

10.3.2 载入验证码图像 115

10.3.3 验证码图像去噪 117

10.3.4 验证码数字定位 118

10.3.5 验证码归一化 121

10.3.6 验证码数字识别 122

10.3.7 手动确认并入库 125

10.3.8 重新生成模板库 127

10.4 延伸阅读 129

10.5 参考文献 130

第 11 章 基于小波技术进行图像融合 131

11.1 案例背景 131

11.2 理论基础 132

11.3 程序实现 134

11.3.1 GUI 设计 134

11.3.2 图像载入 135

11.3.3 小波融合 136

11.4 延伸阅读 139

11.5 参考文献 139

第 12 章 基于块匹配的全景图像拼接 140

12.1 案例背景 140

12.2 理论基础 140

12.2.1 图像匹配 141

12.2.2 图像融合 143

12.3 程序实现 144

12.3.1 设计 GUI 144

12.3.2 载入图片 145

12.3.3 图像匹配 147

12.3.4 图像拼接 150

12.4 延伸阅读 156

12.5 参考文献 156

第 13 章 基于霍夫曼图像压缩重建 157

13.1 案例背景 157

13.2 理论基础 157

13.2.1 霍夫曼编码的步骤 158

13.2.2 霍夫曼编码的特点 158

13.3 程序实现 160

13.3.1 设计 GUI 160

13.3.2 压缩重构 161

13.3.3 效果对比 166

13.4 延伸阅读 168

13.5 参考文献 169

第 14 章 基于主成分分析的图像压缩和重建 170

14.1 案例背景 170

14.2 理论基础 170

14.2.1 主成分降维分析原理 170

14.2.2 由得分矩阵重建样本 171

14.2.3 主成分分析数据压缩比 172

14.2.4 基于主成分分析的图像压缩 172

14.3 程序实现 173

14.3.1 主成分分析源代码 173

14.3.2 图像和样本间转换 174

14.3.3 基于主成分分析的图像压缩 175

14.4 延伸阅读 178

14.5 参考文献 179

第 15 章 基于小波的图像压缩技术 180

15.1 案例背景 180

15.2 理论基础 181

15.3 程序实现 183

15.4 延伸阅读 191

15.5 参考文献 191

第 16 章 基于 Hu 不变矩的图像检索技术 192

16.1 案例背景 192

16.2 理论基础 192

16.3 程序实现 194

16.3.1 图像预处理 194

16.3.2 计算不变矩 194

16.3.3 图像检索 196

16.3.4 结果分析 198

16.4 延伸阅读 201

16.5 参考文献 202

第 17 章 基于 Harris 的角点特征检测 203

17.1 案例背景 203

17.2 理论基础 204

17.2.1 Harris 基本原理 204

17.2.2 Harris 算法流程 206

17.2.3 Harris 角点性质 206

17.3 程序实现 208

17.3.1 Harris 算法代码 208

17.3.2 角点检测实例 209

17.4 延伸阅读 210

17.5 参考文献 211

第 18 章 基于 GUI 搭建通用视频处理工具 212

18.1 案例背景 212

18.2 理论基础 212

18.3 程序实现 214

18.3.1 GUI 设计 214

18.3.2 GUI 实现 215

18.4 延伸阅读 226

18.5 参考文献 226

第 19 章 基于语音识别的信号灯图像模拟控制技术 227

19.1 案例背景 227

19.2 理论基础 227

19.3 程序实现 229

19.4 延伸阅读 239

19.5 参考文献 240

第 20 章 基于帧间差法进行视频目标检测 241

20.1 案例背景 241

20.2 理论基础 241

20.2.1 帧间差分法 242

20.2.2 背景差分法 243

20.2.3 光流法 243

20.3 程序实现 244

20.4 延伸阅读 253

20.5 参考文献 253

第 21 章 路面裂缝检测识别系统设计 254

21.1 案例背景 254

21.2 理论基础 254

21.2.1 图像灰度化 255

21.2.2 图像滤波 257

21.2.3 图像增强 259

21.2.4 图像二值化 260

21.3 程序实现 262

21.4 延伸阅读 274

21.5 参考文献 274

第 22 章 基于 K-means 聚类算法的图像区域分割 275

22.1 案例背景 275

22.2 理论基础 275

22.2.1 K-means 聚类算法原理 275

22.2.2 K-means 聚类算法的要点 276

22.2.3 K-means 聚类算法的缺点 277

22.2.4 基于 K-means 图像分割 278

22.3 程序实现 278

22.3.1 样本之间的巨鹿 278

22.3.2 提取特征向量 279

22.3.3 图像聚类分割 280

22.4 延伸阅读 282

22.5 参考文献 283

第 23 章 基于光流场的交通汽车检测跟踪 284

23.1 案例背景 284

23.2 理论基础 284

23.2.1 光流法检测运动原理 284

23.2.2 光流的主要计算方法 285

23.2.3 梯度光流场约束方程 287

23.2.4 Horn-Schunck 光流算法 288

23.3 程序实现 290

23.3.1 计算视觉系统工具箱简介 290

23.3.2 基于光流场检测汽车运动 291

23.3.3 搭建 Simulink 运动检测模型 295

23.4 延伸阅读 297

23.5 参考文献 298

第 24 章 基于 Simulink 进行图像和视频处理 299

24.1 案例背景 299

24.2 模块介绍 299

24.2.1 分析和增强模块库(Analysis & Enhancement)· 300

24.2.2 转化模块库(Conversions) 301

24.2.3 滤波 3 模块库(Filtering) 301

24.2.4 几何变换模块库(Geometric Transformations) 302

24.2.5 形态学操作模块库(Morphological Operations) 302

24.2.6 输入模块库(Sources) 303

24.2.7 输出模块库(Sinks)· 303

24.2.8 统计模块库(Statistics) 304

24.2.9 文本和图形模块库(Text & Graphic)· 304

24.2.10 变换模块库(Transforms) 305

24.2.11 其他工具模块库(Utilities) 305

24.3 仿真案例 306

24.3.1 搭建组织模型 306

24.3.2 仿真执行模型 308

24.3.3 代码自动生成 309

24.4 延伸阅读 314

24.5 参考文献 316

第 25 章 基于小波变换的数字水印技术 317

25.1 案例背景 317

25.2 理论基础 317

25.2.1 数字水印技术原理 318

25.2.2 典型的数字水印算法 320

25.2.3 数字水印攻击和评价 322

25.2.4 基于小波的水印技术 323

25.3 程序实现 326

25.3.1 准备载体和水印图像 326

25.3.2 小波数字水印的嵌入 327

25.3.3 小波数字水印的提取 331

25.3.4 小波水印的攻击试验 333

25.4 延伸阅读 337

25.5 参考文献 337

第 26 章 基于最小误差法的胸片分割 339

26.1 案例背景 339

26.2 理论基础 339

26.2.1 图像增强 340

26.2.2 区域选择 340

26.2.3 形态学滤波 341

26.2.4 最小误差法胸片分割 342

26.3 程序实现 343

26.3.1 设计 GUI 界面· 343

26.3.2 图像预处理 344

26.3.3 最小误差法分割 348

26.3.4 形态学后处理 350

26.4 延伸阅读 353

26.5 参考文献 353

第 27 章 基于区域生长的肝脏影像分割系统 354

27.1 案例背景 354

27.2 理论基础 355

27.2.1 阈值分割 355

27.2.2 区域生长 355

27.2.3 基于阈值预分割的区域生长 356

27.3 程序实现 357

27.4 延伸阅读 361

27.5 参考文献 361

第 28 章 基于深度学习的汽车目标检测 362

28.1 案例背景 362

28.2 理论基础 363

28.2.1 基本架构 363

28.2.2 卷积层 363

28.2.3 池化层 365

28.3 程序实现 365

28.3.1 加载数据 365

28.3.2 构建 CNN 网络 367

28.3.3 训练 CNN 网络 368

28.3.4 评估训练效果 370

28.4 延伸阅读 372

28.5 参考文献 372

第 29 章 基于计算机视觉的自动驾驶应用 374

29.1 案例背景 374

29.2 理论基础 375

29.2.1 环境感知 375

29.2.2 行为决策 375

29.2.3 路径规划 376

29.2.4 运动控制 376

29.3 程序实现 376

29.3.1 传感器数据载入 376

29.3.2 追踪器创建 378

29.3.3 碰撞预警 380

29.4 延伸阅读 385

29.5 参考文献 385

第 30 章 基于深度学习的视觉场景识别 386

30.1 案例背景 386

30.2 理论基础 387

30.2.1 发展历程 387

30.2.2 算法思想 387

30.3 程序实现 388

30.3.1 环境配置 388

30.3.2 数据集制作 389

30.3.3 网络训练 391

30.3.4 网络测试 397

30.4 延伸阅读 400

30.5 参考文献 400

前言/序言

推荐序

在当今的信息化社会,图像是人类赖以获取信息的最重要来源之一。随着计算机技术的迅猛发展,图像技术与计算机技术不断融合,产生了一系列图像处理软件如 MATLAB 等,这些软件的广泛应用为图像技术的发展提供了强大的支持。

MATLAB 已成为国际公认的最优秀的科技应用软件之一,具有编程简单、数据可视化功能强、可操作性强等特点,而且配有功能强大、专业函数丰富的图像处理工具箱,是进行图像处理必备的软件工具。

现有的 MATLAB 图像处理著作多是讲解图像处理中的经典理论与算法,鲜有解决实际问题的案例。而在《MATLAB 计算机视觉与深度学习实战》中,作者将自己在多年的实践中积累的案例与读者分享,其中关于图像去雾、图像去噪、图像识别等方面的相关内容都紧跟图像研究热点,对于刚开始接触相关领域的研究者来说,是很好的入门教程。

《MATLAB 计算机视觉与深度学习实战》的一大特点是,它对于每个案例都有详细的理论基础介绍,并配备了实例代码和注释,不仅可以让初学者很快学习到代码编写方面的知识,还可以让读者在动手实践的过程中深入理解所研究的相关问题。

《MATLAB 计算机视觉与深度学习实战》将代码讲解融入实际的案例中,相比其他基础书籍更加生动形象,解决了读者在实践过程中遇到的具体、实际的技术难点,为读者提供了直接的技术支持。

《MATLAB 计算机视觉与深度学习实战》案例贴近实际研究,兼顾中高级读者。相信读者在仔细研读和实践的过程中,能更深刻地体会到 MATLAB 在图像处理方面带来的极大便利。这是一本值得相关领域研究人员与高校学生认真品读的好书,非常值得推荐。

刘日升

大连理工大学国家示范性软件学院副教授

香港理工大学计算科学系香江学者

2017 年 5 月 11 日

MATLAB 是 MathWorks 公司推出的一款应用于科学计算和工程仿真的交互式编程软件,近几年已经发展成为集数值分析、数学建模、图像处理、控制系统、信号处理、经济金融、计算生物学、动态仿真等于一体的科学工程软件。数字图像处理技术涉及计算机科学、模式识别、人工智能、生物工程等学科,是一门综合性的技术。

自从电子计算机诞生以来,通过计算机仿真来模拟人类视觉便成为一项非常热门且颇具挑战性的研究课题,随着数码相机、智能手机等硬件设备的普及,图像以其易于采集、信息相关性多、抗干扰能力强的特点得到了越来越广泛的应用。信息化和数字化时代已经来临,随着国家对人工智能领域的不断投入,图像处理的需求量也会越来越大,应用也将越来越广泛。

MATLAB 图像处理工具箱可为用户提供诸如图像变换、图像增强、图像特征检测、图像复原、图像分割、图像去噪、图像配准、视频处理等功能研发的技术支撑。同时,借助于MATLAB 方便的编程及调试技巧,用户可以根据需要进一步拓展图像处理工具箱,实现定制的图像处理需求。

本书目的

本书以案例的形式展现,力求为读者提供最便捷、直接的技术支持,解决读者在研发过程中遇到的最具体、实际的技术难点,争取与广大读者分享研发过程中所涉及的功能模块及某些成熟的系统框架,为读者进行科学实验、项目开发提供一定的技术支持。

通过对书中案例的阅读、理解、运行和仿真,读者可以有针对性地进行算法调试,这样可以更加深刻地理解图像与视频处理的含义,并且更加熟练地掌握 MATLAB 图像处理工具箱的用法。

本书特点

作者阵容强大,经验相当丰富

在实际的科研工作中,本书作者刘衍琦(论坛 ID:lyqmath)是 MATLAB 技术论坛图版主,通过运用 MATLAB 进行图像处理、视频分析等项目实践,积累了较为丰富的项目实战经验;本书作者詹福宇(论坛 ID:dynamic)长期与国内外会员进行技术交流,积极解答会员疑问并进行经验总结,积累了丰富的 MATLAB/Simulink 图像处理经验;本书作者蒋献文多年从事医学影像处理工作,多次参加影像处理相关研讨会;本书作者周华英从事新能源汽车的教学和科研工作,曾率队获得全国新能源汽车大赛二等奖,具备丰富的教学实践经验。

案例丰富、实用、拓展性强

本书以案例的形式进行编写,充分强调“案例的实用性、程序的可拓展性”,所选案例均来自于 MATLAB 技术论坛会员的切身需求,每个案例都与实际课题相结合。另外,书中的每个案例都经过作者在 MATLAB 上进行程序调试,作者也为此编写了大量的测试代码。书中某些部分的内容描述是作者根据图像处理实验过程进行归纳总结的结果,多数案例的程序实现具有一定的原创性。

理论知识扎实,集众家之长

本书编写过程中参考了大量的 MATLAB 帮助文档、MATLAB 相关书籍及 MATLAB 技术论坛等方面的资源,同时引用了部分参考文献的最新图像相关技术和理论。

点面完美结合,兼顾中高级用户

本书点面兼顾,涵盖了数字图像处理中几乎所有的基本模块,并涉及视频处理、配准拼接、数字水印、生物识别等高级图像处理方面的内容,全面讲解了基于 MATLAB 进行计算机视觉及深度学习应用的原理及方法。

配套资源丰富,交流资源绝佳

本书作者和编辑联合 MATLAB 技术论坛,为广大读者提供“在线交流,有问必答”网络互动答疑服务,您可以与作者一对一地探讨相关知识点,以及下载书籍的辅助资料,让您获得最佳的阅读体验。您的建议将是我们创作精品的最大动力和源泉。

书码验证:http://www.matlabsky.com/plugin.php?id=vipbook:list

在线交流:http://www.matlabsky.com/forum-53-1.html

程序源码:http://www.matlabsky.com/thread-45343-1-1.html

答疑汇总:http://www.matlabsky.com/thread-45344-1-1.html

错误勘正????:http://www.matlabsky.com/thread-45346-1-1.html????

本书作者会尽量每周登录网站 2~3 次,集中回复读者的疑难问题,但由于工作和时间等原因,作者可能无法及时回答读者的所有问题,敬请大家谅解。只要您愿意交流和学习,MATLAB 技术论坛有足够优秀的会员帮您解答。

内容架构

本书共有 30 个 MATLAB 图像与视频处理案例(含可运行程序),其内容架构如下所述。

第 1 章:讲述基于直方图优化的图像去雾技术,通过直方图增强技术的相关研究,引入对雾霾图像进行优化的应用。

第 2 章:讲述基于形态学的权重自适应图像去噪,通过形态学的图像去噪效果,引入加权形态学去噪的应用。

第 3 章:讲述基于多尺度形态学提取眼前节组织,通过形态学的图像边缘提取效果,引入多尺度形态学的应用。

第 4 章:讲述基于 Hough 变化的答题卡识别,通过对答题卡自动阅卷的研究,引入图像分割、目标定位等领域的应用。

第 5 章:讲述基于阈值分割的车牌定位识别,通过对车牌定位、分割、识别的研究,引入图像处理在车牌识别领域的应用。

第 6 章:讲述基于分水岭分割进行肺癌诊断,通过分水岭算法在肺部图像分割的研究,引入分水岭及医学图像处理的应用。

第 7 章:讲述基于主成分分析的人脸二维码识别,通过对主成分分析、人脸识别、QR二维码的研究,引入 QR 人脸识别的应用。

第 8 章:讲述基于知识库的手写体数字识别,通过对手写数字特征的提取,引入模式识别在手写数字方面的应用。

第 9 章:讲述基于特征匹配的英文印刷字符识别,通过对英文片段图像的分割、识别,引入在 MATLAB 中生成自定义标准字符库、GUI 交互等领域的应用。

第 10 章:讲述基于不变矩的数字验证码识别,通过对验证码生成特点、分割定位、检测识别的研究,引入对某特定类型验证码从获取到识别的应用。

第 11 章:讲述基于小波技术进行图像融合,通过对图像融合的研究,引入小波分解、图像多分辨率处理的应用。

第 12 章:讲述基于块匹配的全景图像拼接,通过对全景图像生成方法的研究,引入块匹配、加权融合等的应用。

第 13 章:讲述基于霍夫曼图像压缩重建,通过对霍夫曼编码的研究,引入图像压缩重建的应用。

第 14 章:讲述基于主成分分析的图像压缩和重建,通过对主成分分析的研究,引入不同压缩参数下重建效果调优的应用。

第 15 章:讲述基于小波的图像压缩技术,通过对小波图像处理的研究,引入多分辨率图像压缩重建的应用。

第 16 章:讲述基于 Hu 不变矩的图像检索技术,通过对图像库 Hu 矩特征提取的研究,引入图像检索的应用。

第 17 章:讲述基于 Harris 的角点特征检测,通过对 Harris 检测算法的研究,引入图像角点检测的应用。

第 18 章:讲述基于 GUI 搭建通用视频处理工具,通过对 GUI、视频图像处理工具箱的使用,搭建 MATLAB 图像视频处理框架的应用。

第 19 章:讲述基于语音识别的信号灯图像模拟控制技术,通过对语音特征及建库的研究,引入一个语音控制光信号的应用。

第 20 章:讲述基于帧间差法进行视频目标检测,通过对视频跟踪的研究,引入在视频中多目标跟踪的应用。

第 21 章:讲述路面裂缝检测识别系统设计,通过对裂缝图像特征、识别的研究,引入路面裂缝检测和提取的应用。

第 22 章:讲述基于 K-means 聚类算法的图像区域分割,通过对 K 均值聚类算法的研究,引入其在图像分割方面的应用。

第 23 章:讲述基于光流场的汽车检测跟踪,通过对汽车视频跟踪的研究,引入光流场在跟踪检测方面的应用。

第 24 章:讲述基于 Simulink 进行图像和视频处理,通过对 Simulink 模块的简介,引入其在图像视频处理领域的应用。

第 25 章:讲述基于小波变换的数字水印技术,通过对图像水印的相关研究,引入图像水印嵌入、提取等的应用。

第 26 章:讲述基于最小误差法的胸片分割技术,通过对肺部影像的分割算法对比,介绍最小误差分割算法及其应用。

第 27 章:讲述基于区域生长的肝影像分割技术,通过对区域生长的相关研究,介绍了如何自动定义种子点并将其应用到肝脏影像的分割方面。

第 28 章:讲述基于深度学习的汽车目标检测应用,介绍深度学习的相关知识,基于MATLAB 的 CNN 工具箱实现汽车目标检测的应用。

第 29 章:讲述基于计算机视觉的自动驾驶应用,介绍自动驾驶的相关技术,从计算机视觉的角度分析相关应用。

第 30 章:讲述基于深度学习的视觉场景识别应用,对深度学习进行深入研究,基于经典的 matconvnet 工具箱讲解如何进行图像分类识别应用。

关于 MATLAB 技术论坛

MATLAB 技术论坛(Simulink 仿真论坛,http://www.matlabsky.com)是国内两大 MATLAB技术学习和交流平台之一,致力于为大家提供专业、权威的 MathWorks 新闻资讯,丰富、免费的 MATLAB 教学资源,以及强大、全面的 MATLAB 技术支持。

MATLAB 技术论坛由西北工业大学航空学院 dynamic 同学于 2008 年 09 月 14 日创建,并在 2010 年 8 月 1 日对论坛管理结构进行了扩充和重组,新加入 6 名 MATLAB 高级爱好者(yaksa、matsuper、yangzijiang、faruto、rocwoods、xiezhh)!目前 MATLAB 技术论坛有注册会员 30 多万,管理成员 30 多名,专业版块 80 多个,高质量主题 20000+;举办过编程竞赛、线下研讨会和数模竞赛等多项活动;与多个出版单位和科研机构有合作关系!

特别致谢

本书由刘衍琦、詹福宇、蒋献文、周华英编著,在本书的编写过程中,得到了电子工业出版社博文视点编辑张国霞的大力支持,在此对其表示衷心的感谢。作者对本书所引用参考文献、博客的作者表示感谢,同时对各位 MATLAB 技术论坛的会员朋友给予的启发和帮助表示感谢。最后,感谢我的家人的默默支持!感谢女儿刘沛萌每天给我带来的欢乐,她鼓励我在计算机视觉应用案例方面进行积累和整理,也祝天下的小朋友们都能健康快乐地成长!

由于时间仓促,加之作者水平和经验有限,书中难免存在疏漏及错误之处,希望广大读者批评指正。

刘衍琦

2017 年 5 月



图像的语言:感知、理解与创造 在这个信息爆炸的时代,图像已成为我们认知世界、交流情感、传递知识的重要媒介。从日常的社交媒体分享,到医学影像诊断,再到工业生产的智能检测,再到自动驾驶汽车的“眼睛”,图像无处不在,并且其重要性日益凸显。然而,对我们而言轻易可见的画面,对机器而言却是一串串冰冷的数据。如何让机器“看懂”图像,理解其中的内容,并能基于此进行更高级的推理和创造,是当前计算机科学领域最具挑战性也最富前景的研究方向之一。 本书旨在为您揭示图像背后的奥秘,带您深入探索如何让计算机具备“视觉”能力,并进一步理解和运用其中蕴含的信息。我们将从最基础的图像感知原理出发,逐步深入到复杂的图像理解与分析技术,最终触及利用这些技术进行创造性应用的广阔天地。 第一部分:图像的基石——感知与表示 首先,我们需要理解图像本身是如何被计算机捕捉和存储的。本书将从数字图像的基本概念讲起,讲解像素、分辨率、颜色空间(如RGB、灰度、HSV等)是如何定义一幅图像的。您将学习到,看似简单的照片,在计算机眼中不过是由无数个点组成的矩阵,而这些点的排列组合则构成了我们看到的一切。 随后,我们将探讨图像的获取技术。从传统的相机成像原理,到更先进的传感器技术,如CCD、CMOS,再到医学影像设备(CT、MRI)、遥感卫星等,这些设备如何将现实世界的光学信息转化为数字信号,是这一切的基础。您将了解不同成像原理对图像质量和信息丰富度的影响。 理解了图像的数字表示后,我们还需要学习如何有效地处理这些数据。图像预处理是后续分析的关键一步。本书将介绍一系列经典的图像增强技术,例如灰度化、直方图均衡化,它们能有效地改善图像的对比度和细节,让潜在的信息更加突出。我们还将讲解图像滤波技术,如高斯滤波、中值滤波,它们能够去除图像中的噪声,使图像更加平滑,为后续的特征提取奠定基础。您将体会到,看似简单的“磨皮”和“降噪”,背后蕴含着精妙的数学原理和算法。 第二部分:图像的探索——特征提取与识别 仅仅看到图像的像素信息是不够的,我们需要从中提取出能够代表图像内容的关键信息,这便是特征提取。本书将带领您走进特征提取的世界,从经典的局部特征描述符,如SIFT、SURF、ORB,到更现代的卷积神经网络(CNN)自动学习到的特征,您将理解它们是如何捕捉图像中的边缘、角点、纹理等有意义的信息的。 您将学习到,这些特征描述符是如何在图像的不同尺度、旋转角度下保持稳定性的,以及它们在图像检索、目标匹配等任务中的应用。例如,您可以通过比较两幅图像的SIFT特征,判断它们是否为同一场景,或者是否包含同一物体。 有了特征,我们就可以进行图像识别和分类了。本书将介绍多种经典的机器学习算法,如支持向量机(SVM)、K近邻(KNN)、决策树等,如何利用提取到的特征对图像进行分类。您将理解,这些算法是如何通过学习大量的标记数据,建立起图像类别与特征之间的映射关系,从而实现对未知图像的自动分类。 第三部分:图像的洞察——理解与分析 识别出图像中的物体只是第一步,更进一步的目标是理解图像的整体含义,甚至进行更深层次的分析。本书将深入探讨计算机视觉中的关键任务: 目标检测: 如何在图像中准确地定位出特定物体的位置,并给出其类别。您将学习到基于滑动窗口、区域建议网络(RPN)等主流的目标检测算法,如RST-CNN、YOLO、SSD等,并理解它们在实时检测和高精度检测方面的权衡。想象一下,自动驾驶汽车如何通过目标检测来识别行人、车辆和交通标志,这项技术的重要性不言而喻。 图像分割: 将图像划分为多个具有语义意义的区域。我们将介绍像素级别的分割方法,如阈值分割、区域生长,以及更强大的深度学习分割模型,如全卷积网络(FCN)、U-Net、Mask R-CNN等。您将理解,图像分割在医学影像分析(如肿瘤区域分割)、自动驾驶(如道路和车道线分割)等领域有着不可替代的作用。 姿态估计: 理解图像中物体(特别是人体)的关键点位置和姿态。这对于人机交互、运动分析、虚拟现实等领域至关重要。您将了解基于深度学习的姿态估计算法,如何从一张静态图像中推断出三维空间的姿态信息。 场景理解: 超越单个物体的识别,理解整个图像的场景内容,例如“在公园里,人们在野餐”。本书将介绍一些更高级的场景理解技术,包括图像描述生成,以及基于知识图谱的场景推理。 第四部分:图像的未来——深度学习与创造 近年来,深度学习的飞速发展极大地推动了计算机视觉领域的进步。本书将花费大量篇幅,系统地介绍深度学习在计算机视觉中的核心应用。 卷积神经网络(CNN): 您将深入理解CNN的架构,如卷积层、池化层、全连接层,以及它们是如何通过层次化的特征提取来模拟人脑视觉皮层的处理机制。我们将详细讲解AlexNet、VGG、ResNet、Inception等经典CNN架构的设计思想和优劣。 数据增强与迁移学习: 在深度学习中,数据是关键。您将学习如何利用数据增强技术来扩充训练数据集,提高模型的泛化能力。同时,迁移学习的概念将让您明白,如何利用预训练的模型来加速新任务的学习,即使在数据量有限的情况下也能取得优异的性能。 生成模型(GANs): 深度学习不仅能“看”,还能“创”。生成对抗网络(GANs)的出现,使得计算机能够生成逼真的图像,例如人脸、艺术作品等。您将了解GANs的工作原理,以及它在图像风格迁移、超分辨率重建、数据合成等方面的应用。 Transformer在视觉领域的应用: 近期,Transformer模型在自然语言处理领域的成功也被引入到计算机视觉领域,并取得了令人瞩目的成就。本书将介绍Vision Transformer (ViT) 等模型,展示其在大规模图像识别、目标检测等任务上的潜力。 第五部分:实践与应用 理论学习离不开实践。本书将贯穿大量的实际案例和代码示例,让您亲手操作,将所学知识转化为解决实际问题的能力。我们将引导您使用流行的深度学习框架,如TensorFlow、PyTorch,来构建、训练和部署各种计算机视觉模型。 您将有机会参与到诸如: 开发一个能够识别猫狗的图像分类器。 实现一个可以检测图像中人脸的人脸检测系统。 运用GANs生成具有特定风格的艺术画作。 构建一个智能安防系统,用于异常事件的检测。 探索自动驾驶中的视觉感知模块。 通过这些实践项目,您将深刻体会到计算机视觉和深度学习的强大力量,并能将其应用到自己的研究和工作中。 本书适合谁? 对计算机视觉和深度学习充满好奇,希望系统学习相关知识的学生和研究人员。 希望将图像处理和分析技术应用于自身业务的工程师和开发人员。 渴望理解人工智能如何“看”并利用图像信息,从而探索更广阔应用前景的科技爱好者。 无论您是初学者还是有一定基础的学习者,本书都将为您提供一条清晰的学习路径,帮助您在图像的语言中游刃有余,解锁前沿技术,引领智能时代的未来。让我们一同踏上这场激动人心的图像探索之旅吧!

用户评价

评分

我一直以来都对计算机视觉领域充满好奇,特别是近年来深度学习在这一领域的飞速发展,更是让我跃跃欲试。然而,很多现有的资料要么侧重于理论讲解,对我这种更偏向实践操作的人来说显得有些枯燥;要么就是纯粹的代码堆砌,缺乏系统性的理论支撑。《MATLAB计算机视觉与深度学习实战》这本书则恰好填补了这一空白。它以MATLAB为载体,将计算机视觉中的核心算法和深度学习模型进行了生动且富有条理的阐述。我尤其欣赏书中对每一个算法或模型的讲解方式,总是先从直观的原理入手,配以清晰的图示,然后迅速过渡到MATLAB代码实现,并通过实际案例来验证其效果。例如,在讲解物体检测的 Faster R-CNN 模型时,书中不仅详细解释了模型的工作流程,还提供了可以直接运行的MATLAB代码,并对代码的每一部分进行了解释,让我能够清晰地理解模型的每一个组件是如何协同工作的。这种由浅入深、循序渐进的学习路径,让我感到非常舒适,也大大提升了我学习的动力和效率。

评分

坦白说,我之前也接触过几本关于深度学习的书籍,但总觉得它们要么过于学术化,要么缺乏实际操作指导,导致学了之后感觉“纸上谈兵”,难以应用。直到我遇到了《MATLAB计算机视觉与深度学习实战》,我才真正体会到“实战”二字的含义。这本书的核心优势在于它将深度学习的理论知识与MATLAB强大的计算和可视化能力紧密结合。作者在书中巧妙地利用MATLAB丰富的工具箱,将许多复杂的算法实现变得直观易懂。例如,在介绍特征提取和匹配时,书中详细演示了如何使用MATLAB的函数来完成 SIFT、SURF 等经典算法,并辅以直观的图示,让我能够清晰地看到特征点的提取过程和匹配结果。更让我印象深刻的是,书中对于迁移学习、数据增强等实用技巧的讲解,这些都是在实际项目中提升模型性能的关键。作者通过具体的代码示例,一步步引导读者如何将预训练的模型应用到新的任务中,或者如何通过生成更多样的训练数据来提高模型的泛化能力。这本书真正做到了理论与实践并重,让我觉得学习过程充满了乐趣和成就感。

评分

这本书《MATLAB计算机视觉与深度学习实战》给我带来的最大惊喜,在于它所提供的那种“全链路”的学习体验。我之前学习深度学习,往往是零散地接触一些模型,或者阅读一些零散的博客文章,总感觉缺乏一个完整的框架。这本书则不同,它从基础概念开始,逐步引导你构建和理解一个完整的计算机视觉应用。书中对数据的处理、模型的搭建、训练的调优,以及最终的部署和应用,都进行了非常详尽的介绍。特别是在模型评估和性能优化方面,作者不仅给出了常用的指标,还讲解了如何通过不同的策略来提升模型的准确率和鲁棒性。我印象最深刻的是书中关于数据集构建和标注的章节,这在实际项目中是至关重要但又常常被忽略的一环。作者通过MATLAB的工具,详细演示了如何高效地进行数据标注,并将其应用于模型训练。这种从数据准备到模型部署的完整流程,让我对整个计算机视觉和深度学习项目的生命周期有了更清晰的认识,也让我更加自信地去面对未来的项目挑战。

评分

在人工智能浪潮汹涌而来的今天,如何快速掌握核心技术,并将其转化为实际生产力,是每一位技术从业者都在思考的问题。这本书《MATLAB计算机视觉与深度学习实战》就像是一座精心设计的桥梁,连接了理论的殿堂与实践的沃土。它并非简单罗列算法的公式和原理,而是将复杂的概念巧妙地融入到一个个具体而生动的应用场景中。比如,在讲解卷积神经网络(CNN)的部分,作者并没有停留在抽象的层级,而是通过一个实际的图像分类项目,让我们亲手构建、训练和评估一个CNN模型。从数据的预处理,到网络结构的搭建,再到参数的调优,每一步都清晰明了,附带的MATLAB代码更是可以直接运行,便于我们理解每个环节的作用。我特别喜欢书中对模型解释性的探讨,很多深度学习模型被认为是“黑箱”,但这本书提供了一些工具和方法,帮助我们去理解模型为什么会做出这样的决策,这对于调试和优化模型至关重要。读完这本书,我感觉自己不再是那个对深度学习模型望而却步的旁观者,而是能够自信地参与到相关的项目开发中,解决实际问题,这是我最看重的一点。

评分

这本《MATLAB计算机视觉与深度学习实战》的出现,无疑是给在计算机视觉和深度学习领域摸索的同学们打了一剂强心针。我作为一名在图像处理领域摸爬滚打了几年,但对深度学习一直有些隔阂的工程师,拿到这本书的时候,内心是既期待又忐忑的。期待的是它能填补我知识上的空白,让我跟上行业发展的步伐;忐忑的是,虽然书名里有“实战”二字,但我总担心会遇到枯燥的理论堆砌,或者代码晦涩难懂,最终不了了之。然而,当我真正翻开这本书,一行行代码,一个个图例,一点点地渗透进我的脑海时,这种顾虑便烟消云散了。作者的叙述方式非常接地气,仿佛一位经验丰富的导师,一步步地引导你从基础概念出发,逐步深入到更复杂的算法和模型。书中的案例选取也极具代表性,涵盖了目标检测、图像分割、人脸识别等多个热门应用场景,让我在学习理论的同时,能够快速地将其与实际问题联系起来,感受到知识落地的力量。更重要的是,书中提供的MATLAB代码不仅结构清晰,而且注释详尽,即便是我这样对MATLAB不太熟悉的读者,也能很快理解其逻辑,并在此基础上进行修改和拓展,这种“拿来即用”的学习体验,极大地提升了我的学习效率和信心。

评分

讲解详细 方便实用

评分

包装不错的一本图书,名字起的特别广泛,但是图书中内容并不广泛,感觉一般

评分

书籍不错,印刷包装都不错。内容还不错,几个应用实验还是比较具体的。京东送货一如既往的快赞一个。

评分

送货非常快,东西也不错

评分

就是一个一个的案例,并给出了代码,有参考价值

评分

还不错吧!!!有视频和代码很不错,不过,价格不便宜!赞!!!!

评分

不错不错不错不错不错不错

评分

书籍非常不错,五星好评。适合入门级想往人工智能方向的人观看

评分

这本书有源码,可以自习,也方便用于教材。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有