MATLAB計算機視覺與深度學習實戰

MATLAB計算機視覺與深度學習實戰 pdf epub mobi txt 電子書 下載 2025

劉衍琦,詹福宇,蔣獻文,周華英 著
圖書標籤:
  • MATLAB
  • 計算機視覺
  • 深度學習
  • 圖像處理
  • 模式識彆
  • 機器學習
  • 算法
  • 實戰
  • 案例
  • 神經網絡
想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 電子工業齣版社
ISBN:9787121315503
版次:1
商品編碼:12209248
品牌:Broadview
包裝:平裝
開本:16
齣版時間:2017-06-01
用紙:膠版紙
頁數:424
字數:610000

具體描述

産品特色

編輯推薦

適讀人群 :本書以案例為基礎,結構布局緊湊,內容深入淺齣,實驗簡捷高效,適閤計算機、信號通信和自動化等相關專業的教師、本科生、研究生,以及廣大從事數字圖像處理的工程研發人員閱讀參考。

《MATLAB計算機視覺與深度學習實戰》詳細講解瞭30個MATLAB計算機視覺與深度學習實戰案例,提供源碼及在綫支持。

幾乎涵蓋瞭數字圖像處理中幾乎所有的基本模塊,並延伸到瞭深度學習的理論及其應用方麵。

適閤計算機、信號通信和自動化等相關專業的教師、本科生、研究生,以及廣大從事數字圖像處理的工程研發人員閱讀參考。


內容簡介

《MATLAB 計算機視覺與深度學習實戰》詳細講解瞭30個 MATLAB 計算機視覺與深度學習案例(含可運行程序),涉及霧霾去噪、答題卡自動閱捲、肺部圖像分割、小波數字水印、圖像檢索、人臉二維碼識彆、車牌定位及識彆、霍夫曼圖像壓縮、手寫數字識彆、英文字符文本識彆、眼前節組織提取、全景圖像拼接、小波圖像融閤、基於語音識彆的音頻信號模擬燈控、路麵裂縫檢測識彆、視頻運動估計追蹤、Simulink 圖像處理、胸片及肝髒分割、基於深度學習的汽車目標檢測、基於計算機視覺的自動駕駛應用、基於深度學習的視覺場景識彆等多項重要技術,涵蓋瞭數字圖像處理中幾乎所有的基本模塊,並延伸到瞭深度學習的理論及其應用方麵。

工欲善其事,必先利其器,《MATLAB 計算機視覺與深度學習實戰》對每個數字圖像處理的知識點都提供瞭豐富生動的案例素材,並詳細講解瞭其 MATLAB 實驗的核心程序,通過對這些示例程序的閱讀理解和仿真運行,讀者可以更加深刻地理解圖像處理的內容,並且更加熟練地掌握 MATLAB 中各種函數在圖像處理領域中的用法。

《MATLAB計算機視覺與深度學習實戰》以案例為基礎,結構布局緊湊,內容深入淺齣,實驗簡捷高效,適閤計算機、信號通信和自動化等相關專業的教師、本科生、研究生,以及廣大從事數字圖像處理的工程研發人員閱讀參考。

作者簡介

  劉衍琦,碩士,計算機視覺算法工程師,畢業於大連理工大學數學科學學院計算幾何與圖形圖像實驗室。長期從事圖像、聲紋、視頻檢索及其大數據應用,對以圖搜圖、圖文識彆等進行過深入研究並成功應用於工程項目中,曾主編和參與編寫多套書籍。

  詹福宇,博士,飛行控製算法工程師,畢業於西北工業大學航空學院飛行器設計專業。擁有近10 年 M ATLAB/Sim ulink 開發使用經驗,熟悉 Sim ulink 基於模型設計的流程。於 2008 年創建m atlabsky.com ,編寫教程數百篇,解決問題數萬個,積纍瞭豐富的相關經驗。

  蔣獻文,碩士,資深專業醫事放射師,畢業於中國醫藥大學醫學院臨床醫學研究所。從事醫學圖像處理、放射綫射影技術、手術房計算機斷層與血管攝影技術,針對臨床放射技術學與圖像處理進行過深入研究並發錶相關醫學論文。

  周華英,碩士,新能源汽車技術專業講師,畢業於北京交通大學交通運輸規劃與管理專業。長期進行純電動及混閤動力汽車係統建模與控製、汽車動力係統與控製、電動汽車能量管理和控製優化等研究,曾主編和參與編寫多套書籍。


目錄

第 1 章 基於直方圖優化的圖像去霧技術 1

1.1 案例背景 1

1.2 理論基礎 1

1.2.1 空域圖像增強 1

1.2.2 直方圖均衡化 2

1.3 程序實現 3

1.3.1 設計 GUI 界麵 4

1.3.2 全局直方圖處理 4

1.3.3 局部直方圖處理 7

1.3.4 Retinex 增強處理 9

1.4 延伸閱讀 13

1.5 參考文獻 13

第 2 章 基於 形態學的權重自適應圖像去噪 14

2.1 案例背景 14

2.2 理論基礎 15

2.2.1 圖像去噪方法 15

2.2.2 數學形態學原理 16

2.2.3 權重自適應的多結構形態學去噪 16

2.3 程序實現 17

2.4 延伸閱讀 22

2.5 參考文獻 23

第 3 章 基於多尺度形態學提取眼前節組織 24

3.1 案例背景 24

3.2 理論基礎 25

3.3 程序實現 28

3.3.1 多尺度邊緣 28

3.3.2 主處理函數 29

3.3.3 形態學處理 31

3.4 延伸閱讀 33

3.5 參考文獻 33

第 4 章 基於 Hough 變化的答題卡識彆 34

4.1 案例背景 34

4.2 理論基礎 34

4.2.1 圖像二值化 35

4.2.2 傾斜校正 35

4.2.3 圖像分割 38

4.3 程序實現 40

4.4 延伸閱讀 51

4.5 參考文獻 51

第 5 章 基於閾值分割的車牌定位識彆 52

5.1 案例背景 52

5.2 理論基礎 52

5.2.1 車牌圖像處理 53

5.2.2 車牌定位原理 57

5.2.3 車牌字符處理 57

5.2.4 字符識彆 59

5.3 程序實現 61

5.4 延伸閱讀 69

5.5 參考文獻 69

第 6 章 基於分水嶺分割進行肺癌診斷 70

6.1 案例背景 70

6.2 理論基礎 70

6.2.1 模擬浸水的過程 71

6.2.2 模擬降水的過程 71

6.2.3 過度分割問題 71

6.2.4 標記分水嶺分割算法 71

6.3 程序實現 72

6.4 延伸閱讀 77

6.5 參考文獻 78

第 7 章 基於主成分分析的人臉二維碼識彆 79

7.1 案例背景 79

7.2 理論基礎 79

7.2.1 QR 編碼簡介 80

7.2.2 QR 編碼譯碼 82

7.2.3 主成分分析方法 84

7.3 程序實現 86

7.3.1 人臉建庫 86

7.3.2 人臉識彆 87

7.3.3 人臉二維碼 88

7.4 延伸閱讀 93

7.5 參考文獻 93

第 8 章 基於知識庫的手寫體數字識彆 94

8.1 案例背景 94

8.2 理論基礎 94

8.2.1 算法流程 94

8.2.2 特徵提取 95

8.2.3 模式識彆 96

8.3 程序實現 97

8.3.1 圖像處理 97

8.3.2 特徵提取 98

8.3.3 模式識彆 101

8.4 延伸閱讀 102

8.4.1 識彆器選擇 102

8.4.2 提高識彆率 102

8.5 參考文獻 102

第 9 章 基於特徵匹配的英文印刷字符識彆 103

9.1 案例背景 103

9.2 理論基礎 104

9.2.1 圖像預處理 104

9.2.2 圖像識彆技術 105

9.3 程序實現 106

9.4 延伸閱讀 112

9.5 參考文獻 112

第 10 章 基於不變矩的數字驗證碼識彆 113

10.1 案例背景 113

10.2 理論基礎 114

10.3 程序實現 114

10.3.1 設計 GUI 界麵· 114

10.3.2 載入驗證碼圖像 115

10.3.3 驗證碼圖像去噪 117

10.3.4 驗證碼數字定位 118

10.3.5 驗證碼歸一化 121

10.3.6 驗證碼數字識彆 122

10.3.7 手動確認並入庫 125

10.3.8 重新生成模闆庫 127

10.4 延伸閱讀 129

10.5 參考文獻 130

第 11 章 基於小波技術進行圖像融閤 131

11.1 案例背景 131

11.2 理論基礎 132

11.3 程序實現 134

11.3.1 GUI 設計 134

11.3.2 圖像載入 135

11.3.3 小波融閤 136

11.4 延伸閱讀 139

11.5 參考文獻 139

第 12 章 基於塊匹配的全景圖像拼接 140

12.1 案例背景 140

12.2 理論基礎 140

12.2.1 圖像匹配 141

12.2.2 圖像融閤 143

12.3 程序實現 144

12.3.1 設計 GUI 144

12.3.2 載入圖片 145

12.3.3 圖像匹配 147

12.3.4 圖像拼接 150

12.4 延伸閱讀 156

12.5 參考文獻 156

第 13 章 基於霍夫曼圖像壓縮重建 157

13.1 案例背景 157

13.2 理論基礎 157

13.2.1 霍夫曼編碼的步驟 158

13.2.2 霍夫曼編碼的特點 158

13.3 程序實現 160

13.3.1 設計 GUI 160

13.3.2 壓縮重構 161

13.3.3 效果對比 166

13.4 延伸閱讀 168

13.5 參考文獻 169

第 14 章 基於主成分分析的圖像壓縮和重建 170

14.1 案例背景 170

14.2 理論基礎 170

14.2.1 主成分降維分析原理 170

14.2.2 由得分矩陣重建樣本 171

14.2.3 主成分分析數據壓縮比 172

14.2.4 基於主成分分析的圖像壓縮 172

14.3 程序實現 173

14.3.1 主成分分析源代碼 173

14.3.2 圖像和樣本間轉換 174

14.3.3 基於主成分分析的圖像壓縮 175

14.4 延伸閱讀 178

14.5 參考文獻 179

第 15 章 基於小波的圖像壓縮技術 180

15.1 案例背景 180

15.2 理論基礎 181

15.3 程序實現 183

15.4 延伸閱讀 191

15.5 參考文獻 191

第 16 章 基於 Hu 不變矩的圖像檢索技術 192

16.1 案例背景 192

16.2 理論基礎 192

16.3 程序實現 194

16.3.1 圖像預處理 194

16.3.2 計算不變矩 194

16.3.3 圖像檢索 196

16.3.4 結果分析 198

16.4 延伸閱讀 201

16.5 參考文獻 202

第 17 章 基於 Harris 的角點特徵檢測 203

17.1 案例背景 203

17.2 理論基礎 204

17.2.1 Harris 基本原理 204

17.2.2 Harris 算法流程 206

17.2.3 Harris 角點性質 206

17.3 程序實現 208

17.3.1 Harris 算法代碼 208

17.3.2 角點檢測實例 209

17.4 延伸閱讀 210

17.5 參考文獻 211

第 18 章 基於 GUI 搭建通用視頻處理工具 212

18.1 案例背景 212

18.2 理論基礎 212

18.3 程序實現 214

18.3.1 GUI 設計 214

18.3.2 GUI 實現 215

18.4 延伸閱讀 226

18.5 參考文獻 226

第 19 章 基於語音識彆的信號燈圖像模擬控製技術 227

19.1 案例背景 227

19.2 理論基礎 227

19.3 程序實現 229

19.4 延伸閱讀 239

19.5 參考文獻 240

第 20 章 基於幀間差法進行視頻目標檢測 241

20.1 案例背景 241

20.2 理論基礎 241

20.2.1 幀間差分法 242

20.2.2 背景差分法 243

20.2.3 光流法 243

20.3 程序實現 244

20.4 延伸閱讀 253

20.5 參考文獻 253

第 21 章 路麵裂縫檢測識彆係統設計 254

21.1 案例背景 254

21.2 理論基礎 254

21.2.1 圖像灰度化 255

21.2.2 圖像濾波 257

21.2.3 圖像增強 259

21.2.4 圖像二值化 260

21.3 程序實現 262

21.4 延伸閱讀 274

21.5 參考文獻 274

第 22 章 基於 K-means 聚類算法的圖像區域分割 275

22.1 案例背景 275

22.2 理論基礎 275

22.2.1 K-means 聚類算法原理 275

22.2.2 K-means 聚類算法的要點 276

22.2.3 K-means 聚類算法的缺點 277

22.2.4 基於 K-means 圖像分割 278

22.3 程序實現 278

22.3.1 樣本之間的巨鹿 278

22.3.2 提取特徵嚮量 279

22.3.3 圖像聚類分割 280

22.4 延伸閱讀 282

22.5 參考文獻 283

第 23 章 基於光流場的交通汽車檢測跟蹤 284

23.1 案例背景 284

23.2 理論基礎 284

23.2.1 光流法檢測運動原理 284

23.2.2 光流的主要計算方法 285

23.2.3 梯度光流場約束方程 287

23.2.4 Horn-Schunck 光流算法 288

23.3 程序實現 290

23.3.1 計算視覺係統工具箱簡介 290

23.3.2 基於光流場檢測汽車運動 291

23.3.3 搭建 Simulink 運動檢測模型 295

23.4 延伸閱讀 297

23.5 參考文獻 298

第 24 章 基於 Simulink 進行圖像和視頻處理 299

24.1 案例背景 299

24.2 模塊介紹 299

24.2.1 分析和增強模塊庫(Analysis & Enhancement)· 300

24.2.2 轉化模塊庫(Conversions) 301

24.2.3 濾波 3 模塊庫(Filtering) 301

24.2.4 幾何變換模塊庫(Geometric Transformations) 302

24.2.5 形態學操作模塊庫(Morphological Operations) 302

24.2.6 輸入模塊庫(Sources) 303

24.2.7 輸齣模塊庫(Sinks)· 303

24.2.8 統計模塊庫(Statistics) 304

24.2.9 文本和圖形模塊庫(Text & Graphic)· 304

24.2.10 變換模塊庫(Transforms) 305

24.2.11 其他工具模塊庫(Utilities) 305

24.3 仿真案例 306

24.3.1 搭建組織模型 306

24.3.2 仿真執行模型 308

24.3.3 代碼自動生成 309

24.4 延伸閱讀 314

24.5 參考文獻 316

第 25 章 基於小波變換的數字水印技術 317

25.1 案例背景 317

25.2 理論基礎 317

25.2.1 數字水印技術原理 318

25.2.2 典型的數字水印算法 320

25.2.3 數字水印攻擊和評價 322

25.2.4 基於小波的水印技術 323

25.3 程序實現 326

25.3.1 準備載體和水印圖像 326

25.3.2 小波數字水印的嵌入 327

25.3.3 小波數字水印的提取 331

25.3.4 小波水印的攻擊試驗 333

25.4 延伸閱讀 337

25.5 參考文獻 337

第 26 章 基於最小誤差法的胸片分割 339

26.1 案例背景 339

26.2 理論基礎 339

26.2.1 圖像增強 340

26.2.2 區域選擇 340

26.2.3 形態學濾波 341

26.2.4 最小誤差法胸片分割 342

26.3 程序實現 343

26.3.1 設計 GUI 界麵· 343

26.3.2 圖像預處理 344

26.3.3 最小誤差法分割 348

26.3.4 形態學後處理 350

26.4 延伸閱讀 353

26.5 參考文獻 353

第 27 章 基於區域生長的肝髒影像分割係統 354

27.1 案例背景 354

27.2 理論基礎 355

27.2.1 閾值分割 355

27.2.2 區域生長 355

27.2.3 基於閾值預分割的區域生長 356

27.3 程序實現 357

27.4 延伸閱讀 361

27.5 參考文獻 361

第 28 章 基於深度學習的汽車目標檢測 362

28.1 案例背景 362

28.2 理論基礎 363

28.2.1 基本架構 363

28.2.2 捲積層 363

28.2.3 池化層 365

28.3 程序實現 365

28.3.1 加載數據 365

28.3.2 構建 CNN 網絡 367

28.3.3 訓練 CNN 網絡 368

28.3.4 評估訓練效果 370

28.4 延伸閱讀 372

28.5 參考文獻 372

第 29 章 基於計算機視覺的自動駕駛應用 374

29.1 案例背景 374

29.2 理論基礎 375

29.2.1 環境感知 375

29.2.2 行為決策 375

29.2.3 路徑規劃 376

29.2.4 運動控製 376

29.3 程序實現 376

29.3.1 傳感器數據載入 376

29.3.2 追蹤器創建 378

29.3.3 碰撞預警 380

29.4 延伸閱讀 385

29.5 參考文獻 385

第 30 章 基於深度學習的視覺場景識彆 386

30.1 案例背景 386

30.2 理論基礎 387

30.2.1 發展曆程 387

30.2.2 算法思想 387

30.3 程序實現 388

30.3.1 環境配置 388

30.3.2 數據集製作 389

30.3.3 網絡訓練 391

30.3.4 網絡測試 397

30.4 延伸閱讀 400

30.5 參考文獻 400

前言/序言

推薦序

在當今的信息化社會,圖像是人類賴以獲取信息的最重要來源之一。隨著計算機技術的迅猛發展,圖像技術與計算機技術不斷融閤,産生瞭一係列圖像處理軟件如 MATLAB 等,這些軟件的廣泛應用為圖像技術的發展提供瞭強大的支持。

MATLAB 已成為國際公認的最優秀的科技應用軟件之一,具有編程簡單、數據可視化功能強、可操作性強等特點,而且配有功能強大、專業函數豐富的圖像處理工具箱,是進行圖像處理必備的軟件工具。

現有的 MATLAB 圖像處理著作多是講解圖像處理中的經典理論與算法,鮮有解決實際問題的案例。而在《MATLAB 計算機視覺與深度學習實戰》中,作者將自己在多年的實踐中積纍的案例與讀者分享,其中關於圖像去霧、圖像去噪、圖像識彆等方麵的相關內容都緊跟圖像研究熱點,對於剛開始接觸相關領域的研究者來說,是很好的入門教程。

《MATLAB 計算機視覺與深度學習實戰》的一大特點是,它對於每個案例都有詳細的理論基礎介紹,並配備瞭實例代碼和注釋,不僅可以讓初學者很快學習到代碼編寫方麵的知識,還可以讓讀者在動手實踐的過程中深入理解所研究的相關問題。

《MATLAB 計算機視覺與深度學習實戰》將代碼講解融入實際的案例中,相比其他基礎書籍更加生動形象,解決瞭讀者在實踐過程中遇到的具體、實際的技術難點,為讀者提供瞭直接的技術支持。

《MATLAB 計算機視覺與深度學習實戰》案例貼近實際研究,兼顧中高級讀者。相信讀者在仔細研讀和實踐的過程中,能更深刻地體會到 MATLAB 在圖像處理方麵帶來的極大便利。這是一本值得相關領域研究人員與高校學生認真品讀的好書,非常值得推薦。

劉日升

大連理工大學國傢示範性軟件學院副教授

香港理工大學計算科學係香江學者

2017 年 5 月 11 日

MATLAB 是 MathWorks 公司推齣的一款應用於科學計算和工程仿真的交互式編程軟件,近幾年已經發展成為集數值分析、數學建模、圖像處理、控製係統、信號處理、經濟金融、計算生物學、動態仿真等於一體的科學工程軟件。數字圖像處理技術涉及計算機科學、模式識彆、人工智能、生物工程等學科,是一門綜閤性的技術。

自從電子計算機誕生以來,通過計算機仿真來模擬人類視覺便成為一項非常熱門且頗具挑戰性的研究課題,隨著數碼相機、智能手機等硬件設備的普及,圖像以其易於采集、信息相關性多、抗乾擾能力強的特點得到瞭越來越廣泛的應用。信息化和數字化時代已經來臨,隨著國傢對人工智能領域的不斷投入,圖像處理的需求量也會越來越大,應用也將越來越廣泛。

MATLAB 圖像處理工具箱可為用戶提供諸如圖像變換、圖像增強、圖像特徵檢測、圖像復原、圖像分割、圖像去噪、圖像配準、視頻處理等功能研發的技術支撐。同時,藉助於MATLAB 方便的編程及調試技巧,用戶可以根據需要進一步拓展圖像處理工具箱,實現定製的圖像處理需求。

本書目的

本書以案例的形式展現,力求為讀者提供最便捷、直接的技術支持,解決讀者在研發過程中遇到的最具體、實際的技術難點,爭取與廣大讀者分享研發過程中所涉及的功能模塊及某些成熟的係統框架,為讀者進行科學實驗、項目開發提供一定的技術支持。

通過對書中案例的閱讀、理解、運行和仿真,讀者可以有針對性地進行算法調試,這樣可以更加深刻地理解圖像與視頻處理的含義,並且更加熟練地掌握 MATLAB 圖像處理工具箱的用法。

本書特點

作者陣容強大,經驗相當豐富

在實際的科研工作中,本書作者劉衍琦(論壇 ID:lyqmath)是 MATLAB 技術論壇圖版主,通過運用 MATLAB 進行圖像處理、視頻分析等項目實踐,積纍瞭較為豐富的項目實戰經驗;本書作者詹福宇(論壇 ID:dynamic)長期與國內外會員進行技術交流,積極解答會員疑問並進行經驗總結,積纍瞭豐富的 MATLAB/Simulink 圖像處理經驗;本書作者蔣獻文多年從事醫學影像處理工作,多次參加影像處理相關研討會;本書作者周華英從事新能源汽車的教學和科研工作,曾率隊獲得全國新能源汽車大賽二等奬,具備豐富的教學實踐經驗。

案例豐富、實用、拓展性強

本書以案例的形式進行編寫,充分強調“案例的實用性、程序的可拓展性”,所選案例均來自於 MATLAB 技術論壇會員的切身需求,每個案例都與實際課題相結閤。另外,書中的每個案例都經過作者在 MATLAB 上進行程序調試,作者也為此編寫瞭大量的測試代碼。書中某些部分的內容描述是作者根據圖像處理實驗過程進行歸納總結的結果,多數案例的程序實現具有一定的原創性。

理論知識紮實,集眾傢之長

本書編寫過程中參考瞭大量的 MATLAB 幫助文檔、MATLAB 相關書籍及 MATLAB 技術論壇等方麵的資源,同時引用瞭部分參考文獻的最新圖像相關技術和理論。

點麵完美結閤,兼顧中高級用戶

本書點麵兼顧,涵蓋瞭數字圖像處理中幾乎所有的基本模塊,並涉及視頻處理、配準拼接、數字水印、生物識彆等高級圖像處理方麵的內容,全麵講解瞭基於 MATLAB 進行計算機視覺及深度學習應用的原理及方法。

配套資源豐富,交流資源絕佳

本書作者和編輯聯閤 MATLAB 技術論壇,為廣大讀者提供“在綫交流,有問必答”網絡互動答疑服務,您可以與作者一對一地探討相關知識點,以及下載書籍的輔助資料,讓您獲得最佳的閱讀體驗。您的建議將是我們創作精品的最大動力和源泉。

書碼驗證:http://www.matlabsky.com/plugin.php?id=vipbook:list

在綫交流:http://www.matlabsky.com/forum-53-1.html

程序源碼:http://www.matlabsky.com/thread-45343-1-1.html

答疑匯總:http://www.matlabsky.com/thread-45344-1-1.html

錯誤勘正????:http://www.matlabsky.com/thread-45346-1-1.html????

本書作者會盡量每周登錄網站 2~3 次,集中迴復讀者的疑難問題,但由於工作和時間等原因,作者可能無法及時迴答讀者的所有問題,敬請大傢諒解。隻要您願意交流和學習,MATLAB 技術論壇有足夠優秀的會員幫您解答。

內容架構

本書共有 30 個 MATLAB 圖像與視頻處理案例(含可運行程序),其內容架構如下所述。

第 1 章:講述基於直方圖優化的圖像去霧技術,通過直方圖增強技術的相關研究,引入對霧霾圖像進行優化的應用。

第 2 章:講述基於形態學的權重自適應圖像去噪,通過形態學的圖像去噪效果,引入加權形態學去噪的應用。

第 3 章:講述基於多尺度形態學提取眼前節組織,通過形態學的圖像邊緣提取效果,引入多尺度形態學的應用。

第 4 章:講述基於 Hough 變化的答題卡識彆,通過對答題卡自動閱捲的研究,引入圖像分割、目標定位等領域的應用。

第 5 章:講述基於閾值分割的車牌定位識彆,通過對車牌定位、分割、識彆的研究,引入圖像處理在車牌識彆領域的應用。

第 6 章:講述基於分水嶺分割進行肺癌診斷,通過分水嶺算法在肺部圖像分割的研究,引入分水嶺及醫學圖像處理的應用。

第 7 章:講述基於主成分分析的人臉二維碼識彆,通過對主成分分析、人臉識彆、QR二維碼的研究,引入 QR 人臉識彆的應用。

第 8 章:講述基於知識庫的手寫體數字識彆,通過對手寫數字特徵的提取,引入模式識彆在手寫數字方麵的應用。

第 9 章:講述基於特徵匹配的英文印刷字符識彆,通過對英文片段圖像的分割、識彆,引入在 MATLAB 中生成自定義標準字符庫、GUI 交互等領域的應用。

第 10 章:講述基於不變矩的數字驗證碼識彆,通過對驗證碼生成特點、分割定位、檢測識彆的研究,引入對某特定類型驗證碼從獲取到識彆的應用。

第 11 章:講述基於小波技術進行圖像融閤,通過對圖像融閤的研究,引入小波分解、圖像多分辨率處理的應用。

第 12 章:講述基於塊匹配的全景圖像拼接,通過對全景圖像生成方法的研究,引入塊匹配、加權融閤等的應用。

第 13 章:講述基於霍夫曼圖像壓縮重建,通過對霍夫曼編碼的研究,引入圖像壓縮重建的應用。

第 14 章:講述基於主成分分析的圖像壓縮和重建,通過對主成分分析的研究,引入不同壓縮參數下重建效果調優的應用。

第 15 章:講述基於小波的圖像壓縮技術,通過對小波圖像處理的研究,引入多分辨率圖像壓縮重建的應用。

第 16 章:講述基於 Hu 不變矩的圖像檢索技術,通過對圖像庫 Hu 矩特徵提取的研究,引入圖像檢索的應用。

第 17 章:講述基於 Harris 的角點特徵檢測,通過對 Harris 檢測算法的研究,引入圖像角點檢測的應用。

第 18 章:講述基於 GUI 搭建通用視頻處理工具,通過對 GUI、視頻圖像處理工具箱的使用,搭建 MATLAB 圖像視頻處理框架的應用。

第 19 章:講述基於語音識彆的信號燈圖像模擬控製技術,通過對語音特徵及建庫的研究,引入一個語音控製光信號的應用。

第 20 章:講述基於幀間差法進行視頻目標檢測,通過對視頻跟蹤的研究,引入在視頻中多目標跟蹤的應用。

第 21 章:講述路麵裂縫檢測識彆係統設計,通過對裂縫圖像特徵、識彆的研究,引入路麵裂縫檢測和提取的應用。

第 22 章:講述基於 K-means 聚類算法的圖像區域分割,通過對 K 均值聚類算法的研究,引入其在圖像分割方麵的應用。

第 23 章:講述基於光流場的汽車檢測跟蹤,通過對汽車視頻跟蹤的研究,引入光流場在跟蹤檢測方麵的應用。

第 24 章:講述基於 Simulink 進行圖像和視頻處理,通過對 Simulink 模塊的簡介,引入其在圖像視頻處理領域的應用。

第 25 章:講述基於小波變換的數字水印技術,通過對圖像水印的相關研究,引入圖像水印嵌入、提取等的應用。

第 26 章:講述基於最小誤差法的胸片分割技術,通過對肺部影像的分割算法對比,介紹最小誤差分割算法及其應用。

第 27 章:講述基於區域生長的肝影像分割技術,通過對區域生長的相關研究,介紹瞭如何自動定義種子點並將其應用到肝髒影像的分割方麵。

第 28 章:講述基於深度學習的汽車目標檢測應用,介紹深度學習的相關知識,基於MATLAB 的 CNN 工具箱實現汽車目標檢測的應用。

第 29 章:講述基於計算機視覺的自動駕駛應用,介紹自動駕駛的相關技術,從計算機視覺的角度分析相關應用。

第 30 章:講述基於深度學習的視覺場景識彆應用,對深度學習進行深入研究,基於經典的 matconvnet 工具箱講解如何進行圖像分類識彆應用。

關於 MATLAB 技術論壇

MATLAB 技術論壇(Simulink 仿真論壇,http://www.matlabsky.com)是國內兩大 MATLAB技術學習和交流平颱之一,緻力於為大傢提供專業、權威的 MathWorks 新聞資訊,豐富、免費的 MATLAB 教學資源,以及強大、全麵的 MATLAB 技術支持。

MATLAB 技術論壇由西北工業大學航空學院 dynamic 同學於 2008 年 09 月 14 日創建,並在 2010 年 8 月 1 日對論壇管理結構進行瞭擴充和重組,新加入 6 名 MATLAB 高級愛好者(yaksa、matsuper、yangzijiang、faruto、rocwoods、xiezhh)!目前 MATLAB 技術論壇有注冊會員 30 多萬,管理成員 30 多名,專業版塊 80 多個,高質量主題 20000+;舉辦過編程競賽、綫下研討會和數模競賽等多項活動;與多個齣版單位和科研機構有閤作關係!

特彆緻謝

本書由劉衍琦、詹福宇、蔣獻文、周華英編著,在本書的編寫過程中,得到瞭電子工業齣版社博文視點編輯張國霞的大力支持,在此對其錶示衷心的感謝。作者對本書所引用參考文獻、博客的作者錶示感謝,同時對各位 MATLAB 技術論壇的會員朋友給予的啓發和幫助錶示感謝。最後,感謝我的傢人的默默支持!感謝女兒劉沛萌每天給我帶來的歡樂,她鼓勵我在計算機視覺應用案例方麵進行積纍和整理,也祝天下的小朋友們都能健康快樂地成長!

由於時間倉促,加之作者水平和經驗有限,書中難免存在疏漏及錯誤之處,希望廣大讀者批評指正。

劉衍琦

2017 年 5 月



圖像的語言:感知、理解與創造 在這個信息爆炸的時代,圖像已成為我們認知世界、交流情感、傳遞知識的重要媒介。從日常的社交媒體分享,到醫學影像診斷,再到工業生産的智能檢測,再到自動駕駛汽車的“眼睛”,圖像無處不在,並且其重要性日益凸顯。然而,對我們而言輕易可見的畫麵,對機器而言卻是一串串冰冷的數據。如何讓機器“看懂”圖像,理解其中的內容,並能基於此進行更高級的推理和創造,是當前計算機科學領域最具挑戰性也最富前景的研究方嚮之一。 本書旨在為您揭示圖像背後的奧秘,帶您深入探索如何讓計算機具備“視覺”能力,並進一步理解和運用其中蘊含的信息。我們將從最基礎的圖像感知原理齣發,逐步深入到復雜的圖像理解與分析技術,最終觸及利用這些技術進行創造性應用的廣闊天地。 第一部分:圖像的基石——感知與錶示 首先,我們需要理解圖像本身是如何被計算機捕捉和存儲的。本書將從數字圖像的基本概念講起,講解像素、分辨率、顔色空間(如RGB、灰度、HSV等)是如何定義一幅圖像的。您將學習到,看似簡單的照片,在計算機眼中不過是由無數個點組成的矩陣,而這些點的排列組閤則構成瞭我們看到的一切。 隨後,我們將探討圖像的獲取技術。從傳統的相機成像原理,到更先進的傳感器技術,如CCD、CMOS,再到醫學影像設備(CT、MRI)、遙感衛星等,這些設備如何將現實世界的光學信息轉化為數字信號,是這一切的基礎。您將瞭解不同成像原理對圖像質量和信息豐富度的影響。 理解瞭圖像的數字錶示後,我們還需要學習如何有效地處理這些數據。圖像預處理是後續分析的關鍵一步。本書將介紹一係列經典的圖像增強技術,例如灰度化、直方圖均衡化,它們能有效地改善圖像的對比度和細節,讓潛在的信息更加突齣。我們還將講解圖像濾波技術,如高斯濾波、中值濾波,它們能夠去除圖像中的噪聲,使圖像更加平滑,為後續的特徵提取奠定基礎。您將體會到,看似簡單的“磨皮”和“降噪”,背後蘊含著精妙的數學原理和算法。 第二部分:圖像的探索——特徵提取與識彆 僅僅看到圖像的像素信息是不夠的,我們需要從中提取齣能夠代錶圖像內容的關鍵信息,這便是特徵提取。本書將帶領您走進特徵提取的世界,從經典的局部特徵描述符,如SIFT、SURF、ORB,到更現代的捲積神經網絡(CNN)自動學習到的特徵,您將理解它們是如何捕捉圖像中的邊緣、角點、紋理等有意義的信息的。 您將學習到,這些特徵描述符是如何在圖像的不同尺度、鏇轉角度下保持穩定性的,以及它們在圖像檢索、目標匹配等任務中的應用。例如,您可以通過比較兩幅圖像的SIFT特徵,判斷它們是否為同一場景,或者是否包含同一物體。 有瞭特徵,我們就可以進行圖像識彆和分類瞭。本書將介紹多種經典的機器學習算法,如支持嚮量機(SVM)、K近鄰(KNN)、決策樹等,如何利用提取到的特徵對圖像進行分類。您將理解,這些算法是如何通過學習大量的標記數據,建立起圖像類彆與特徵之間的映射關係,從而實現對未知圖像的自動分類。 第三部分:圖像的洞察——理解與分析 識彆齣圖像中的物體隻是第一步,更進一步的目標是理解圖像的整體含義,甚至進行更深層次的分析。本書將深入探討計算機視覺中的關鍵任務: 目標檢測: 如何在圖像中準確地定位齣特定物體的位置,並給齣其類彆。您將學習到基於滑動窗口、區域建議網絡(RPN)等主流的目標檢測算法,如RST-CNN、YOLO、SSD等,並理解它們在實時檢測和高精度檢測方麵的權衡。想象一下,自動駕駛汽車如何通過目標檢測來識彆行人、車輛和交通標誌,這項技術的重要性不言而喻。 圖像分割: 將圖像劃分為多個具有語義意義的區域。我們將介紹像素級彆的分割方法,如閾值分割、區域生長,以及更強大的深度學習分割模型,如全捲積網絡(FCN)、U-Net、Mask R-CNN等。您將理解,圖像分割在醫學影像分析(如腫瘤區域分割)、自動駕駛(如道路和車道綫分割)等領域有著不可替代的作用。 姿態估計: 理解圖像中物體(特彆是人體)的關鍵點位置和姿態。這對於人機交互、運動分析、虛擬現實等領域至關重要。您將瞭解基於深度學習的姿態估計算法,如何從一張靜態圖像中推斷齣三維空間的姿態信息。 場景理解: 超越單個物體的識彆,理解整個圖像的場景內容,例如“在公園裏,人們在野餐”。本書將介紹一些更高級的場景理解技術,包括圖像描述生成,以及基於知識圖譜的場景推理。 第四部分:圖像的未來——深度學習與創造 近年來,深度學習的飛速發展極大地推動瞭計算機視覺領域的進步。本書將花費大量篇幅,係統地介紹深度學習在計算機視覺中的核心應用。 捲積神經網絡(CNN): 您將深入理解CNN的架構,如捲積層、池化層、全連接層,以及它們是如何通過層次化的特徵提取來模擬人腦視覺皮層的處理機製。我們將詳細講解AlexNet、VGG、ResNet、Inception等經典CNN架構的設計思想和優劣。 數據增強與遷移學習: 在深度學習中,數據是關鍵。您將學習如何利用數據增強技術來擴充訓練數據集,提高模型的泛化能力。同時,遷移學習的概念將讓您明白,如何利用預訓練的模型來加速新任務的學習,即使在數據量有限的情況下也能取得優異的性能。 生成模型(GANs): 深度學習不僅能“看”,還能“創”。生成對抗網絡(GANs)的齣現,使得計算機能夠生成逼真的圖像,例如人臉、藝術作品等。您將瞭解GANs的工作原理,以及它在圖像風格遷移、超分辨率重建、數據閤成等方麵的應用。 Transformer在視覺領域的應用: 近期,Transformer模型在自然語言處理領域的成功也被引入到計算機視覺領域,並取得瞭令人矚目的成就。本書將介紹Vision Transformer (ViT) 等模型,展示其在大規模圖像識彆、目標檢測等任務上的潛力。 第五部分:實踐與應用 理論學習離不開實踐。本書將貫穿大量的實際案例和代碼示例,讓您親手操作,將所學知識轉化為解決實際問題的能力。我們將引導您使用流行的深度學習框架,如TensorFlow、PyTorch,來構建、訓練和部署各種計算機視覺模型。 您將有機會參與到諸如: 開發一個能夠識彆貓狗的圖像分類器。 實現一個可以檢測圖像中人臉的人臉檢測係統。 運用GANs生成具有特定風格的藝術畫作。 構建一個智能安防係統,用於異常事件的檢測。 探索自動駕駛中的視覺感知模塊。 通過這些實踐項目,您將深刻體會到計算機視覺和深度學習的強大力量,並能將其應用到自己的研究和工作中。 本書適閤誰? 對計算機視覺和深度學習充滿好奇,希望係統學習相關知識的學生和研究人員。 希望將圖像處理和分析技術應用於自身業務的工程師和開發人員。 渴望理解人工智能如何“看”並利用圖像信息,從而探索更廣闊應用前景的科技愛好者。 無論您是初學者還是有一定基礎的學習者,本書都將為您提供一條清晰的學習路徑,幫助您在圖像的語言中遊刃有餘,解鎖前沿技術,引領智能時代的未來。讓我們一同踏上這場激動人心的圖像探索之旅吧!

用戶評價

評分

我一直以來都對計算機視覺領域充滿好奇,特彆是近年來深度學習在這一領域的飛速發展,更是讓我躍躍欲試。然而,很多現有的資料要麼側重於理論講解,對我這種更偏嚮實踐操作的人來說顯得有些枯燥;要麼就是純粹的代碼堆砌,缺乏係統性的理論支撐。《MATLAB計算機視覺與深度學習實戰》這本書則恰好填補瞭這一空白。它以MATLAB為載體,將計算機視覺中的核心算法和深度學習模型進行瞭生動且富有條理的闡述。我尤其欣賞書中對每一個算法或模型的講解方式,總是先從直觀的原理入手,配以清晰的圖示,然後迅速過渡到MATLAB代碼實現,並通過實際案例來驗證其效果。例如,在講解物體檢測的 Faster R-CNN 模型時,書中不僅詳細解釋瞭模型的工作流程,還提供瞭可以直接運行的MATLAB代碼,並對代碼的每一部分進行瞭解釋,讓我能夠清晰地理解模型的每一個組件是如何協同工作的。這種由淺入深、循序漸進的學習路徑,讓我感到非常舒適,也大大提升瞭我學習的動力和效率。

評分

坦白說,我之前也接觸過幾本關於深度學習的書籍,但總覺得它們要麼過於學術化,要麼缺乏實際操作指導,導緻學瞭之後感覺“紙上談兵”,難以應用。直到我遇到瞭《MATLAB計算機視覺與深度學習實戰》,我纔真正體會到“實戰”二字的含義。這本書的核心優勢在於它將深度學習的理論知識與MATLAB強大的計算和可視化能力緊密結閤。作者在書中巧妙地利用MATLAB豐富的工具箱,將許多復雜的算法實現變得直觀易懂。例如,在介紹特徵提取和匹配時,書中詳細演示瞭如何使用MATLAB的函數來完成 SIFT、SURF 等經典算法,並輔以直觀的圖示,讓我能夠清晰地看到特徵點的提取過程和匹配結果。更讓我印象深刻的是,書中對於遷移學習、數據增強等實用技巧的講解,這些都是在實際項目中提升模型性能的關鍵。作者通過具體的代碼示例,一步步引導讀者如何將預訓練的模型應用到新的任務中,或者如何通過生成更多樣的訓練數據來提高模型的泛化能力。這本書真正做到瞭理論與實踐並重,讓我覺得學習過程充滿瞭樂趣和成就感。

評分

這本書《MATLAB計算機視覺與深度學習實戰》給我帶來的最大驚喜,在於它所提供的那種“全鏈路”的學習體驗。我之前學習深度學習,往往是零散地接觸一些模型,或者閱讀一些零散的博客文章,總感覺缺乏一個完整的框架。這本書則不同,它從基礎概念開始,逐步引導你構建和理解一個完整的計算機視覺應用。書中對數據的處理、模型的搭建、訓練的調優,以及最終的部署和應用,都進行瞭非常詳盡的介紹。特彆是在模型評估和性能優化方麵,作者不僅給齣瞭常用的指標,還講解瞭如何通過不同的策略來提升模型的準確率和魯棒性。我印象最深刻的是書中關於數據集構建和標注的章節,這在實際項目中是至關重要但又常常被忽略的一環。作者通過MATLAB的工具,詳細演示瞭如何高效地進行數據標注,並將其應用於模型訓練。這種從數據準備到模型部署的完整流程,讓我對整個計算機視覺和深度學習項目的生命周期有瞭更清晰的認識,也讓我更加自信地去麵對未來的項目挑戰。

評分

這本《MATLAB計算機視覺與深度學習實戰》的齣現,無疑是給在計算機視覺和深度學習領域摸索的同學們打瞭一劑強心針。我作為一名在圖像處理領域摸爬滾打瞭幾年,但對深度學習一直有些隔閡的工程師,拿到這本書的時候,內心是既期待又忐忑的。期待的是它能填補我知識上的空白,讓我跟上行業發展的步伐;忐忑的是,雖然書名裏有“實戰”二字,但我總擔心會遇到枯燥的理論堆砌,或者代碼晦澀難懂,最終不瞭瞭之。然而,當我真正翻開這本書,一行行代碼,一個個圖例,一點點地滲透進我的腦海時,這種顧慮便煙消雲散瞭。作者的敘述方式非常接地氣,仿佛一位經驗豐富的導師,一步步地引導你從基礎概念齣發,逐步深入到更復雜的算法和模型。書中的案例選取也極具代錶性,涵蓋瞭目標檢測、圖像分割、人臉識彆等多個熱門應用場景,讓我在學習理論的同時,能夠快速地將其與實際問題聯係起來,感受到知識落地的力量。更重要的是,書中提供的MATLAB代碼不僅結構清晰,而且注釋詳盡,即便是我這樣對MATLAB不太熟悉的讀者,也能很快理解其邏輯,並在此基礎上進行修改和拓展,這種“拿來即用”的學習體驗,極大地提升瞭我的學習效率和信心。

評分

在人工智能浪潮洶湧而來的今天,如何快速掌握核心技術,並將其轉化為實際生産力,是每一位技術從業者都在思考的問題。這本書《MATLAB計算機視覺與深度學習實戰》就像是一座精心設計的橋梁,連接瞭理論的殿堂與實踐的沃土。它並非簡單羅列算法的公式和原理,而是將復雜的概念巧妙地融入到一個個具體而生動的應用場景中。比如,在講解捲積神經網絡(CNN)的部分,作者並沒有停留在抽象的層級,而是通過一個實際的圖像分類項目,讓我們親手構建、訓練和評估一個CNN模型。從數據的預處理,到網絡結構的搭建,再到參數的調優,每一步都清晰明瞭,附帶的MATLAB代碼更是可以直接運行,便於我們理解每個環節的作用。我特彆喜歡書中對模型解釋性的探討,很多深度學習模型被認為是“黑箱”,但這本書提供瞭一些工具和方法,幫助我們去理解模型為什麼會做齣這樣的決策,這對於調試和優化模型至關重要。讀完這本書,我感覺自己不再是那個對深度學習模型望而卻步的旁觀者,而是能夠自信地參與到相關的項目開發中,解決實際問題,這是我最看重的一點。

評分

書很好,並且獲得瞭源碼,一起學習一起進步!

評分

還沒開工看,應該不錯

評分

很不錯的書,學習到瞭很多知識。

評分

東西還不錯,應該會有用!

評分

剛開始學習計算機視覺,應該對自己有幫助

評分

好書,推薦!!!!

評分

此書對學習基於MATLAB的深度學習的同學幫助很大,通俗易懂。

評分

很快,服務很好,書很好意義值得一看。正好趕上打摺!

評分

非常實用的一本書 拿來練習很不錯

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有