| 商品基本信息,請以下列介紹為準 | |
| 商品名稱: | 深度學習 |
| 作者: | [美]Ian Goodfellow(伊恩·古德費洛)、[加]Yoshua Bengio(約書亞·本吉奧) 、[加]Aaron Courville(亞倫·庫維爾) |
| 市場價: | 168元 |
| ISBN號: | 9787115461476 |
| 齣版社: | 人民郵電齣版社 |
| 商品類型: | 圖書 |
| 其他參考信息(以實物為準) | ||
| 裝幀:平裝-膠訂 | 開本:16開 | 語種:中文 |
| 齣版時間:2018-08 | 版次:1 | 頁數:500 |
| 印刷時間:2017年08月01日 | 印次:1 | 字數:484.00韆字 |
| 編輯推薦 | |
AI聖經!深度學習領域奠基性的經典暢銷書!長期位居美國亞馬遜AI和機器學習類圖書榜首!所有數據科學傢和機器學習從業者的必讀圖書!特斯拉CEO埃隆·馬斯剋等國內外眾多專傢推薦! 深度學習是機器學習的一個分支,它能夠使計算機通過層次概念來學習經驗和理解世界。因為計算機能夠從經驗中獲取知識,所以不需要人類來形式化地定義計算機需要的所有知識。層次概念允許計算機通過構造簡單的概念來學習復雜的概念,而這些分層的圖結構將具有很深的層次。本書會介紹深度學習領域的許多主題。 本書囊括瞭數學及相關概念的背景知識,包括綫性代數、概率論、信息論、數值優化以及機器學習中的相關內容。同時,它還介紹瞭工業界中實踐者用到的深度學習技術,包括深度前饋網絡、正則化、優化算法、捲積網絡、序列建模和實踐方法等,並且調研瞭諸如自然語言處理、語音識彆、計算機視覺、在綫推薦係統、生物信息學以及視頻遊戲方麵的應用。*後,本書還提供瞭一些研究方嚮,涵蓋的理論主題包括綫性因子模型、自編碼器、錶示學習、結構化概率模型、濛特卡羅方法、配分函數、近似推斷以及深度生成模型。 《深度學習》這本書既可以被本科生或研究生用於規劃其學術界或工業界生涯,也適用於希望在各種産品或平颱上開始使用深度學習技術的軟件工程師。作者在本書的配套網站上為讀者和教師提供瞭補充資料。中文版讀者可以訪問人民郵電齣版社異步社區www.epubit.com.cn獲取相關信息。 封麵特色: 由藝術傢Daniel Ambrosi提供的中央公園杜鵑花步道夢幻景觀。在Ambrosi的億級像素全景圖上,應用Joseph Smarr(Google)和Chirs Lamb(NVIDIA)修改後的Google DeepDream開源程序,創造瞭Daniel Ambrosi的“幻景”。 |
| 目錄 | |
第 1 章 引言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 本書麵嚮的讀者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 1.2 深度學習的曆史趨勢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.1 神經網絡的眾多名稱和命運變遷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2.2 與日俱增的數據量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2.3 與日俱增的模型規模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 1.2.4 與日俱增的精度、復雜度和對現實世界的衝擊 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 第 1 部分 應用數學與機器學習基礎 第 2 章 綫性代數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.1 標量、嚮量、矩陣和張量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 矩陣和嚮量相乘. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21 2.3 單位矩陣和逆矩陣 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4 綫性相關和生成子空間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.5 範數. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24 2.6 特殊類型的矩陣和嚮量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.7 特徵分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.8 奇異值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.9 Moore-Penrose 僞逆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.10 跡運算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.12 實例:主成分分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 第 3 章 概率與信息論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34 3.1 為什麼要使用概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.2 隨機變量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.1 離散型變量和概率質量函數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3.2 連續型變量和概率密度函數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.4 邊緣概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.5 條件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.6 條件概率的鏈式法則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.7 獨立性和條件獨立性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.8 期望、方差和協方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9.4 指數分布和 Laplace 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.9.5 Dirac 分布和經驗分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.9.6 分布的混閤 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.10 常用函數的有用性質. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43 3.11 貝葉斯規則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.12 連續型變量的技術細節 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.13 信息論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.14 結構化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 第 4 章 數值計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.2 病態條件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3 基於梯度的優化方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 梯度之上:Jacobian 和 Hessian 矩陣 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.4 約束優化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.5 實例:綫性zui小二乘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 第 5 章 機器學習基礎. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63 5.1 學習算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.1 任務 T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.1.2 性能度量 P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.3 經驗 E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1.4 示例:綫性迴歸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.2 容量、過擬閤和欠擬閤 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.2.1 沒有免費午餐定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.2.2 正則化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.3 超參數和驗證集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76 5.3.1 交叉驗證 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 估計、偏差和方差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77 5.4.1 點估計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.4.2 偏差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.4.3 方差和標準差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.4.4 權衡偏差和方差以zui小化均方誤差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.4.5 一緻性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5 zui大似然估計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 5.5.1 條件對數似然和均方誤差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84 5.5.2 zui大似然的性質 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.6 貝葉斯統計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 5.6.1 zui大後驗 (MAP) 估計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.7 監督學習算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.1 概率監督學習 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.2 支持嚮量機 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.7.3 其他簡單的監督學習算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 5.8 無監督學習算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 5.8.1 主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.8.2 k-均值聚類 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 5.9 隨機梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.10 構建機器學習算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11 促使深度學習發展的挑戰 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.11.1 維數災難 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.2 局部不變性和平滑正則化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.11.3 流形學習 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 第 2 部分 深度網絡:現代實踐 第 6 章 深度前饋網絡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.1 實例:學習 XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.2 基於梯度的學習 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6.2.1 代價函數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.2.2 輸齣單元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 6.3 隱藏單元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .119 6.3.1 整流綫性單元及其擴展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 6.3.2 logistic sigmoid 與雙麯正切函數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.3.3 其他隱藏單元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.4 架構設計. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.1 萬能近似性質和深度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 6.4.2 其他架構上的考慮 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5 反嚮傳播和其他的微分算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 6.5.1 計算圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6.5.2 微積分中的鏈式法則. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128 6.5.3 遞歸地使用鏈式法則來實現反嚮傳播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 6.5.4 全連接 MLP 中的反嚮傳播計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.5.5 符號到符號的導數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131 6.5.6 一般化的反嚮傳播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 6.5.7 實例:用於 MLP 訓練的反嚮傳播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135 6.5.8 復雜化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.9 深度學習界以外的微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5.10 高階微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.6 曆史小記. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139 ......... |
| 作者簡介 | |
Ian Goodfellow,榖歌公司(Google) 的研究科學傢,2014 年濛特利爾大學機器學習博士。他的研究興趣涵蓋大多數深度學習主題,特彆是生成模型以及機器學習的安全和隱私。Ian Goodfellow 在研究對抗樣本方麵是一位有影響力的早期研究者,他發明瞭生成式對抗網絡,在深度學習領域貢獻卓越。 Yoshua Bengio,濛特利爾大學計算機科學與運籌學係(DIRO) 的教授,濛特利爾學習算法研究所(MILA) 的負責人,CIFAR 項目的共同負責人,加拿大統計學習算法研究主席。Yoshua Bengio 的主要研究目標是瞭解産生智力的學習原則。他還教授“機器學習”研究生課程(IFT6266),並培養瞭一大批研究生和博士後。 Aaron Courville,濛特利爾大學計算機科學與運籌學係的助理教授,也是LISA 實驗室的成員。目前他的研究興趣集中在發展深度學習模型和方法,特彆是開發概率模型和新穎的推斷方法。Aaron Courville 主要專注於計算機視覺應用,在其他領域,如自然語言處理、音頻信號處理、語音理解和其他AI 相關任務方麵也有所研究。 中文版審校者簡介 張誌華,北京大學數學科學學院統計學教授,北京大學大數據研究中心和北京大數據研究院數據科學教授,主要從事機器學習和應用統計學的教學與研究工作。 譯者簡介 趙申劍,上海交通大學計算機係碩士研究生,研究方嚮為數值優化和自然語言處理。 黎彧君,上海交通大學計算機係博士研究生,研究方嚮為數值優化和強化學習。 符天凡,上海交通大學計算機係碩士研究生,研究方嚮為貝葉斯推斷。 李凱,上海交通大學計算機係博士研究生,研究方嚮為博弈論和強化學習。 |
| 內容簡介 | |
《深度學習》由全球知名的三位專傢Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰寫,是深度學習領域奠基性的經典教材。全書的內容包括3個部分:第1部分介紹基本的數學工具和機器學習的概念,它們是深度學習的預備知識;第2部分係統深入地講解現今已成熟的深度學習方法和技術;第3部分討論某些具有前瞻性的方嚮和想法,它們被公認為是深度學習未來的研究重點。 《深度學習》適閤各類讀者閱讀,包括相關專業的大學生或研究生,以及不具有機器學習或統計背景、但是想要快速補充深度學習知識,以便在實際産品或平颱中應用的軟件工程師。 |
第二篇: 閱讀體驗上,我必須強調這本書在敘事節奏上的高超把握。它不像有些技術書籍那樣,上來就拋齣大量的數學公式,讓人望而卻步。相反,它像一位經驗豐富的匠人,先為你展示瞭工具的宏偉藍圖,然後纔慢慢拆解每一塊磚石的結構。開篇對曆史脈絡的梳理,不僅僅是簡單的年代羅列,而是將關鍵人物的思考過程、遇到的瓶頸,以及靈光乍現的瞬間,描繪得栩栩如生,極大地激發瞭我對這個領域的敬畏之心。尤其是講述到早期的捲積網絡設計思想時,那種“山重水復疑無路,柳暗花明又一村”的感覺,被作者描摹得淋灕盡緻。它成功地將一個冰冷的計算過程,賦予瞭富有生命力的“迭代”和“演化”的色彩。更重要的是,全書的語言風格極為凝練,幾乎沒有一句廢話,每一個句子都承載著清晰的知識點,迫使讀者必須全神貫注地去吸收。讀完一章,我需要閤上書本,在腦海中進行一次小型的“知識重組”,纔能真正將所學內化,這種主動學習的過程,遠比被動灌輸有效得多。這本書真的能讓你感受到,這不是一本工具手冊,而是一部關於如何“思考”復雜問題的思想史詩。
評分第五篇: 這本書最大的價值在於其“前瞻性”和“批判性思維”的培養。它並非隻是對現有技術的簡單綜述,而是對未來發展趨勢有著深刻的洞察力。在討論到某些主流框架的局限性時,作者毫不避諱地指齣瞭它們在可解釋性和魯棒性方麵存在的結構性缺陷,並且引用瞭最新的研究成果作為佐證。這引導我開始跳齣框架的限製,去思考“下一代”模型應該具備哪些特徵。書中對於“黑箱”問題的討論,遠比其他書籍來得深刻和有力,它不僅描述瞭問題,還探討瞭從信息論和因果推斷角度去構建可信賴AI的可能性路徑。這種超越“如何實現”的“應該如何思考未來”的深度,是這本書真正區彆於市麵上大量教程的關鍵。閱讀完後,我感覺自己的視野被極大地拓寬瞭,不再滿足於調包俠的身份,而是開始思考更深層次的理論構建和工程倫理問題。這是一本真正能推動讀者從“學習者”嚮“研究者”過渡的橋梁性著作。
評分第一篇: 這本書的排版和印刷質量簡直讓人愛不釋手,拿在手裏沉甸甸的,感覺就像捧著一塊知識的寶石。封麵設計簡約而不失大氣,那種深邃的藍色調,恰到好處地烘托齣“深度”二字的神秘感與力量感。初翻閱時,那些清晰銳利的圖錶和精心挑選的示例代碼塊,立刻吸引住瞭我的目光。作者在案例的選擇上非常獨到,沒有堆砌那些已經被嚼爛的“爛大街”項目,而是深入到一些更貼近實際工程挑戰的場景中去探討原理,這一點非常贊賞。比如,書中對特定激活函數在處理梯度消失問題時的微小差異所做的詳盡對比分析,那種刨根問底的學術精神,遠超一般入門教材的水準。我花瞭整整一個下午的時間,僅僅是沉浸在那些精心繪製的計算圖示中,感受著信息流動的邏輯美感。它不是簡單地告訴你“怎麼做”,而是深入剖析“為什麼這麼做”,這種對底層邏輯的堅持,使得閱讀過程充滿瞭發現的樂趣。即使是對於一些較為復雜的數學推導,作者也處理得極其巧妙,既保證瞭嚴謹性,又避免瞭令人生畏的枯燥感,仿佛有一位耐心的導師在旁邊逐步引導,讓你在不知不覺中就跨越瞭理解的鴻溝。這絕對是一本值得收藏,並且值得反復研讀的佳作。
評分第三篇: 這本書在實戰案例的深度上,真正體現齣瞭超越同類的水準。我特彆關注瞭其中關於“模型部署與優化”那一章的論述。很多教材止步於訓練和驗證,但這本書卻著眼於如何在資源受限的實際環境中運行這些龐然大物。它沒有停留在理論層麵,而是直接給齣瞭針對不同硬件架構的量化策略和剪枝算法的實際應用指南。例如,書中對比瞭在移動端和邊緣計算設備上,不同稀疏化技術對延遲和能耗的實際影響麯綫,這種數據驅動的分析,是任何初學者在盲目追求模型精度時所忽略的寶貴經驗。我嘗試著依照書中的步驟,對一個小型圖像識彆模型進行瞭特定的後訓練量化操作,結果發現性能損失微乎其微,但推理速度卻獲得瞭顯著提升,這種即時反饋帶來的成就感是無可替代的。此外,書中還穿插瞭許多關於實驗設計原則的討論,教會我們如何科學地進行超參數搜索,而不是像無頭蒼蠅一樣進行隨機嘗試。它培養的不僅僅是編程能力,更是一種嚴謹的科學實驗態度。
評分第四篇: 這本書的數學基礎部分處理得非常巧妙,它沒有將讀者推入純粹的抽象代數世界,而是采用瞭“先應用,後迴溯”的教學策略。每當一個新的復雜算法引入時,作者會先用一個非常直觀的幾何或概率圖像來建立感性認識,然後再引入必要的矩陣運算來精確描述。例如,在講解注意力機製時,先通過一個信息篩選的比喻來鋪墊,讀者對“權重分配”有瞭直觀理解後,再去看那些復雜的內積和Softmax函數,瞬間就變得豁然開朗,完全沒有瞭以往麵對公式時的抵觸情緒。我尤其欣賞作者對“梯度”這一核心概念的反復強調和多角度闡釋,從鏈式法則到反嚮傳播的直觀意義,直至其在優化過程中的角色,層次分明,循序漸進。這種設計哲學,使得那些原本被視為技術壁壘的數學內容,變成瞭理解算法內在驅動力的鑰匙。它讓你明白,每一次數學符號的書寫,背後都對應著一個清晰的、可被幾何解釋的物理含義,極大地增強瞭對模型的掌控感。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有