PaddlePaddle深度學習實戰
基本信息
作者: 劉祥龍 楊晴虹 譚中意 蔣曉琳
叢書名: 智能係統與技術叢書
齣版社:機械工業齣版社
ISBN:9787111600466
定價 69元
齣版日期:2018 年6月
開本:16開
版次:1-1
所屬分類:計算機
目錄
序
前言
緻謝
第1章 數學基礎與Python庫 1
1.1 Python是進行人工智能編程的
主要語言 1
1.2 數學基礎 4
1.2.1 綫性代數基礎 4
1.2.2 微積分基礎 8
1.3 Python庫的操作 17
1.3.1 numpy操作 17
1.3.2 matplotlib操作 23
本章小結 27
第2章 深度學習概論與PaddlePaddle入門 28
2.1 人工智能、機器學習與深度學習 29
2.1.1 人工智能 30
2.1.2 機器學習 30
2.1.3 深度學習 31
2.2 深度學習的發展曆程 32
2.2.1 神經網絡的第一次高潮 32
2.2.2 神經網絡的第一次寒鼕 33
2.2.3 神經網絡的第二次高潮 34
2.2.4 神經網絡的第二次寒鼕 35
2.2.5 深度學習的來臨 35
2.2.6 深度學習崛起的時代背景 36
2.3 深度學習的應用場景 36
2.3.1 圖像與視覺 37
2.3.2 語音識彆 37
2.3.3 自然語言處理 38
2.3.4 個性化推薦 38
2.4 常見的深度學習網絡結構 39
2.4.1 全連接網絡結構 39
2.4.2 捲積神經網絡 40
2.4.3 循環神經網絡 41
2.5 機器學習迴顧 41
2.5.1 綫性迴歸的基本概念 42
2.5.2 數據處理 44
2.5.3 模型概覽 45
2.5.4 效果展示 46
2.6 深度學習框架簡介 47
2.6.1 深度學習框架的作用 47
2.6.2 常見的深度學習框架 48
2.6.3 PaddlePaddle簡介 49
2.6.4 PaddlePaddle使用 49
2.7 PaddlePaddle實現 51
本章小結 60
第3章 深度學習的單層網絡 61
3.1 Logistic迴歸模型 62
3.1.1 Logistic迴歸概述 62
3.1.2 損失函數 64
3.1.3 Logistic迴歸的梯度下降 66
3.2 實現Logistic迴歸模型 71
3.2.1 Python版本 72
3.2.2 PaddlePaddle版本 81
本章小結 90
第4章 淺層神經網絡 92
4.1 神經網絡 92
4.1.1 神經網絡的定義及其結構 92
4.1.2 神經網絡的計算 94
4.2 BP算法 100
4.2.1 邏輯迴歸與BP算法 101
4.2.2 單樣本雙層神經網絡的BP算法 101
4.2.3 多個樣本神經網絡BP算法 105
4.3 BP算法實踐 108
4.3.1 Python版本 109
4.3.2 PaddlePaddle版本 116
本章小結 122
第5章 深層神經網絡 123
5.1 深層網絡介紹 123
5.1.1 深度影響算法能力 124
5.1.2 網絡演化過程與常用符號 125
5.2 傳播過程 127
5.2.1 神經網絡算法核心思想 127
5.2.2 深層網絡前嚮傳播過程 128
5.2.3 深層網絡後嚮傳播過程 129
5.2.4 傳播過程總結 130
5.3 網絡的參數 132
5.4 代碼實現 133
5.4.1 Python版本 133
5.4.2 PaddlePaddle版本 136
本章小結 140
第6章 捲積神經網絡 141
6.1 圖像分類問題描述 141
6.2 捲積神經網絡介紹 142
6.2.1 捲積層 142
6.2.2 ReLU激活函數 147
6.2.3 池化層 148
6.2.4 Softmax分類層 149
6.2.5 主要特點 151
6.2.6 經典神經網絡架構 152
6.3 PaddlePaddle實現 159
6.3.1 數據介紹 159
6.3.2 模型概覽 160
6.3.3 配置說明 160
6.3.4 應用模型 168
本章小結 169
第7章 個性化推薦 170
7.1 問題描述 170
7.2 傳統推薦方法 171
7.2.1 基於內容的推薦 172
7.2.2 協同過濾推薦 173
7.2.3 混閤推薦 175
7.3 深度學習推薦方法 176
7.3.1 YouTube的深度神經網絡推薦係統 176
7.3.2 融閤推薦係統 178
7.4 個性化推薦係統在PaddlePaddle上的實現 180
7.4.1 數據準備 180
7.4.2 模型配置 182
7.4.3 模型訓練 184
7.4.4 模型測試 188
本章小結 188
第8章 個性化推薦的分布式實現 190
8.1 PaddlePaddle Cloud介紹 190
8.2 PaddlePaddle Cloud使用 192
8.2.1 創建集群 192
8.2.2 配置集群 192
8.2.3 配置客戶端 193
8.3 個性化推薦在PaddlePaddle Cloud上的實現 194
8.3.1 提交單節點任務 194
8.3.2 個性化推薦在PaddlePaddle Cloud上的實現 196
本章小結 199
第9章 廣告CTR預估 200
9.1 CTR預估簡介 200
9.1.1 CTR定義 201
9.1.2 CTR與推薦算法的異同 202
9.1.3 CTR預估的評價指標 202
9.2 CTR預估的基本過程 205
9.2.1 CTR預估的三個階段 206
9.2.2 CTR預估中的特徵預處理 206
9.3 CTR預估的常見模型 208
9.3.1 LR模型 208
9.3.2 GBDT模型 210
9.3.3 GBDT+LR模型 212
9.3.4 FM+DNN模型 214
9.3.5 MLR模型 215
9.4 CTR預估在工業上的實現 217
9.5 CTR預估在PaddlePaddle上的實現 218
9.5.1 數據集 218
9.5.2 預測模型選擇和構建 219
9.5.3 PaddlePaddle完整實現 222
本章小結 226
第10章 算法優化 227
10.1 基礎知識 227
10.1.1 訓練、驗證和測試集 227
10.1.2 偏差和方差 228
10.2 評估 229
10.2.1 選定評估目標 229
10.2.2 迭代過程 230
10.2.3 欠擬閤和過擬閤 230
10.3 調優策略 231
10.3.1 降低偏差 231
10.3.2 降低方差 236
10.4 超參數調優 242
10.4.1 隨機搜索和網格搜索 242
10.4.2 超參數範圍 243
10.4.3 分階段搜索 243
10.4.4 例子:對學習率的調整 244
本章小結 245
↑摺 疊
前言
人工智能(AI)前景無量已經成為業界共識,國內外很多企業都聚集瞭各種資源大力發展人工智能。人工智能並不是一個新生的名詞,在數十年的發展曆程中,像“深度學習”這樣在學術界和工業界皆具顛覆性的技術可謂十年難遇。作為國內人工智能領域的領頭羊,百度在AI領域早已深耕多年,特彆是在深度學習領域建樹頗豐。百度通過應用深度學習技術,使其在語音、視覺、文本、無人駕駛等各領域都處於領先位置。百度著力打造大AI生態,傾其全力推動中國AI産業大力發展。2016年,百度開源瞭其內部使用的深度學習框架PaddlePaddle。
深度學習算法十分強大,但深入理解和靈活運用深度學習算法並不是一件容易的事情,尤其是復雜的數學模型和計算過程讓不少同學剛入門就放棄瞭。現在市麵上有不少科普型的書,主要作用是從宏觀上描述深度學習的發展和用途,沒有對細節的描述,隻起到瞭提振讀者信心的作用。同時,也不乏學界大牛的全而難的“大部頭”著作,但是其中幫助初學者入門深度學習的內容並不多。本書針對此現狀立足於PaddlePaddle框架,從算法到應用由淺入深地帶領讀者一步一步進入AI技術世界。
本書從實戰的角度齣發,旨在幫助讀者掌握滿足工業需求的實際技能。在真實工業開發中框架是必不可少的,現在市麵上框架很多且各具特色,其中PaddlePaddle因為其具有上手容易、運行效率高、支持私有雲等優勢,受到越來越多的公司和個人的青睞。雖然開發者對PaddlePaddle錶現齣瞭濃厚的興趣,可惜的是市麵上還沒有一本關於PaddlePaddle的書。為瞭讓更多的開發者享受到深度學習帶來的福利,於是由百度發起,特邀北航參與,兩傢精誠閤作聯袂打造瞭本書。
本書采用由簡入繁的原則撰寫而成。我們希望本書能成為一名能帶領讀者領略PaddlePaddle精妙的精神導遊。從較為簡單的綫性迴歸、邏輯迴歸到較為復雜的RNN數字識彆、個性化推薦、雲上部署等,本書結閤若乾實例,係統地介紹瞭PaddlePaddle的使用特點。教會讀者如何使用框架就像教會瞭讀者一套外功拳法。然而本書不僅關注框架本身的細節用法,還非常注重基礎知識和理論,目的是教會讀者內功心法。書中既詳細描述瞭神經網絡的各個細節,也深入講解瞭算法性能優化的思路和技巧,旨在幫助讀者深入理解深度學習的精髓。
本書共分為10章,每一章都包含理論介紹和對應的代碼實現。除瞭第1章講述主要的數學基礎外,其餘各章都有PaddlePaddle的代碼實現。
第1章介紹數學基礎和Python庫的使用。
第2章迴顧神經網絡的發展曆程和機器學習的基本概念,使用綫性迴歸作為PaddlePaddle的入門示例。
第3章以邏輯迴歸為主綫介紹單個神經元的工作原理,分彆使用numpy庫和PaddlePaddle實現邏輯迴歸模型的貓臉分類。
第4章開始正式介紹神經網絡。以雙層的網絡為例深入講解BP算法的計算過程,分彆用numpy庫和PaddlePaddle實現“花”的點集分類問題。
第5章介紹深度神經網絡的相關知識,總結神經網絡的核心算法運算過程。然後使用深度網絡再次分彆使用numpy庫和PaddlePaddle實現貓臉分類。
第6章以圖像分類為切入點深入講解捲積神經網絡的相關細節,同時介紹幾種經典的網絡模型。接著介紹用PaddlePaddle實現基於MNIST數據集的手寫數字的識彆。
第7章介紹個性化推薦係統的算法,包括基於傳統機器學習的推薦方法和基於深度學習的推薦方法,其中重點介紹深度學習的融閤推薦係統。同時介紹使用PaddlePaddle在ml-1m 數據集上完成推薦係統的具體實現。
第8章以個性化推薦係統為例,詳細講解PaddlePaddle Cloud的使用方法,介紹在雲上如何創建、配置集群,如何提交單節點任務等,並實現基於PaddlePaddle Cloud搭建分布式深度學習推薦網絡模型。
第9章介紹PaddlePaddle的又一個應用場景,即廣告點擊通過率預估(CTR),重點介紹CTR的基本過程和常見模型,然後基於Kaggle數據集網站的Avazu數據集,使用PaddlePaddle實現訓練和預測的整個過程。
第10章係統介紹算法優化的思路和方法。從深度學習係統的實踐流程開始,介紹評估和調優策略等重要概念和思想,並結閤實例給齣調優的具體效果。
本書適閤的讀者主要包含:
對PaddlePaddle框架感興趣的開發者;
希望學習深度學習的在校大學生和在職的程序員;
從事深度學習教學工作的一綫教師;
希望深入理解深度學習的産品經理。
PaddlePaddle深度學習實戰
說實話,我之前嘗試過幾本號稱是“入門”的深度學習書籍,但讀完後感覺自己更像是一個公式的搬運工,對背後的原理依舊模糊不清。然而,這本讀物給我的感受完全不同,它仿佛是一位經驗豐富的工程師在手把手地教你如何“思考”問題。它沒有僅僅停留在介紹模型結構的錶麵,而是深入到瞭為什麼我們選擇捲積層(CNN)而非全連接層來處理圖像數據,為什麼循環神經網絡(RNN)在處理序列數據時會遇到梯度消失的問題,以及如何通過LSTM或GRU來緩解這些挑戰。這種追問“為什麼”的寫作風格,極大地激發瞭我的求知欲。更讓我驚喜的是,書中對優化器的介紹,不是簡單地羅列Adam、RMSProp這些名字,而是清晰地對比瞭它們在學習率調度和動量機製上的差異和適用場景。閱讀過程中,我感覺自己不僅僅是在學習一個框架的使用,更是在學習一套解決實際問題的完整思路。這種深度和廣度兼備的講解,讓這本書的價值遠超一般的基礎教程,它真正培養的是讀者的“模型直覺”。
評分這本書的閱讀體驗中,最讓我感到“舒適”的是它在處理復雜概念時的敘事節奏感。很多技術書籍讀起來像是一口氣喝下一大杯冰水,雖然內容豐富,但過程是痛苦的。而這本書的結構設計非常巧妙,它總能在關鍵的轉摺點設置小結或者“思維導圖”,幫助讀者消化剛剛學到的知識點,避免信息過載。例如,在講解瞭生成對抗網絡(GAN)的基本框架後,作者並沒有立刻跳到WGAN或DCGAN,而是用一頁篇幅總結瞭“判彆器”和“生成器”之間的博弈平衡點,用一種近乎散文的筆觸描繪瞭兩者之間的微妙關係。這種張弛有度的節奏,讓我的大腦有時間去內化和連接新的知識點,而不是疲於奔命地跟上作者的思路。這種體貼讀者的設計,使得即便是麵對GAN這樣相對高階的主題,閱讀起來也顯得從容不迫,信心倍增。它真正做到瞭讓學習成為一種享受。
評分這本書的封麵設計得非常有吸引力,色彩搭配沉穩又不失活力,一看就是一本內容紮實的教材。光是翻開前幾頁,就能感受到作者在知識組織上的用心。它並沒有直接拋齣那些晦澀難懂的術語,而是像一位耐心的老師,循序漸進地引導著讀者進入深度學習的世界。我尤其欣賞它對基礎概念的闡述,那種把復雜問題簡單化的能力,簡直是教科書級彆的示範。比如,講解神經網絡的前嚮傳播和反嚮傳播時,作者使用瞭非常生動的類比,讓我這個初學者也能一下子抓住核心思想,而不是陷在數學公式的泥潭裏無法自拔。而且,書中對數據預處理這一關鍵環節的講解也非常到位,它沒有僅僅停留在理論層麵,而是結閤瞭實際案例,告訴我們為什麼需要標準化、歸一化,以及在不同場景下應該如何選擇策略。這種注重實操和底層邏輯結閤的敘事方式,極大地增強瞭閱讀的體驗感。每次讀完一個小節,都會有一種“原來如此”的豁然開朗感,這對於構建一個穩固的知識體係至關重要。這本書的排版也極為清晰,圖文並茂,重點突齣,即便是需要反復查閱的公式或代碼片段,也顯得井井有條,讓人愛不釋手。
評分對於任何一本技術書籍而言,實戰環節的質量往往是區分優秀和一般的試金石。這本書在這方麵錶現得尤為齣色,它沒有采用那些脫離實際的玩具數據集,而是選取瞭一些貼近真實工業場景的案例。比如,在介紹自然語言處理(NLP)部分時,書中構建瞭一個完整的文本分類流程,從原始語料的清洗、分詞,到詞嵌入(Word Embedding)的選擇與訓練,每一步都配有詳盡的代碼示例和解釋。更值得稱道的是,作者並沒有止步於跑通代碼,而是詳細分析瞭不同超參數調整後對模型性能的影響,甚至探討瞭過擬閤發生時應如何通過正則化或Dropout進行乾預。這種細緻入微的“故障排除”和“性能調優”指南,對於希望將理論應用於生産環境的讀者來說,簡直是無價之寶。我甚至能從書中的案例中提煉齣一些通用的工程實踐經驗,這比單純看官方文檔要高效得多,因為它融入瞭作者的實戰智慧。
評分從工具使用的角度來看,這本書對所使用的深度學習框架的集成度和API調用講解得極其清晰到位,它似乎找到瞭一個完美的平衡點,既沒有讓讀者完全沉迷於框架的黑箱操作,也沒有讓他們過於糾結於底層的C++實現細節。它精準地捕捉到瞭一個“實戰者”最需要的知識點:如何高效地調用庫函數來構建和訓練模型。書中對模型保存與加載、GPU加速的配置、以及分布式訓練的基本概念都有明確的指導。特彆是關於如何利用框架提供的工具進行模型性能剖析的部分,它教會瞭我如何定位代碼中的性能瓶頸,而不是盲目地修改網絡結構。這不僅僅是一本關於理論的書,它更像是一份為期數月的“深度學習實戰訓練營”的課程大綱,每完成一章,都仿佛完成瞭一次小型的項目交付,讓人充滿瞭成就感和繼續探索的動力。這種將理論、實踐和工具使用無縫整閤的能力,是這本書最值得稱贊的特色之一。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有