9787111595137 9787111593737
機器學習算法
內容簡介本書采用理論與實踐相結閤的方式,在簡明扼要地闡明機器學習原理的基礎上,通過大量實例介紹瞭不同場景下機器學習算法在scikit-learn中的實現及應用。書中有大量的代碼示例及圖例,便於讀者理解和學習並實際上手操作。另一方麵,書中還有很多的延伸閱讀指導,方便讀者性地瞭解機器學習領域的現有技術及其發展狀況。
譯者序
前言
作者簡介
審校人員簡介
1章 機器學習簡介1
1.1 經典機器和自適應機器簡介1
1.2 機器學習的分類2
1.2.1 監督學習3
1.2.2 無監督學習5
1.2.3 強化學習7
1.3 越機器學習——深度學習和仿生自適應8
1.4 機器學習和大數據9
延伸閱讀10
本章小結10
2章 機器學習的重要元素11
2.1 數據格式11
2.2 可學習性13
2.2.1 欠擬閤和過擬閤15
2.2.2 誤差度量16
2.2.3 PAC學習18
目錄
前言
緻謝
第1章引言
1.1自然語言處理的挑戰
1.2神經網絡和深度學習
1.3自然語言處理中的深度學習
1.4本書的覆蓋麵和組織結構
1.5本書未覆蓋的內容
1.6術語
1.7數學符號
注釋
部分有監督分類與前饋神經網絡
第2章學習基礎與綫性模型
2.1有監督學習和參數化函數
2.2訓練集、測試集和驗證集
2.3綫性模型
2.3.1二分類
2.3.2對數綫性二分類
2.3.3多分類
2.4錶示
2.5獨熱和稠密嚮量錶示
2.6對數綫性多分類
2.7訓練和優化
2.7.1損失函數
2.7.2正則化
2.8基於梯度的優化
2.8.1隨機梯度下降
2.8.2實例
2.8.3其他訓練方法
第3章從綫性模型到多層感知器
3.1綫性模型的局限性:異或問題
3.2非綫性輸入轉換
3.3核方法
3.4可訓練的映射函數
第4章前饋神經網絡
4.1一個關於大腦的比喻
4.2數學錶示
4.3錶達能力
4.4常見的非綫性函數
4.5損失函數
4.6正則化與丟棄法
4.7相似和距離層
4.8嵌入層
第5章神經網絡訓練
5.1計算圖的抽象概念
5.1.1前嚮計算
5.1.2反嚮計算(導數、反嚮傳播)
5.1.3軟件
5.1.4實現流程
5.1.5網絡構成
5.2實踐經驗
5.2.1優化算法的選擇
5.2.2初始化
5.2.3重啓與集成
5.2.4梯度消失與梯度爆炸
5.2.5飽和神經元與死神經元
5.2.6隨機打亂
5.2.7學習率
5.2.8minibatch
第二部分處理自然語言數據
第6章文本特徵構造
6.1NLP分類問題中的拓撲結構
6.2NLP問題中的特徵
6.2.1直接可觀測特徵
6.2.2可推斷的語言學特徵
6.2.3核心特徵與組閤特徵
6.2.4n元組特徵
6.2.5分布特徵
第7章NLP特徵的案例分析
7.1文本分類:語言識彆
7.2文本分類:主題分類
7.3文本分類:作者歸屬
7.4上下文中的單詞:詞性標注
7.5上下文中的單詞:命名實體識彆
7.6上下文中單詞的語言特徵:介詞詞義消歧
7.7上下文中單詞的關係:弧分解分析
第8章從文本特徵到輸入
8.1編碼分類特徵
8.1.1獨熱編碼
8.1.2稠密編碼(特徵嵌入)
8.1.3稠密嚮量與獨熱錶示
8.2組閤稠密嚮量
8.2.1基於窗口的特徵
8.2.2可變特徵數目:連續詞袋
8.3獨熱和稠密嚮量間的關係
8.4雜項
8.4.1距離與位置特徵
8.4.2補齊、未登錄詞和詞丟棄
8.4.3特徵組閤
8.4.4嚮量共享
8.4.5維度
8.4.6嵌入的詞錶
8.4.7網絡的輸齣
8.5例子:詞性標注
8.6例子:弧分解分析
第9章語言模型
9.1語言模型任務
9.2語言模型評估:睏惑度
9.3語言模型的傳統方法
9.3.1延伸閱讀
9.3.2傳統語言模型的限製
9.4神經語言模型
9.5使用語言模型進行生成
9.6副産品:詞的錶示
第10章預訓練的詞錶示
10.1隨機初始化
10.2有監督的特定任務的預訓練
10.3無監督的預訓練
10.4詞嵌入算法
10.4.1分布式假設和詞錶示
10.4.2從神經語言模型到分布式錶示
10.4.3詞語聯係
10.4.4其他算法
10.5上下文的選擇
10.5.1窗口方法
10.5.2句子、段落或文檔
10.5.3句法窗口
10.5.4多語種
10.5.5基於字符級彆和子詞的錶示
10.6處理多字單元和字變形
10.7分布式方法的限製
第11章使用詞嵌入
11.1詞嚮量的獲取
11.2詞的相似度
11.3詞聚類
11.4尋找相似詞
11.5同中選異
11.6短文檔相似度
11.7詞的類比
11.8改裝和映射
11.9實用性和陷阱
第12章案例分析:一種用於句子意義推理的前饋結構
12.1自然語言推理與 SNLI數據集
12.2文本相似網絡
第三部分特殊的結構
第13章n元語法探測器:捲積神經網絡
13.1基礎捲積池化
13.1.1文本上的一維捲積
13.1.2嚮量池化
13.1.3變體
13.2其他選擇:特徵哈希
13.3層次化捲積
第14章循環神經網絡:序列和棧建模
14.1RNN抽象描述
14.2RNN的訓練
14.3RNN常見使用模式
14.3.1接收器
14.3.2編碼器
14.3.3傳感器
14.4雙嚮RNN
14.5堆疊RNN
14.6用於錶示棧的RNN
14.7文獻閱讀的注意事項
第15章實際的循環神經網絡結構
15.1作為RNN的CBOW
15.2簡單RNN
15.3門結構
15.3.1長短期記憶網絡
15.3.2門限循環單元
15.4其他變體
15.5應用到RNN的丟棄機製
第16章通過循環網絡建模
16.1接收器
16.1.1情感分類器
16.1.2主謂一緻語法檢查
16.2作為特徵提取器的RNN
16.2.1詞性標注
16.2.2RNN�睠NN文本分類
16.2.3弧分解依存句法分析
第17章條件生成
17.1RNN生成器
17.2條件生成(編碼器)
17.2.1序列到序列模型
17.2.2應用
17.2.3其他條件上下文
17.3無監督的句子相似性
17.4結閤注意力機製的條件生成
17.4.1計算復雜性
17.4.2可解釋性
17.5自然語言處理中基於注意力機製的模型
17.5.1機器翻譯
17.5.2形態屈摺
17.5.3句法分析
第四部分其他主題
第18章用遞歸神經網絡對樹建模
18.1形式化定義
18.2擴展和變體
18.3遞歸神經網絡的訓練
18.4一種簡單的替代——綫性化樹
18.5前景
第19章結構化輸齣預測
19.1基於搜索的結構化預測
19.1.1基於綫性模型的結構化預測
19.1.2非綫性結構化預測
19.1.3概率目標函數(CRF)
19.1.4近似搜索
19.1.5重排序
19.1.6參考閱讀
19.2貪心結構化預測
19.3條件生成與結構化輸齣預測
19.4實例
19.4.1基於搜索的結構化預測:一階依存句法分析
19.4.2基於Neural�睠RF的命名實體識彆
19.4.3基於柱搜索的NER�睠RF近似
第20章級聯、多任務與半監督學習
20.1模型級聯
20.2多任務學習
20.2.1多任務設置下的訓練
20.2.2選擇性共享
20.2.3作為多任務學習的詞嵌入預訓練
20.2.4條件生成中的多任務學習
20.2.5作為正則的多任務學習
20.2.6注意事項
20.3半監督學習
20.4實例
20.4.1眼動預測與句子壓縮
20.4.2弧標注與句法分析
20.4.3介詞詞義消歧與介詞翻譯預測
20.4.4條件生成:多語言機器翻譯、句法分析以及圖像描述生成
20.5前景
第21章結論
21.1我們學到瞭什麼
21.2未來的挑戰
參考文獻
我必須要給這本關於生物信息學中的統計建模的書點個贊!內容涉及的領域非常前沿,涵蓋瞭從基因錶達譜分析到蛋白質結構預測的統計方法。這本書的厲害之處在於,它沒有迴避復雜的統計學工具,而是將貝葉斯推斷和馬爾可夫鏈濛特卡洛(MCMC)方法,毫不含糊地應用到瞭實際的生物數據集上。作者提供瞭大量的R和Python代碼示例,手把手教你如何處理高維、稀疏的生物數據。我特彆欣賞它在討論降維技術時,不僅講解瞭PCA,還深入探討瞭t-SNE在可視化高維空間中的優缺點。如果你在做科研,需要用嚴謹的統計學方法來解釋實驗結果,這本書無疑是一座知識的燈塔,讓你在數據海洋中不再迷失方嚮。
評分終於找到一本能把計算機圖形學中的渲染管綫講得如此透徹的書瞭!這本書的側重點似乎更偏嚮於底層實現,特彆是對光綫追蹤(Ray Tracing)算法的數學基礎進行瞭百科全書式的梳理。它從嚮量代數的基礎開始,逐步構建齣如何精確計算光綫與復雜麯麵(如Bézier麯麵)的交點,以及如何高效地管理場景中的幾何數據結構(如BVH樹)。書中關於全局光照和著色模型的章節,簡直是藝術品級彆的講解,它讓你明白為什麼電影裏的畫麵看起來如此真實。我過去總覺得PBR(基於物理的渲染)很玄乎,讀完這本書後,我終於明白瞭菲涅爾效應和微上麵模型背後的物理學原理。這本書對於想深入理解遊戲引擎底層渲染機製或從事專業視覺特效製作的人來說,是不可多得的內功心法。
評分這是一本關於高級數據庫係統架構的實戰手冊,簡直是運維和架構師的案頭必備!我過去在處理高並發讀寫時總有些模糊不清的概念,這本書直接把CAP理論放在瞭不同的分布式數據庫(如Cassandra和PostgreSQL集群)的實際部署案例中進行對比分析。它詳細剖析瞭MVCC(多版本並發控製)在不同隔離級彆下的具體實現細節,這一點對我優化慢查詢幫助太大瞭。書中還包含瞭大量的SQL性能調優的實戰技巧,比如索引失效的常見陷阱、事務隔離級彆的選擇策略等,甚至還涉及到瞭最新的NewSQL數據庫的架構優選。對於希望從“會用”數據庫升級到“精通”數據庫內核的專業人士來說,這本書的價值無法估量,我感覺我的係統性能至少能提升30%!
評分說實話,我本來對量子信息與計算這個主題是有點望而生畏的,總覺得它離我的日常工作太遙遠瞭。但這本書的敘事方式簡直是化腐朽為神奇!作者沒有一上來就拋齣薛定諤方程,而是從最基礎的量子比特(Qubit)概念講起,用非常形象的比喻解釋瞭疊加態和糾纏的魔力。我印象最深的是關於Shor算法的章節,它不是簡單地給齣公式,而是用曆史的視角,講解瞭為什麼這個算法的齣現會對現有的加密體係造成顛覆性的影響。閱讀體驗非常流暢,那種“豁然開朗”的感覺貫穿始終。如果你對未來計算技術抱有好奇心,想瞭解一下超越經典計算機的極限在哪裏,這本書絕對是你的最佳啓濛讀物,讀完後對“不確定性”的理解都上升到瞭一個新的哲學高度。
評分哇,最近剛看完這本關於圖論與網絡流的寶典,簡直是為我這種理論派的工程師量身定做的!這本書的深度和廣度都超乎我的想象。它不是那種浮於錶麵的入門讀物,而是紮紮實實地把Kruskal和Prim算法的每一步推導都講得清清楚楚,連那些看似微不足道的邊界條件都考慮進去瞭。特彆是講到最大流最小割定理那幾章,作者引入瞭一個非常巧妙的例子,用一個復雜的城市交通調度問題來貫穿始終,讓你在實際應用中理解那些枯燥的數學公式的意義。我花瞭整整一個周末纔把“多項式時間復雜度”和“NP完全性”那部分吃透,書中對NP-Hard問題的各種近似算法的討論非常到位,推薦給所有想在算法競賽中有所突破的朋友們,絕對能幫你把理論基礎打得比鑽石還硬!
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有