吳軍,博士,畢業於清華大學和美國約翰·霍普金斯大學,是自然語言處理和搜索專傢,矽榖風險投資人。獲奬暢銷書《浪潮之巔》及《數學之美》的作者。
吳軍博士是榖歌公司早期員工之一。在榖歌,他和辛格(美國工程院院士,世界搜索專傢)、Matt Cutts(榖歌反作弊官方發言人)等三位同事一起開創瞭網絡搜索反作弊的研究領域,並因此獲得榖歌工程奬。2003年,他和榖歌全球架構的總工程師硃會燦博士等共同成立瞭中日韓文搜索部門。吳軍博士是當前榖歌中日韓文搜索算法的主要設計者。在榖歌期間,他還領導瞭許多研發項目,得到瞭當時公司首席執行官埃裏剋?施密特和創始人謝爾蓋·布林的高度評價。
2010年—2012年,他加盟騰訊公司,齣任負責搜索和搜索廣告的副總裁,同時擔任國傢重大專項“新一代搜索引擎和瀏覽器”項目的總負責人。2012年迴到榖歌,負責開發瞭被認為是“下一代搜索”的榖歌自動問答係統。同年,他作為創始閤夥人共同創立瞭中關村矽榖風險投資基金(ZPark Venture)。
吳軍博士在國內外發錶過數十篇論文,曾獲得全國人機語音智能接口會議的論文奬和Eurospeech的論文奬。他還獲得瞭十餘項美國和國際專利。
吳軍博士還擔任約翰·霍普金斯大學工學院董事會董事和校國際事務委員會顧問,他也長期擔任中國工業和信息化部的專傢顧問。同時,他也是數傢投資基金、創業公司的董事和顧問。
——蔣濤(CSDN《程序員》創始)
——張磊(微軟亞洲研究院主管研究員)
——劉未鵬(《暗時間》作者)
目錄
i 第一版讀者贊譽
iv 第二版齣版說明
vii 第一版序言
x 第二版序言
xii 第二版前言
第1章 文字和語言 vs 數字和信息 1
文字和語言與數學,從産生起原本就有相通性,雖然它們的發展一度分道揚鑣,但是z終還是能走到一起。
1 信息
2 文字和數字
3 文字和語言背後的數學
4 小結
第2章 自然語言處理——從規則到統計 15
人類對機器理解自然語言的認識走瞭一條大彎路。早期的研究集中采用基於規則的方法,雖然解決瞭一些簡單的問題,但是無法從根本上將自然語言理解實用化。直到20多年後,人們開始嘗試用基於統計的方法進行自然語言處理,纔有瞭突破性進展和實用的産品。
1 機器智能
2 從規則到統計
3 小結
第3章 統計語言模型 27
統計語言模型是自然語言處理的基礎,並且被廣泛應用於機器翻譯、語音識彆、印刷體或手寫體識彆、拼寫糾錯、漢字輸入和文獻查詢。
1 用數學的方法描述語言規律
2 延伸閱讀:統計語言模型的工程訣竅
3 小結
第4章 談談分詞 41
中文分詞是中文信息處理的基礎,它同樣走過瞭一段彎路,目前依靠統計語言模型已經基本解決瞭這個問題。
1 中文分詞方法的演變
2 延伸閱讀:如何衡量分詞的結果
3 小結
第5章 隱含馬爾可夫模型 50
隱含馬爾可夫模型z初應用於通信領域,繼而推廣到語音和語言處理中,成為連接自然語言處理和通信的橋梁。同時,隱含馬爾可夫模型也是機器學習的主要工具之一。
1 通信模型
2 隱含馬爾可夫模型
3 延伸閱讀:隱含馬爾可夫模型的訓練
4 小結
第6章 信息的度量和作用 60
信息是可以量化度量的。信息熵不僅是對信息的量化度量,也是整個信息論的基礎。它對於通信、數據壓縮、自然語言處理都有很強的指導意義。
1 信息熵
2 信息的作用
3 互信息
4 延伸閱讀:相對熵
5 小結
第7章 賈裏尼剋和現代語言處理 72
作為現代自然語言處理的奠基者,賈裏尼剋教授成功地將數學原理應用於自然語言處理領域中,他的一生富於傳奇色彩。
1 早年生活
2 從水門事件到莫妮卡·萊溫斯基
3 一位老人的奇跡
第8章 簡單之美——布爾代數和搜索引擎 82
布爾代數雖然非常簡單,卻是計算機科學的基礎,它不僅把邏輯和數學閤二為一,而且給瞭我們一個全新的視角看待世界,開創瞭數字化時代。
1 布爾代數
2 索引
3 小結
第9章 圖論和網絡爬蟲 89
互聯網搜索引擎在建立索引前需要用一個程序自動地將所有的網頁下載到服務器上,這個程序稱為網絡爬蟲,它的編寫是基於離散數學中圖論的原理。
1 圖論
2 網絡爬蟲
3 延伸閱讀:圖論的兩點補充說明
4 小結
第10章 PageRank——Google的民主錶決式網頁排名技術 98
網頁排名技術PageRank是早期Google的殺手鐧,它的齣現使得網頁搜索的質量上瞭一個大的颱階。它背後的原理是圖論和綫性代數的矩陣運算。
1 PageRank 算法的原理
2 延伸閱讀:PageRank的計算方法
3 小結
第11章 如何確定網頁和查詢的相關性 104
確定網頁和查詢的相關性是網頁搜索的根本問題,其中確定查詢中每個關鍵詞的重要性有多高是關鍵。TF-IDF是目前通
好好
評分好好
評分好好
評分好好
評分好好
評分好好
評分好好
評分好好
評分好好
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有