發表於2025-03-06
數據密集型應用係統設計 pdf epub mobi txt 電子書 下載
作者簡介
Martin Kleppmann是英國劍橋大學分布式係統方嚮的研究員。此前,他曾是LinkedIn和Rapportive等互聯網公司的軟件工程師,負責大規模數據基礎設施建設。在此過程中他遇到過一些睏難,因此他希望這本書能夠幫助讀者避免重蹈覆轍。Martin還是一位活躍的會議演講者、博主和開源貢獻者。他認為,每個人都應該學習深刻的技術理念,對技術的深入理解能幫助我們開發齣更好的軟件。
譯者簡介
趙軍平, 大數據存儲與分析資深開發者與推廣者(EMC 10餘年),GPU異構計算的親曆者。中國計算機協會專傢委員,DELL EMC資深架構師。12年係統研發、創新與團隊管理經驗,擅長數據存儲與保護, 雲計算與大數據實時分析,GPU異構加速優化等。相關領域已申請中、美技術專利100餘項,並多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技術分享,持續關注數據密集和計算密集相關技術的演進、融閤與賦能推廣。
呂雲鬆,北京大學計算機碩士,碩士及DELL EMC中國研究院實習期間專注於大數據實時流式處理相關的研究。現就職於華為2012中軟院黎曼實驗室,主要從事深度學習的研發。
耿煜,DELL EMC架構師兼GTM負責人,緻力於推廣企業級數字化轉型方案。深耕分布式架構以及雲計算12年,先後任職於ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美國麻省大學計算機工程專業博士,DELL EMC中國研究院首席科學傢,研究方嚮為機器學習、深度學習、智能運維、遙感影像等。已在IEEE Transactions期刊和會議上發錶論文數十篇,申請美國專利20餘項。推崇簡約,熱衷機器學習。
全書分為三大部分:
第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。
第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。
第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。
##斷斷續續看完瞭。對於數據架構的整體認識幫助很大,接下來就是到各細分領域繼續研究。吐槽一下第十二章的翻譯錯彆字特彆多。 我整理的讀書筆記:https://www.bicky.me/blog/categories.html#category-Web%20Arch
評分##兩個筆記,看瞭這個:https://henrikwarne.com/2019/07/27/book-review-designing-data-intensive-applications/ 這個沒看:https://timilearning.com/tags/ddia/
評分 評分##想深入瞭解一下分布式一緻性協議的理論基礎,看到 hacker news 上有人推薦這本書,於是找來看瞭一下。確實是一本難得一見的好書,無論是講理論領域的深度,講實踐場景的實用,無論是內容編排還得結構思路,基本都挑不齣毛病。但最難得的還是作者能把理論的東西講得足夠易懂,當...
評分 評分 評分##這本書從數據的産生、傳輸、存儲、檢索、更新等方方麵麵,介紹瞭一個後颱係統使用到的種種存儲技術,包括瞭數據庫、緩存、檢索引擎、批處理、流處理。對於每一種技術,作者介紹瞭它們的基本原理、使用場景、優勢和不足,並附帶瞭大量的擴展閱讀書目。對於後颱開發、運維人員,...
評分 評分數據密集型應用係統設計 pdf epub mobi txt 電子書 下載