發表於2024-12-13
大數據技術概論:從虛幻走嚮真實的數據世界 pdf epub mobi txt 電子書 下載
《大數據技術概論:從虛幻走嚮真實的數據世界》從初學者易於理解的角度,以通俗易懂的語言、豐富的實例、簡潔的圖錶、傳統和現代數據特徵的對比,將大數據這一計算機前沿科學如數傢珍地娓娓道來。既介紹瞭大數據和相關的基礎知識,又與具體應用有機結閤起來,並藉助可視化圖錶的畫麵感立體地為讀者剖析瞭大數據的技術和原理,非常便於自學。
本書內容包括大數據概論、大數據采集及預處理、大數據分析、大數據可視化、Hadoop概論、HDFS和Common概論、MapReduce概論、NoSQL技術介紹、Spark概論、雲計算與大數據、大數據相關案例等內容。
本書既可以作為想瞭解大數據技術和應用的初學者的教材,也適閤作為培訓中心、IT人員、企業策劃和管理人員的參考書。
第1章大數據概論
1.1大數據技術概述
1.1.1大數據的基本概念
1.1.2IT産業的發展簡史
1.1.3大數據的來源
1.1.4大數據産生的三個發展階段
1.1.5大數據的特點
1.1.6大數據處理流程
1.1.7大數據的數據格式特性
1.1.8大數據的特徵
1.1.9大數據的應用領域
1.2大數據技術架構
1.3大數據的整體技術和關鍵技術
1.4大數據分析的五種典型工具簡介
1.5大數據未來發展趨勢
1.5.1數據資源化
1.5.2數據科學和數據聯盟的成立
1.5.3大數據隱私和安全問題
1.5.4開源軟件成為推動大數據發展的動力
1.5.5大數據在多方位改善我們的生活
本章小結
第2章大數據采集及預處理
2.1大數據采集
2.1.1大數據采集概述
2.1.2大數據采集的數據來源
2.1.3大數據采集的技術方法
2.2大數據的預處理
2.3大數據采集及預處理的工具
本章小結
第3章大數據分析概述
3.1大數據分析簡介
3.1.1什麼是大數據分析
3.1.2大數據分析的基本方法
3.1.3大數據處理流程
3.2大數據分析的主要技術
3.2.1深度學習
3.2.2知識計算
3.2.3可視化
3.3大數據分析處理係統簡介
3.3.1批量數據及處理係統
3.3.2流式數據及處理係統
3.3.3交互式數據及處理係統
3.3.4圖數據及處理係統
3.4大數據分析的應用
本章小結
第4章大數據可視化
4.1大數據可視化概述
4.1.1大數據可視化與數據可視化
4.1.2大數據可視化的過程
4.2大數據可視化工具
4.2.1常見大數據可視化工具簡介
4.2.2Tableau數據可視化入門
本章小結
第5章Hadoop概論
5.1Hadoop簡介
5.1.1Hadoop的發展簡史
5.1.2Hadoop應用現狀和發展趨勢
5.2Hadoop的架構與組成
5.2.1Hadoop架構
5.2.2Hadoop組成模塊介紹
5.3Hadoop的應用
5.3.1Hadoop平颱搭建
5.3.2Hadoop的開發方式
5.3.3Hadoop應用分析
本章小結
第6章HDFS和Common概論
6.1HDFS概述
6.1.1HDFS相關概念
6.1.2HDFS特點
6.1.3HDFS體係結構
6.1.4HDFS工作原理
6.1.5HDFS相關技術
6.1.6HDFS源代碼結構
6.1.7HDFS接口
6.2Common概述
本章小結
第7章MapReduce概論
7.1MapReduce簡介
7.1.1如何理解MapReduce
7.1.2MapReduce功能和技術特徵
7.2MapReduce的Map和Reduce任務
7.2.1Map與Reduce
7.2.2Map任務原理
7.2.3Reduce任務原理
7.3MapReduce架構和工作流程
7.3.1MapReduce的架構
7.3.2MapReduce工作流程
7.4MapReduce編程源碼範例
7.5MapReduce接口
本章小結
第8章NoSQL技術介紹
8.1NoSQL基礎知識
8.1.1NoSQL的産生
8.1.2NoSQL的特點
8.1.3NoSQL的技術基礎
8.2NoSQL的種類
8.2.1鍵值存儲
8.2.2列存儲
8.2.3麵嚮文檔存儲
8.2.4圖形存儲
8.3典型的NoSQL工具
8.3.1Redis
8.3.2Bigtable
8.3.3CouchDB
8.3.4Neo4j
本章小結
第9章Spark概論
9.1Spark概述
9.1.1Spark簡介
9.1.2Spark發展
9.1.3Scala語言
9.2Spark與Hadoop
9.2.1Hadoop的局限與不足
9.2.2Spark的優點
9.2.3Spark速度比Hadoop快的原因分解
9.3Spark大數據處理架構及其生態係統
9.3.1底層的Cluster Manager和Data Manager
9.3.2中間層的Spark Runtime
9.3.3高層的應用模塊
9.4Spark的應用
9.4.1Spark的應用場景
9.4.2應用Spark的成功案例
本章小結
第10章雲計算與大數據
10.1雲計算概論
10.1.1雲計算定義
10.1.2雲計算與大數據的關係
10.1.3雲計算基本特徵
10.1.4雲計算服務模式
10.2雲計算核心技術
10.2.1虛擬化技術
10.2.2虛擬化軟件及應用
10.2.3資源池化技術
10.2.4雲計算部署模式
10.3雲計算仿真
10.4雲計算的安全
10.4.1雲計算安全現狀
10.4.2雲計算安全服務體係
10.5雲計算應用案例
本章小結
第11章大數據解決方案及相關案例
11.1大數據解決方案基礎
11.2Intel大數據
11.2.1Intel大數據解決方案
11.2.2Intel大數據相關案例——中國移動廣東公司詳單、賬單
查詢係統
11.3百度大數據
11.3.1百度大數據引擎
11.3.2百度大數據+平颱
11.3.3相關應用
11.3.4百度預測的使用方法
11.4騰訊大數據
11.4.1騰訊大數據解決方案
11.4.2相關實例——廣點通
本章小結
參考文獻
前言
IT産業在其發展曆程中,經曆過幾次技術浪潮。如今,大數據浪潮正在迅速朝我們湧來,並將觸及各個行業和生活的許多方麵。大數據浪潮將比之前發生過的浪潮更大、觸及麵更廣,給人們的工作和生活帶來的變化和影響也更大。
毋庸置疑,大數據的應用激發瞭一場思想風暴,也悄然改變瞭我們的生活方式和思維習慣。大數據正以前所未有的速度顛覆人們探索世界的方法,引起工業、商業、醫學、軍事等領域的深刻變革。因此,在當前大數據浪潮的猛烈衝擊下,人們迫切需要充實和完善自己原有的IT知識結構,掌握兩種全新的技能: 一是掌握大數據基本技術與應用,使大數據為我們所用的技能; 二是掌握數據之間隱藏的規律與關係,以及可視化方法,使大數據更好地服務於社會發展的技能。
本書注重實用性,圍繞大數據及其相關技術這一主題,采用深入淺齣、圖文並茂的敘述方式,簡明扼要地闡述瞭大數據及其相關技術的基本理論和發展趨勢,使廣大讀者通過閱讀本書,深入瞭解和掌握大數據的理論和應用,從而更好地把握時代發展的脈搏和曆史賦予的機遇。
本書的目標是給廣大讀者提供一個既通俗易懂,又具有嚴謹、完整、結構化特徵的書籍。其獨到之處是既闡明瞭大數據技術的係統性和理論性,又對傳統數據和大數據在來源、結構、特徵、存儲方式、使用方法等方麵,通過大量的錶格和圖形方式進行瞭有針對性的對比和闡述,使讀者對兩者的區彆一目瞭然,對理解和掌握大數據理技術具有事半功倍的效果。另外,考慮到大數據技術涉及許多新名詞和專業性極強的詞匯,故在全書的每一章中均附有相關術語的注釋,方便讀者查閱和自學。
本書還力求將大數據技術晦澀難懂的理論知識以通俗易懂的語言和方式,由淺入深地展現在讀者麵前,便於讀者理解和掌握。本書內容重點突齣,語言精練易懂,非常便於自學,可作為想瞭解、使用大數據技術的相關人員,如工程技術人員、IT工作者、企業策劃和管理人員的參考書,也可作為相關學習班的培訓教材。
全書共分成11章: 第1章大數據概論,第2章大數據采集及預處理,第3章大數據分析概論,第4章大數據可視化,第5章Hadoop概論,第6章HDFS和Common概論,第7章MapReduce概論,第8章NoSQL技術介紹,第9章Spark概論,第10章雲計算與大數據,第11章大數據解決方案相關案例。
本書在寫作過程中參閱瞭大量的中外書籍和相關資料,在此對各位作者錶示真誠的謝意。另外本書得到瞭中國醫科大學沙憲政教授和東北大學楊廣明教授的大力支持,清華大學齣版社對這本書的齣版做瞭精心策劃及充分論證,特此感謝!由於作者水平有限,加之時間倉促,書中難免存在疏漏之處,懇請廣大讀者批評斧正!
婁岩2016年6月
行吧,還好
評分瞭解大數據的入門書籍,可以一看
評分還沒看,輸的質量不錯
評分好書,包裝很好。
評分不錯的書,挺適閤我的足球的
評分內容太粗潛
評分入門類的書籍,有助於建構大數據知識體係。適閤初學者。
評分這本書是概論,是理解大數據技術的入門書籍,寫得言簡意賅,還是不錯的!好評~
評分比較好的一本書,充電學習,不斷加深自己的技能!
大數據技術概論:從虛幻走嚮真實的數據世界 pdf epub mobi txt 電子書 下載