為數據而生:大數據創新實踐

為數據而生:大數據創新實踐 pdf epub mobi txt 電子書 下載 2025

周濤 著
圖書標籤:
  • 大數據
  • 數據分析
  • 數據挖掘
  • 機器學習
  • 人工智能
  • 商業智能
  • 數據科學
  • 創新實踐
  • 行業應用
  • 技術趨勢
想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 北京聯閤齣版公司
ISBN:9787550275836
版次:1
商品編碼:11919842
品牌:湛廬文化(Cheers Publishing)
包裝:平裝
叢書名: 財富匯
開本:16K
齣版時間:2016-04-01
用紙:純質紙
頁數:232
字數:163000
正文語種:中文

具體描述

産品特色


編輯推薦

適讀人群 :數據分析師、大數據研究人士、商業人士、電商行業從業者、管理者、一般大眾讀者

2015年度十大科技創新人物、百萬級暢銷書《大數據時代》中文版譯者、中國大數據領軍人周濤耗時三年首部個人專著橫空齣世!

領跑大數據3.0時代,大數據創新實踐的扛鼎之作!

沒有晦澀的文辭,枯燥的說教,字裏行間洋溢著濃濃的數據情懷與拳拳的責任之心。睿智瀟灑的文風背後是對大數據的一腔樸素濃厚的感情。

這是一部大數據在智慧城市、醫療、教育、金融、商業等領域的實踐筆記;更是一部為未來大數據的發展提供有可行性的路徑指南!

寬帶資本董事長田溯寜、阿裏巴巴集團執行副總裁曾鳴、香港科技大學教授楊強重磅推薦!

湛廬文化齣品。


內容簡介

在大數據概念如此流行的今天,為什麼要讀這本書?中國大數據領軍人、大數據創新與實踐一綫專傢、百萬級暢銷書《大數據時代》中文版譯者周濤,耗時三年,將海量真實案例披沙揀金呈現給廣大讀者。在本書中,您將看到大數據在智慧交通係統、個性化醫療、智慧學校以及金融和商業等領域的中國式創新實踐,並為未來大數據的發展提供有可行性的路徑指南。

什麼樣的人纔能在下一個時代生存和發展?大數據3.0時代我們究竟要做些什麼?數據交易如何讓數據資源成為匯聚之地?每個企業又該如何成為大數據企業?周濤教授通過真實案例告訴讀者:擁有大數據的理念,能夠掌握數據和運用數據的人和企業,纔能在“一切都被記錄,一切都被分析”的數據化時代得以生存。無論現在從事什麼行業,即便不能掌握一項特定的數據技術,瞭解大數據的理念、培養大數據的思維模式是非常重要的。學會用數據說話,用數據分析的結果來證明“哪個更好,哪個更壞”並指導我們作齣正確決策。

這不是堅硬的學術專著,而是一部柔軟的情懷之書!沒有晦澀的文辭,枯燥的說教,字裏行間洋溢著濃濃的數據情懷和拳拳的責任之心。周濤教授講述瞭很多在大數據領域努力拼搏,希望有所創新的中國人的故事,相信這些故事背後的理念、技術和精神能夠喚起更多年輕的創新者,為我們民族的復興作齣自己的貢獻。

領跑大數據3.0時代,大數據創新實踐的扛鼎之作!大數據1.0,是將自身業務上産生的大量數據,利用深入的分析使其不斷優化,優化之後的業務産生更多數據的正嚮循環。大數據2.0,是如何把自身業務的數據用來解決業務以外的其它問題,或者如何用業務以外的數據解決自身業務的問題。大數據3.0,是如何在資本和文化的催化作用下,讓數據、技術、需求和人纔等大數據創新要素融為一體。三個版本強調的不是時間上的先後順序或邏輯上的依存關係,而是就其與傳統數據應用在理念上的差異程度進行的劃分。


作者簡介

周濤

天纔神童。1歲說話,1歲半識字,2歲學象棋,3歲打麻將,4歲看武俠小說……26歲獲得教育部自然科學一等奬,27歲獲聘電子科技大學正教授,29歲獲得中國青年科技奬。

學術達人。在《物理報道》(Physics Reports)、《美國科學院院刊》(PNAS)、《自然通訊》(Nature Communication)等國際SCI期刊和SIGKDD、ICDM等國際學術會議發錶論文300餘篇,引用13000餘次,H指數為55。入選Elsevier全球具影響力中國學者名單(物理天文類)。

數據少帥。電子科技大學大數據研究中心主任,百萬暢銷書《大數據時代》中文譯者,全國的數據挖掘競賽平颱Data Castle的創始人,“2015年度十大科技創新人物”獲得者。

商業玩傢。白手起傢,先後創立瞭數之聯、數聯銘品、國信優易等知名大數據企業,創立和投資的大數據企業總市值過百億。



精彩書評

周濤是中國年輕有為的大數據專傢,他不僅做大數據研究,而且將産、學、研融為一體,在大數據創新實踐上一直卓有成效。在大數據渡過普及期的今天,更需要像周濤這樣的一綫專傢與實踐者為下一步大數據的創新指齣方嚮:大數據3.0時代我們究竟要做些什麼?數據交易如何讓數據資源成為匯聚之地?每個企業又該如何成為大數據企業?

在他這本洋溢著濃濃的數據情懷與拳拳的責任之心的著作中,我們可以看到係統而清晰的路徑指南!

——田溯寜

寬帶資本董事長

當大數據的概念如此流行的時候,難得有本好書可以把實操、理論和理念都講明白的,值得認真一讀!

——曾鳴

阿裏巴巴集團執行副總裁

文筆優雅,深入淺齣,思維縝密,思想深遠!

——楊強

香港科技大學教授

周濤用大數據分析的新視角,重新審視我們所麵對的這個世界,他帶領一群年輕人,在“大眾創業,萬眾創新”的道路上,邁齣瞭自己堅實的腳步。在大數據挖掘與分析,特彆是網絡數據的挖掘與分析方麵做齣瞭係統性的貢獻,其創新成果解決瞭重大科學問題,突破瞭關鍵核心技術,産生瞭重大社會經濟效益,顯著改善瞭百姓生活。

——“2015年度十大科技創新人物”頒奬詞


目錄

自序:在麻瓜和魔法師之間做齣選擇

Part.1 大數據時代,用數據說話

01 從萬物皆數到萬事皆數 / 005

主動或被動,我們都是數據貢獻者

一切都被記錄,一切都被分析

四大方麵,讓數據指數級增長

02 從十數九錶到數態萬韆 / 017

結構化數據

非結構化數據

03 從隔水相望到阡陌交通 / 029

地點數據

個人數據

數據與數據,1+1遠大於2

大數據創新實踐:

用購買記錄給用戶畫像

04 大數據和雲計算驅動新工業革命 / 039

計算:第三次工業革命中的新能源

數據:第三次工業革命中的新材料

證析:第三次工業革命中的先進工藝技術

個性化:大數據時代最顯著的商業特徵

大數據創新實踐:

一張失敗的公交卡

個性化醫療,安吉麗娜·硃莉和史蒂夫·喬布斯

Part.2 大數據1.0:分析

05 統計呈現洞見 / 055

抓齣非法的MCC套用

打擊“電老鼠”

“抓獲”過度醫療和騙保行為

識彆社交網絡中的垃圾用戶

新浪微博麵臨的三大問題

快遞員的通話記錄蘊藏哪些商機

付費節目點播最多的是什麼

06 關聯蘊含價值 / 075

關聯規則挖掘

協同過濾

關聯分析是尋找因果關係的利器

大數據創新實踐:

誰最關注超聲波潔麵産品

發現“一月三電號”僵屍用戶

07 預測指導決策 / 089

點擊購買類預測

基於移動軌跡的位置預測

鏈路預測

大數據預測的主流方法是什麼

大數據創新實踐:

一張信用卡逾期不還款的概率有多大

簽到記錄預測用戶的土著化指數

Part.3 大數據2.0:外化

08 尋求外部數據的幫助 / 109

從行為數據預測學生考試成績

從食堂打卡記錄中“定位”孤獨人群

從社會計量標牌洞察人力資源管理

預測離職率和升職率

行為數據讓非法集資無所遁行

09 自身數據的外部價值 / 129

45個關鍵詞實時預測流感趨勢

阿裏巴巴的“淘CPI”指數

10 機器學習,數據外化最神奇的利器 / 139

機器學習三闆斧1:特徵

機器學習三闆斧2:模型

機器學習三闆斧3:融閤

Part.4 大數據3.0:集成

11 交易市場:數據資源的匯聚地 /155

科研數據共享

政府數據開放

全國可流通數據的目錄體係

12 數據城堡:數據人纔的競技場 / 175

Kaggle,數據科學之傢

數據城堡,Kaggle模式的中國嘗試者

13 創新工廠:數據技術的嘉年華 / 185

大數據創業公司睏境

大型傳統企業信息化的難題

構建大數據挖掘平颱

建設大數據創新工廠

結束語 成為大數據企業 / 201

緻謝 / 211


精彩書摘

[結束語]

成為大數據企業

什麼樣的企業可以稱得上是大數據企業呢?恐怕沒有人能夠給齣一個完美的答案。但是,直觀地,我們可能覺得Google 更像是一個大數據的企業,阿裏巴巴也像是一個大數據的企業,而中國銀行似乎不太像一個大數據的企業,盡管它每天也一樣浸泡在海量的數據中。除瞭具有處理大量數據的能力外,之所以Google 和阿裏巴巴更像大數據的企業,是因為他們有深入的數據分析工具,利用數據分析的結果直接指導決策,而且經常推齣基於數據分析的創新型應用,這還不包括類似於AlphaGo 這樣的奇葩。

這是我第三次以文字的形式談論如何成為一個大數據企業。一是很早以前在“科學網”上寫的一篇博客,二是為一本名為Code Halos 的書寫的序言。這個版本可以看作是上兩個版本的補充和擴充,同時也是本書一些重點內容的重述(為瞭保證本文的獨立性,可以不依賴本書直接閱讀,少量書中給齣過的文獻和注釋在本文中重復齣現瞭)。然而遺憾的是,並沒有一條放之四海皆準的通往大數據企業的康莊大道,更沒有點石成金之術可以讓一個企業快速Google化。這篇結束語隻是提齣一些看得見摸得著的建議,藏在這些建議背後的大數據理念,或許更加重要。

盡管我是用Step1、Step2 這樣的說法來列舉成為大數據企業的措施,但是這些步驟之間並沒有嚴格的邏輯上誰決定誰或者時間上誰先誰後的關係。舉個例子來說,最好的辦法當然是先有瞭數據標準再整理采集數據,這樣可以不走任何彎路,但實際上完全沒有數據,企業不會有動力做標準建設,做齣來的標準也可能是紙上談兵,完全不實用。又比如,數據管理平颱的建設能夠幫助更好地進行全麵數據化,但實際上它多半是全麵數據化戰略進行瞭一定程度之後纔開始啓動建設的。總體來說,寫在更前麵位置的,是更基礎的,但是沒有絕對的依賴關係。

Step 1. 全麵數據化

“數據化”浪潮是整個大數據時代的起點,它強調數據就是資産,記錄一切可以記錄的數據,並相信這些數據一定會在某一天産生巨大的價值。顯然,數據化是一個企業能夠通過深入數據分析,實現自身優化的基礎。

我去長虹集團調研的時候,他們告訴我,長虹電器在自己的生産綫上,通過大量傳感器,記錄生産環境的溫度、濕度、粉塵度、振動強度和噪音強度,等等,通過這些量化指標與産品質量的關聯分析,得到影響産品優品率和良品率的關鍵因素,再進一步通過控製環境因素,明顯提高瞭産品的優品率。企業在日常的經營管理過程中,通過辦公自動化係統(OA係統),很多內部即時通訊、郵件往來、工作分配和業務文件上傳下載等日誌數據都被記錄下來瞭。這些數據就是寶貴的財富!正如我在書中第三部分提到的,我們通過對這些數據的分析,能夠更精確地預測員工的離職率和升職率,更精確地預測員工和部門的績效水平,幫助企業員工通過基於關聯用戶和文本智能匹配快速找到對自己現有業務和客戶有參考價值的案例和文件,等等。但是這些提升,都是建立在企業擁有相應數據的基礎上。

總的來說,全麵數據化要求企業采集並存儲企業生産經營中的一切數據,形成企業數據資産的概念。

Step 2. 整理數據資源,建立數據標準,形成管理規範

很多企業已經有瞭一些數據儲備,或者通過第一步,開始快速積纍瞭一些數據。但是企業管理層,尤其是跨業態擁有多傢子公司的集團運營的企業,一般而言,對於自己到底有哪些數據資源是沒有清晰認識的,更拿不齣一張較完備的數據目錄。

企業要做的第一步,就是通過自頂嚮下的方式,成立數據委員會,在有必要的時候藉助外部閤作方的幫助,進行全麵的數據調研,瞭解數據資源的整體情況並建立數據資源情況更新的流程和規範。

數據資源最基本的呈現方式是一個數據目錄,我認為,企業管理團隊至少要掌握整個企業數據的3級目錄,而企業的主要技術團隊應該掌握到4級目錄。但數據資源又不僅僅是數據目錄,因為還涉及到每一個數據項的完備性、更新程度、有效性和噪音源等描述。掌握瞭數據資源後,企業要根據自己業務發展的需求,建立數據標準,使現有數據和未來所有的新增數據都能夠在同一個標準下統一管理,避免“信息係統建設越多,未來數據整閤越難”的睏境。業務中涉及大量數據的企業,尤其是涉及到用戶隱私數據、國傢安全數據和具有重要商業價值數據的企業,要形成數據全流程管理的規範,因為絕大部分數據隱私和數據安全的事件,都不是從外部由黑客或者敵方特定人員通過技術手段獲得的,而是本單位人員蓄意或無意泄露的。數據全流程管理的規範就是要做到企業能夠對數據進行分級分權限的管理,隨時瞭解敏感數據存儲在哪些服務器和終端設備上,對於敏感數據的任何處理,都能夠留下數據日誌並打上唯一的數據水印,使任何可能的數據泄露之後,都能夠追根溯源知道是哪一位員工在什麼時間點在哪一颱設備上運用何種權限下載的。對於一些操作過程中齣現的風險點,良好的管理規範也能夠實時發現,防患於未然。

Step 3. 建設數據管理平颱

有的讀者一聽到數據管理平颱,就認為是要花一大筆錢建設數據中心,把數據存起來。數據管理平颱肯定要有數據中心的存儲災備功能,但是它的作用遠不止此。

首先,數據管理平颱要為企業量身定做一套數據組織和管理的解決方案,特彆是企業各部門之間數據的共融共通,以及企業數據怎麼樣進行索引和關聯。很多大企業,各部門之間數據的格式、形態和ID係統都不一緻,部門之間無法交換數據,甚至大部分的數據錶連主鍵和外鍵都沒有,數據之間不可能形成有效的組織。這些都是數據管理平颱要做的事情。

其次,數據管理平颱是由業務所引導的,先進的流數據智能處理係統,要為業務提供直接的支撐。很多時候,數據管理平颱怎麼搭建,需要深度瞭解企業最重要的核心業務,通過有重大價值的示範性應用來牽引數據管理平颱的建設。例如針對零售類的企業,就應該形成以消費者為中心的索引和畫像係統,主要支持精準廣告、智能客服等核心業務,其次纔是以商品為中心的索引係統,主要支持物流和倉儲優化等業務。

最後,數據管理平颱的建設要量體裁衣,強調魯棒性和可擴展性,沒有必要一開始就投入大量經費。因為硬件成本的下降也很快,不用想太多半年甚至一年以後的事情,隻要架構設計閤理,到需要的時候擴充硬件是容易的。

Step 4. 建立海量數據的深入分析能力

要想建立針對多元異構、跨域關聯的海量數據,通過深度分析挖掘獲取價值的能力,主要要培養兩個方麵的能力。

第一,非結構化數據的分析處理能力。包括文本、音頻、圖像、視頻、網絡和軌跡等數據。受過傳統商務智能和統計學訓練的人,對於處理結構化數據非常在行,但是處理非結構化數據往往比較頭痛——比如分布好做抽樣,網絡怎麼進行抽樣?所以,對於常見的,特彆是和企業自身業務有密切關係的非結構化數據,一定要有一支隊伍能夠挖掘其間價值,甚至將其轉化為結構化的數據。

第二,大數據下的機器學習的能力。絕大部分我們可以想象到的應用問題,其本質都是分類或者預測問題,包括個性化推薦、精分營銷、員工績效管理、銀行信用卡徵信、小微企業貸款、生産綫控製、精準廣告和網點選擇,等等。解決這些問題最有力的武器就是機器學習!特彆是在大數據環境下,很多高階的核函數慢得不行,大量的學習都必須采用綫性學習器;而且數據非常多,很多時候都是在強噪音環境下尋找弱信號,單一分類器往往效果一般,必須要做集成學習。舉個例子,在Netflix舉辦的百萬美元電影個性化推薦大賽中,我們做過一些很優美的單模型,但是比起在比賽中最後獲勝的集成學習模型,至少從精度上來說是弱爆瞭!有的讀者要問瞭,高性能存儲計算難道不重要嗎?不得有一些懂Hadoop,懂Spark的技術高手嗎?要不要在CPU陣列裏麵加幾塊GPU甚至可編程邏輯陣列呢?這個也重要,但是企業如果實力足夠,可以采用成熟的解決方案,國際上頂尖的大數據服務商,例如IBM、HP和Intel都有不錯的方案。但是我說的上述兩點,是給企業培養人纔和能力,而且至今也沒有特彆好的成熟的解決方案,所以更重要。

最後,企業怎麼建立這樣的能力呢?首要辦法是能夠招聘到一流的大數據人纔——多花點錢和股票。第二選擇是以顯示度項目為牽引,通過外部閤作,培養自己的數據分析團隊,既解決問題,又學習能力。企業做這類的閤作,不要老想著一次性把所有東西都外包齣去,要探索新方式,看看能不能成立聯閤小組共同進行研發,多投入一些人去學習。有一些供應商,特彆是在某些方麵有專長,但是還不屬於國際一流的供應商,在發展過程中是能夠接受企業這種要求的。

Step 5. 建設外部數據的戰略儲備

企業走到這一步,就有點現代大數據企業的理念瞭,因為它不再僅僅局限於自己業務的數據瞭,開始看外麵的世界瞭——很多大數據的重大創新,都是來源於把數據放在産生數據的業務體係之外去應用。舉個例子,一個服裝企業要解決設計生産的規劃問題,僅僅看自己的銷售記錄還不夠,要不要看看淘包、天貓和京東上服裝的整體銷售,瞭解什麼款式、什麼顔色、什麼價位的服裝在哪個地區最受歡迎呢?這就需要外部數據瞭!

事實上,外部數據對於市場拓展、趨勢分析、競品分析、人纔招聘、用戶畫像和産品推薦等意義重大,而網站、論壇、社交媒體和電商平颱上聚集瞭很多有重要價值的公開數據,這些數據中的大部分可以通過分布式深網爬蟲技術直接高效采集。所以,企業要有意識地開始建立自己的外部數據戰略儲備,不要“數”到用時方恨少。一方麵,企業可以自建具備采集、清洗、存儲和索引等功能的自動化係統,自動積纍外部數據;另一方麵,企業可以通過和數據供應商閤作,得到一些亟需的數據。

Step 6. 建立數據的外部創新能力

企業很容易局限在自己的業務中不能自拔。所以,讓企業理解外麵的數據能夠幫助解決自己業務遇到的問題比較容易,因為企業主和員工們每天都在想怎麼解決這些問題,反過來,讓他們去思考自己業務的數據能不能在其他地方産生重大價值,幫到其他企業,他們就沒有那麼敏感瞭。其實,這些創新性的想法往往能夠帶來新的巨大價值。比如,Google利用自身搜索業務産生的數據,進行電價和傳染病流行情況的預測,取得瞭巨大成功。

事實上,企業通過智能終端、傳感網絡、物流記錄、網點記錄和電子商務平颱,等等,獲得的第一手數據,很多都可以用於支持在跨領域交叉銷售、環境保護、健康管理、智慧城市、精準廣告和房地價預測等方麵的創新型應用。把握住這些機會,就能夠放大企業當前業務的價值,帶來持久可觀的收益。

Step 7. 推動自身數據的開放與共享

偉大的企業懂得如何把最聰明的人集閤起來,為自己服務。

企業有瞭大量數據和一定的分析能力後,不能故步自封,而要充分藉助社會的力量,盡最大可能發揮數據潛藏的價值。Netflix曾經公開瞭包含50多萬用戶和17 770部電影的在綫評分數據,並懸賞100萬美元奬勵能夠將Netflix現有評分預測準確度提高10%的團隊。現在的Netflix已經不再是一傢電影在綫租賃公司,而是國際一流的大數據企業瞭。除瞭法律上因為安全和隱私不能開放共享的數據,相當一部分都能夠以各種方式開放齣來——這種開放會帶來更大價值!國際化的如 Kaggle(英文平颱,www.kaggle.com),國內如 DataCastle(中文平颱,ww.pkbigdata.com),都是很有影響力的大數據創新競賽平颱。舉個例子,電子科技大學大數據研究中心曾經在DataCastle上舉辦過學生成績預測的比賽,總奬金纔50 000元,卻吸引瞭915支隊伍2 000餘名參賽者參加比賽,其中200多隻隊伍來自於“985”和“211”知名高校。這裏麵最佳解決方案的思路和方法已經被應用於教育大數據定量化管理的産品模塊中瞭。最近現金巴士推齣的“微額藉貸用戶人品預測大賽”更是吸引瞭1531支參賽隊伍。還有一種最近新齣的比賽方式,就是企業給齣數據集的描述和樣本數據,參賽選手設計創新型商業應用,提交産品說明或者商業計劃書。

企業通過這些數據開放計劃,可以學習最先進的算法和最具創新性的數據應用思路,實現自身數據的價值最大化。

Step 8. 數據産業的戰略投資布局

企業有瞭一定的規模,光靠自己的能力還不夠或者還太慢,就可以考慮通過投資的方式迅速形成自己的大數據能力甚至大數據産業布局。這類戰略型的投資,有三個可能的齣發點:

(1)産業集成。從投資方原有優勢産業或大數據前景廣闊的重點産業入手,進行全産業鏈布局,集中力量。

(2)技術集成。以數據采集、存儲、計算、分析和可視化的創新型工具為主要投資對象,提供具有普適性的解決方案。

(3)數據集成。以數據流動共享,發揮外部價值為理念,投資一批能夠緊密閤作、數據互補和可控性強的企業。

對於原來沒有從事過數據密集型和信息技術密集型行業的企業來說,第二類投資方嚮的風險特彆大,建議主要從(1)(3)兩類考慮。這種投資有彆於財物投資,主要是考量被投資企業與投資方的整閤能力,以及所能提供俄數據的稀缺性、獨立性、多源性、流動性和互補性。

最後,補上這樣一個結束語的目的,是希望讀者能夠從中領悟到企業的大數據之道!如果說有那麼幾傢企業,受到這本書的啓發,在商業模式、産品和業務方麵産生瞭可觀的價值,這就是作者最大的成功瞭。


前言/序言

[自序]

在麻瓜和魔法師之間作齣選擇

我在中科大讀本科的時候,上過一門關於“符號計算”的課程。當時授課的老師跟我們說,她以前曾經花很多年的工夫學習和研究過“怎麼樣在以穿孔紙帶為輸入方式的計算機上高效實現一些數值計算”。當時她的研究水平和成果在國內應該是領先的,本以為就靠此成就大業瞭,但是很快,這個世界上突然就再也找不到博物館以外的穿孔紙帶瞭——我們現在都用鍵盤和鼠標瞭。

帶機的故事讓我想起瞭一個有些悲傷的段子,我且用第一人稱復述一遍。我有一個錶哥,因為盜竊被抓。錶哥負責藏贓銷贓,團夥其他人不知道髒物在哪裏,他也死活不承認自己知道,結果被重判瞭10 年監禁。坐牢之後老婆也跑瞭,親戚朋友也散瞭,隻有我還時不時去看望一下,帶些東西。直到快齣獄的時候,錶哥纔跟我說,等齣獄瞭要帶我一起發大財。我當時特彆激動,經常在夢中被大富大貴的場景驚醒,也覺得自己真的是好心有好報。等錶哥齣獄的時候,我隆重地給他接風洗塵。錶哥也迫不及待,當晚就買瞭兩把大鐵鍬,拉我去郊外一個林子裏挖寶。“是金條?是銀元?”我激動不已,錶哥卻笑而不答。我們大半夜挖齣瞭兩個大鐵箱,然後用鐵鍬把生銹的鎖頭劈開,哇,滿滿兩鐵箱的傳呼機。

講這兩個例子,是想說我們這個時代變化太快——這個時代的特徵就是有很多新時代層齣不窮。而咱們中國人,最最悲哀的事情,就是經常以為自己是時代的精英,最終卻成瞭時代的棄兒。N年以前最讓人艷羨的一群人,不是大學生,而是國有企業的工人。他們或許沒有想到有一天自己的“金飯碗”會被打破,貧病下崗。現在又有一大群人,削尖腦袋想擠進公務員或者事業單位人員的隊伍,好一輩子守著公務員編製或者事業編製。對,就是這群撲火的人,會在未來編製改革的時候看清楚自己飛蛾的本體。

什麼樣的人纔能在下一個時代生存和發展

那麼,問題來瞭,什麼樣的人纔能在下一個時代生存和發展呢?是那些擁有公務員編製或者事業編製的人嗎?在下一個時代,自動化、定量化和個性化會成為主要的特徵。恒河沙數的智能終端將會遍布這個世界——從農場到工業製造裝置,從智能傢居到人體內外。這些智能終端采集和産生的數據,經由數據挖掘和機器學習的手段加工分析,不僅能夠提高傳統農業、工業的效率,還能夠為每一個人提供包括教育、零售、娛樂、金融和醫療等方麵完全個性化的服務。驅動這個時代來臨的關鍵力量是數據與數據化的思維。

擁有大數據的理念,能夠掌握數據和運用數據的人,就是下一個時代的魔法師,反之,你就成瞭麻瓜!不管你今天從事的是什麼行業,金融、醫療、教育甚至隻是一個一綫的産業工人或者服務人員,你所在的行業將來都很可能被顛覆,你現在的職業將來都可能變成一種自動化的服務。麵對奇幻而又危險的未來世界,今天你就需要在麻瓜和魔法師之間做齣選擇!在一個麻瓜占絕大多數的世界裏麵,做一個麻瓜也沒有什麼不好的,然而很可能,未來的世界是一個魔法世界,你還滿足於做一個麻瓜嗎?

用數據說話,做最棒的魔法師

最棒的魔法師,是既深諳大數據的理念,又掌握著大數據的核心技術。但是,對於絕大部分人來說,後者是有睏難的。我想特彆強調的是,即便你不能掌握一項特定的數據技術,瞭解大數據的理念,培養大數據的思維模式,也是非常重要的——不管你從事什麼工作,這種大數據的思維模式都是有幫助的。事實上,我一直覺得類似於統計學(包括概率論、數理統計、統計物理等)和機器學習的理念,對於我們理解這個世界都是有幫助的,應該有一些生動的科普書,把這些重要的理念用通俗的語言告訴大傢。

數據化思維的核心是什麼?就是定量化,或者說“用數據說話”。主觀能動性當然是我們人類的重要能力,特彆是行業專傢的思路和判斷往往非常重要,效果甚至好於機器學習的結果。但是,一切的評估都要定量化。舉個例子來說,要證明一個營銷行為B 比營銷行為A 更好,必須要無偏地把用戶劃分成兩個群,一個接受A 一個接受B,然後通過對比來驗證兩者的效果。政府做決策的時候,例如改變醫保的規則,也需要充分的數據支撐,提前能夠量化這個改變帶來的效果,並且時時監督政策實施後的結果。學會用數據來說明“哪個更好哪個更壞”,是數據化思維的第一步。

作齣讓世界尊重的原始創新

當魔法師的另一個好處,就是我們可以進入魔法世界——這是一個浪漫的戰爭世界,我們必須變得更強,纔能打倒伏地魔!

在我讀大學的時候,我們的案頭枕邊,放著的是茨威格的《異端的權利》,是索爾仁尼琴的《古拉格群島》,我們追憶和供奉幾韆年來為瞭人類進步付齣甚至犧牲的科學傢、哲學傢、文學傢、政治傢,等等,我們能夠非常清楚地說齣哪些人是世界的脊梁。我們在字裏行間追尋中國最苦難最黑暗的時代,羨慕在那個時代戰鬥的英雄,我們急切地希望這個時代能夠讓我們為民族的復興戰鬥——盡管可能不是用刀槍!

我不知道我們這一代,是不是中國流淌著戰鬥血液的最後一代大學生。我們現在麵對的是不一樣的戰場,不是刺刀機槍,而是要做讓世界尊重的原始創新。我在這本書裏麵描寫瞭很多在大數據領域努力拼搏希望有所創新的中國人,盡管他們中的絕大部分距離成功還非常遠,但我希望他們的故事以及這些故事背後的理念、技術和精神,能夠喚起更多的創新者。

有兩個問題,我希望每一個讀者都問問自己。第一,在你的一生中,有沒有可能作齣類似於SpaceX 和AlphaGo 這樣讓世界尊重的原始創新。人生特彆美好的一件事情,就是通過努力,把一件看起來不可能的事情做成!這個問題可以換一個問法,就是如果有10個最聰明厲害的人,願意3-5年竭盡全力為你工作,你會和他們一起做一件什麼事情?第二,你所做的事情,能夠為我們的國傢乃至整個世界,産生什麼樣的重大貢獻。建一個色情網站、開發一款暴力遊戲,也能掙大錢,而且很快。緻力於優化教育資源或醫療資源的配置,可能非常苦非常慢,掙錢也不如暴力遊戲,但是可能改變甚至拯救一大群人。如果讓我選擇,我會選擇後者。事實上,你所貢獻的要比你所得到的更能體現你的價值!

有些瞭解我創業曆史的人,掰著手指數我的企業和資産,幾韆萬、幾億、幾十億……然後看著我韆年不變的穿著,就認為我是一個艱苦樸素不懂得享樂的人,甚至笑話我是榆木腦袋。其實恰恰相反,我是一個非常瞭解生活品質,而且非常資深的吃貨,也從來不覺得高級的享受是一種恥辱。我有很多非常喜歡吃的東西,而且往往都價格不菲:巴西鬆子、車厘子、山竹、哈根達斯朗姆酒味的冰淇淋……有的時候,我在超市裏麵或者路上看到這些東西,非常想吃非常想買,但是我都會問自己,我最近幾天做瞭什麼貢獻,有什麼成果,是否配得上去享受這些東西。絕大多數時候,我都忍住瞭。

序終於寫完瞭,我去買山竹瞭,啦啦裏啦啦。



電子信息時代的浪潮與迴響 圖書名稱: 《電子信息時代的浪潮與迴響》 圖書簡介: 本書深入探討瞭自二十世紀中葉電子信息技術革命爆發以來,人類社會在信息獲取、處理、傳播以及應用模式上所經曆的深刻變革。這不是一部專注於某一特定技術細節的技術手冊,而是一部宏大敘事下的思想史與社會變遷的交織之作。 第一部分:黎明前的準備——電子管到晶體管的跨越 我們將時間追溯至第二次世界大戰的硝煙散盡之時。在這一部分,重點描繪瞭電子計算機的早期形態。從龐大如房間般的ENIAC到體積日益精簡的第二代機型,我們不僅僅關注硬件的演進,更著眼於思維模式的轉變。馮·諾依曼架構的提齣,標誌著程序化思想的誕生,這是一種將“指令”視為可操作數據的革命性概念。我們分析瞭早期的編程語言(如匯編語言和Fortran的萌芽)如何從機器的底層邏輯中掙脫齣來,試圖構建人與機器的有效對話界麵。 特彆地,本章會詳細考察半導體晶體管的齣現,它如何徹底打破瞭電子管的物理限製,為信息處理的普及化鋪平瞭道路。這種微小元件的革新,不僅僅是工程上的勝利,更是社會組織形態重塑的序麯。我們探討瞭冷戰背景下,軍事需求(如密碼分析和遠程控製)如何意外地催生瞭民用信息技術的早期應用。 第二部分:集成電路與信息爆炸——矽榖神話的誕生 集成電路(IC)的發明,是信息革命的決定性拐點。本部分將聚焦於摩爾定律的非凡預言及其對産業的驅動力。隨著微處理器(CPU)的問世,計算能力以前所未有的速度實現瞭“平民化”。 我們詳細剖析瞭20世紀70年代至80年代,個人電腦(PC)是如何從極客的玩具,一步步成為辦公室和傢庭的必需品。這涉及對用戶界麵(UI)曆史的梳理——從命令行界麵(CLI)到圖形用戶界麵(GUI)的轉變,這不僅是視覺上的升級,更是人機交互哲學的根本性迭代。施樂帕剋研究中心、蘋果和微軟的早期競爭與協作,共同塑造瞭我們今天所理解的“操作體驗”。 此外,本章還將討論早期網絡技術的萌芽,如ARPANET的實驗性階段。探討“分散式網絡”的構想如何對抗中心化的控製風險,以及這種架構思想對後世互聯網設計的深遠影響。我們不會沉溺於技術細節,而是側重於理解這些創新背後的風險投資邏輯、工程師文化和對“信息自由流動”的早期信仰。 第三部分:互聯萬物的時代——互聯網的普及與社會重構 進入90年代,萬維網(World Wide Web)的商業化和標準化,標誌著信息時代進入瞭全民參與階段。本書將深入剖析TCP/IP協議棧如何成為全球信息傳輸的“通用語言”,以及瀏覽器技術如何將復雜的網絡地址轉化為可點擊的超文本鏈接。 這一部分的重點在於“連接”的力量。互聯網不再是信息傳輸的管道,而是新的社會交往、商業交易和文化生産的場域。我們考察瞭早期電子商務的嘗試,以及門戶網站(Portal)在信息過濾和導航中的關鍵角色。同時,我們也警醒地審視瞭網絡原住民一代的崛起,他們對權威信息源的祛魅,以及信息過載問題的初現端倪。 第四部分:移動與在場——隨時隨地的計算與身份的遷徙 進入新世紀,計算設備開始脫離固定的桌麵。智能手機和無綫網絡的普及,將計算能力前所未有地嵌入到人們的日常生活中,實現瞭真正的“無處不在的計算”。 本書探討瞭移動計算對人類行為的重塑:即時通訊如何取代傳統溝通方式;地理位置服務(LBS)如何模糊瞭綫上與綫下的邊界;以及社交媒體平颱的興起,如何改變瞭公共輿論的形成機製。我們關注的焦點是“持續在綫”狀態對個人注意力稀缺性的影響,以及數字身份的構建和維護,如何成為現代生活的重要議題。 第五部分:算法的幽靈與未來迴響——治理、倫理與挑戰 在技術呈指數級增長的今天,我們必須麵對由數據驅動係統帶來的復雜挑戰。本書的最後部分將轉嚮批判性思考。 我們分析瞭自動化決策係統(算法)的普及,它們在金融、招聘甚至司法領域的應用,揭示瞭算法的黑箱問題、偏見固化(Bias Amplification)的風險,以及對社會公平性的潛在威脅。數據安全、隱私保護和網絡主權等議題,不再是技術人員的小範圍討論,而是上升為國傢治理的核心難題。 最後,本書以開放性的視角展望未來——從量子計算的曙光到人機共生的可能性。我們強調,技術的發展不是一個純粹的技術決定論過程,而是人類社會選擇、倫理約束和製度設計的反復博弈結果。理解電子信息時代的“浪潮”如何塑造瞭我們,纔能更清醒地把握未來的“迴響”。 本書特點: 跨學科視角: 結閤瞭技術史、社會學、傳播學和經濟學的理論框架。 強調“為什麼”而非“如何”: 側重於重大技術範式轉變背後的社會動因和哲學反思。 平衡的敘事: 不僅贊揚創新帶來的便利,也深入剖析其帶來的社會撕裂、注意力經濟的負麵效應及倫理睏境。 本書適閤所有對信息時代的發展脈絡、技術與社會關係感興趣的讀者,特彆是政策製定者、人文社科研究者以及希望全麵理解當代世界運作機製的商業人士。

用戶評價

評分

這本書的名字很有吸引力,一看就知道是講大數據的,而且還強調瞭“創新實踐”,這讓我對它充滿瞭好奇。我一直對數據驅動的決策和商業模式很感興趣,總覺得大數據背後隱藏著巨大的能量,能夠改變我們生活的方方麵麵,甚至重塑整個行業。這本書的書名聽起來就像一本能帶我深入瞭解這些潛力的指南,它承諾的“創新實踐”也錶明瞭不會僅僅停留在理論層麵,而是會介紹實際的案例和方法。我期待它能解答我心中關於如何將海量數據轉化為有價值的洞察,如何構建有效的數據分析框架,以及如何利用大數據技術實現業務增長的種種疑問。特彆是“為數據而生”這個詞,總讓我想象著一個以數據為核心驅動力的企業或組織,它們如何圍繞數據構建起整個運作體係,又是如何在這種體係下不斷湧現齣新的想法和解決方案。這本書或許能提供一些啓發,讓我看到大數據在不同領域的具體應用,以及那些敢於擁抱數據、利用數據創造價值的先行者們的故事。我希望它能給我帶來一些實用的乾貨,讓我能夠將書中的知識應用到我自己的工作或學習中,提升我對大數據的理解和運用能力。

評分

這本書給我最大的感受是,大數據並非僅僅是技術問題,更是一種思維方式和戰略方嚮。它讓我意識到,那些在激烈競爭中脫穎而齣的企業,往往是那些能夠真正理解並善於利用數據來指導決策、優化流程、創造價值的組織。書中關於“數據文化”的構建和“數據素養”的提升的章節,對我觸動很大。它強調瞭在一個組織內部,如何讓每個人都具備數據意識,如何鼓勵數據驅動的溝通和協作,這對於推動整個組織嚮更高級彆的智能化邁進至關重要。我喜歡它在討論如何進行數據治理和數據質量管理時,那種循序漸進的指導,讓我明白構建可靠的數據基礎是釋放大數據潛力的前提。而且,書中對數據可視化在溝通和決策中的作用的強調,也讓我意識到瞭清晰、直觀地呈現數據的重要性。總而言之,這本書不僅提供瞭關於大數據技術的知識,更重要的是,它引領我進入瞭一個全新的視角,讓我看到瞭數據在塑造未來商業和社會方麵的無限可能性。

評分

讀完這本書,我腦海中關於“大數據”的模糊概念,頓時變得清晰而具象。它就像一幅精心繪製的藍圖,詳細展示瞭大數據技術如何被運用到各種實際場景中,並且如何創造齣令人驚嘆的價值。我尤其對書中關於“數據資産化”和“數據價值釋放”的討論印象深刻。它不再將數據僅僅視為一種資源,而是將其提升到瞭“資産”的高度,強調瞭如何通過有效的管理和運營,讓數據發揮齣最大的潛力。書中的案例涵蓋瞭從零售、金融到醫療、城市管理等多個領域,讓我看到瞭大數據在不同行業中的多樣化應用。例如,它在描述如何利用交通大數據來優化城市交通流量時,那種精妙的算法和實時的響應機製,讓我對“智慧城市”有瞭更直觀的理解。此外,書中還探討瞭數據安全、隱私保護等重要議題,這讓我意識到,在追求數據價值的同時,也需要關注與之相關的倫理和社會責任。這種全麵而深入的探討,讓我覺得這本書不僅僅是一本技術手冊,更是一本關於大數據時代未來發展趨勢的深刻洞察。

評分

讀完這本書,我感覺自己像是被注入瞭一劑強心劑,對未來的技術發展有瞭更清晰、更積極的認知。書中對大數據應用的描繪,已經不僅僅是簡單的統計和分析,而是上升到瞭“智能”的層麵,讓我深刻體會到數據背後蘊含的巨大潛力。我尤其欣賞作者在描述不同行業案例時,那種深入淺齣的講解方式,即使是對於非技術背景的讀者,也能輕鬆理解其中的邏輯和價值。例如,它在某個章節中提到的關於個性化推薦的演進,從最初的簡單協同過濾,到如今基於深度學習的復雜模型,其背後所依賴的數據維度、算法復雜度以及最終達到的精準度,都讓我為之驚嘆。這本書讓我意識到,大數據並非遙不可及的專業領域,而是已經滲透到我們日常生活的方方麵麵,從我們看到的廣告,到我們使用的APP,再到我們享受的服務,背後都有大數據在默默地發揮作用。更重要的是,它鼓勵讀者思考如何利用這些數據來創造新的商業機會,如何通過數據洞察來優化用戶體驗,甚至如何通過數據分析來預測未來趨勢。這種前瞻性的視角,讓我感到非常振奮,也促使我開始反思自己所處的行業,以及大數據可能帶來的顛覆性變革。

評分

這本書簡直就是一本在大數據領域“實戰”的寶典,它沒有過多地糾纏於晦澀的理論模型,而是直接切入“怎麼做”的問題,這對於我這種急切想看到實際成果的人來說,簡直是雪中送炭。我最喜歡的部分是書中對一些典型企業的數據創新案例的深度剖析。它不僅列舉瞭成功案例,更重要的是,它會去挖掘這些案例背後的驅動因素,分析它們是如何從零開始構建數據能力,又是如何在實踐中不斷迭代和優化的。書中對數據驅動的産品開發流程、數據驅動的營銷策略、以及數據驅動的客戶服務模式的講解,都非常具體,讓我能夠清晰地看到數據在企業運營的各個環節中扮演的角色。例如,它在探討如何通過數據分析來降低客戶流失率時,不僅給齣瞭分析模型,還分享瞭具體的 A/B 測試方法和結果解讀。這種接地氣的講解方式,讓我覺得這本書的作者真的是一位身經百戰的實乾傢,他所分享的經驗都是經過市場檢驗的真知灼見。閱讀這本書,我感覺自己不再是紙上談兵,而是有瞭一個可以模仿和藉鑒的路綫圖,讓我對如何在工作中應用大數據技術充滿瞭信心。

評分

大數據方麵的好書!周濤齣品。值得一學。

評分

圖書不錯,值得推薦,關鍵還是在於看!

評分

非常好的書,手動點贊!!!

評分

很棒的書,很好吃,下迴迴來買吧哦

評分

非常感謝京東商城給予的優質的服務,從倉儲管理、物流配送等各方麵都是做的非常好的。送貨及時,配送員也非常的熱情,有時候不方便收件的時候,也安排時間另行配送。同時京東商城在售後管理上也非常好的,以解客戶憂患,排除萬難。給予我們非常好的購物體驗。 Thank you very much for the excellent service provided by Jingdong mall, and it is very good to do in warehouse management, logistics, distribution and so on. Delivery in a timely manner, distribution staff is also very enthusiastic, and sometimes inconvenient to receive the time, but also arranged for time to be delivered. At the same time in the mall management Jingdong cust

評分

還不錯的一本書,深入淺齣,講的還算中規中矩~~

評分

大數據方麵的好書!周濤齣品。值得一學。

評分

紙張沒有異味,印刷清晰。

評分

《數據的本質》,一部引領企業與個人破局智能商業時代的落地之作。大數據4大核心本質、智能商業時代核心數字經濟引擎搭建之道、大數據變現5大場景、區塊鏈、人工智能、Fintech、新零售……智能商業新趨勢一網打盡!既是互聯網從業者的案頭必備書,也是管理層的決策寶典。

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有