發表於2024-12-16
Python數據分析與數據化運營 計算機與互聯網 書籍|6998727 pdf epub mobi txt 電子書 下載
書[0名0]: | Python數據分析與數據化運營|6998727 |
圖書定價: | 99元 |
圖書作者: | 宋天龍 |
齣版社: | 機械工業齣版社 |
齣版日期: | 2018/1/1 0:00:00 |
ISBN號: | 9787111584605 |
開本: | 16開 |
頁數: | 541 |
版次: | 1-1 |
作者簡介 |
宋天龍(TonySong)[0大0]數據技術專傢,曆任軟通動力集團[0大0]數據研究院數據總監、Webtrekk(德[0國0][0大0]的網站數據分析服務提供[0商0])中[0國0]區技術和谘詢負責人、[0國0]美在綫[0大0]數據中心經理。擅長數據挖掘、建模、分析與運營,精通端到端的數據價值場景設計、業務需求轉換、數據結構梳理、數據建模與[0學0]習,以及數據工程交付。擁有豐富的數據項目工作經驗,參與過集團和企業級數據體係規劃、[0大0]數據産[0品0]開發、網站流量係統建設、網站智能推薦、企業[0大0]數據智能等[0大0]型數據工作項目。參與實施多個客戶案例,包括Webpower、德[0國0]OTTO集團電子[0商0]務(中[0國0])、Esprit中[0國0]、豬八戒網、順豐[0優0]選、樂視[0商0]城、泰康人壽、酒仙網,[0國0]美在綫、迪信通等。著有《網站數據挖掘與分析:係統方[0法0]與[0商0]業實踐》《企業[0大0]數據係統構建實戰:技術、架構、實施與應用》。 |
內容簡介 |
這是一部從實戰角度講解如何利用Python進行數據分析、挖掘和數據化運營的著作,不僅對數據分析的關鍵技術和技巧進行瞭總結,更重要的是對[0會0]員、[0商0][0品0]、流量、內容4個主題的數據化運營進行瞭係統講解。作者是[0國0]內一綫數據分析師和[0大0]數據專傢,在數據分析和數據化運營[0領0]域有近10年的經驗,在業內頗具[0知0][0名0]度和影響力。本書不僅得到瞭宋星、黃成明、宮鑫等14位資深專傢的好[0評0]和推薦,還得到瞭天善智能、中[0國0]統計網等多個數據科[0學0]相關機構的支持和高度認可。全書的內容在邏輯上共分為兩[0大0]部分:部分([0第0]1~4章):Python數據分析與挖掘著重講解瞭Python和數據化運營的基本[0知0]識,以及Python數據獲取(結構化和非結構化)、預處理、分析和挖掘的關鍵技術和經驗。包含11條數據預處理經驗、39個數據預處理[0知0]識點、14個數據分析和挖掘的建模主題。[0第0]二部分([0第0]5~9章):Python數據化運營這是本書的核心,詳細講解瞭[0會0]員運營、[0商0][0品0]運營、流量運營和內容運營4[0大0]主題,以及提升數據化運營價值的方[0法0]。在每個運營主題中都包含瞭基本[0知0]識、[0評0]估指標、應用場景、數據分析模型、數據分析小技巧、數據分析[0大0]實話以及2個綜閤性的應用案例。本書提供案例數據和源代碼(中文注釋)下載,供讀者實操時使用。 |
目錄 |
贊譽 前言 [0第0]1章 Python和數據化運營1 1.1 用Python做數據化運營1 1.1.1 Python是什麼1 1.1.2 數據化運營是什麼2 1.1.3 Python用於數據化運營5 1.2 數據化運營所需的Python相關工具和組件6 1.2.1 Python程序6 1.2.2 Python IDE7 1.2.3 Python[0第0]三方庫8 1.2.4 數據庫和客戶端16 1.2.5 SSH遠程客戶端18 1.3 內容延伸:Python的OCR和TensorFlow18 1.3.1 OCR工具:Tesseract-OCR18 1.3.2 機器[0學0]習框架—TensorFlow19 1.4 個用Python實現的數據化運營分析實例—銷售預測20 1.4.1 案例概述20 1.4.2 案例過程20 1.4.3 案例小結28 1.5 本章小結28 [0第0]2章 數據化運營的數據來源31 2.1 數據化運營的數據來源類型31 2.1.1 數據文件31 2.1.2 數據庫32 2.1.3 API33 2.1.4 流式數據34 2.1.5 外部公開數據34 2.1.6 其他35 2.2 使用Python獲取運營數據35 2.2.1 從文本文件讀取運營數據35 2.2.2 從Excel獲取運營數據46 2.2.3 從關係型數據庫MySQL讀取運營數據48 2.2.4 從非關係型數據庫MongoDB讀取運營數據56 2.2.5 從API獲取運營數據59 2.3 內容延伸:讀取非結構化網頁、文本、圖像、視頻、語音64 2.3.1 從網頁中爬取運營數據64 2.3.2 讀取非結構化文本數據65 2.3.3 讀取圖像數據65 2.3.4 讀取視頻數據68 2.3.5 讀取語音數據70 2.4 本章小結75 [0第0]3章 11條數據化運營不得不[0知0]道的數據預處理經驗76 3.1 數據清洗:缺失值、異常值和重復值的處理76 3.1.1 數據列缺失的4種處理方[0法0]76 3.1.2 不要輕易拋棄異常數據78 3.1.3 數據重復就需要去重嗎79 3.1.4 代碼實操:Python數據清洗81 3.2 將分類數據和順序數據轉換為標誌變量89 3.2.1 分類數據和順序數據是什麼89 3.2.2 運用標誌方[0法0]處理分類和順序數據90 3.2.3 代碼實操:Python標誌轉換90 3.3 [0大0]數據時代的數據降維94 3.3.1 需要數據降維的情況94 3.3.2 基於特徵選擇的降維94 3.3.3 基於維度轉換的降維96 3.3.4 代碼實操:Python數據降維97 3.4 解決樣本類彆分布不均衡的問題100 3.4.1 哪些運營場景中容易齣現樣本不均衡100 3.4.2 通過過抽樣和欠抽樣解決樣本不均衡101 3.4.3 通過正負樣本的懲罰[0權0]重解決樣本不均衡101 3.4.4 通過組閤/集成方[0法0]解決樣本不均衡102 3.4.5 通過特徵選擇解決樣本不均衡102 3.4.6 代碼實操:Python處理樣本不均衡102 3.5 如何解決運營數據源的衝突問題106 3.5.1 為什麼[0會0]齣現多數據源的衝突107 3.5.2 如何應對多數據源的衝突問題109 3.6 數據化運營要抽樣還是全量數據109 3.6.1 什麼時候需要抽樣110 3.6.2 如何進行抽樣110 3.6.3 抽樣需要注意的幾個問題111 3.6.4 代碼實操:Python數據抽樣113 3.7 解決運營數據的共綫性問題116 3.7.1 如何檢驗共綫性117 3.7.2 解決共綫性的5種常用方[0法0]117 3.7.3 代碼實操:Python處理共綫性問題118 3.8 有關相關性分析的混沌120 3.8.1 相關和因果是一迴事嗎120 3.8.2 相關係數低就是不相關嗎121 3.8.3 代碼實操:Python相關性分析121 3.9 標準化,讓運營數據落入相同的範圍122 3.9.1 實現中心化和正態分布的Z-Score122 3.9.2 實現歸一化的Max-Min123 3.9.3 用於稀疏數據的MaxAbs123 3.9.4 針對離群點的RobustScaler123 3.9.5 代碼實操:Python數據標準化處理123 3.10 離散化,對運營數據做邏輯分層126 3.10.1 針對時間數據的離散化127 3.10.2 針對多值離散數據的離散化127 3.10.3 針對連續數據的離散化127 3.10.4 針對連續數據的二值化128 3.10.5 代碼實操:Python數據離散化處理128 3.11 數據處理應該考慮哪些運營業務因素133 3.11.1 考慮固定和突發運營周期133 3.11.2 考慮運營需求的有效性134 3.11.3 考慮交付時要貼閤運營落地場景134 3.11.4 不要忽視業務專傢經驗135 3.11.5 考慮業務需求的變動因素136 3.12 內容延伸:非結構化數據的預處理137 3.12.1 網頁數據解析137 3.12.2 網絡用戶日誌解析144 3.12.3 圖像的基本預處理148 3.12.4 自然語言文本預處理154 3.13 本章小結157 [0第0]4章 跳過運營數據分析和挖掘的“[0大0]坑”159 4.1 聚類分析159 4.1.1 [0當0]心數據異常對聚類結果的影響160 4.1.2 [0超0][0大0]數據量時應該放棄K均值算[0法0]160 4.1.3 聚類不僅是建模的終點,更是重要的中間預處理過程162 4.1.4 高維數據上無[0法0]應用聚類嗎163 4.1.5 如何選擇聚類分析算[0法0]164 4.1.6 代碼實操:Python聚類分析164 4.2 迴歸分析172 4.2.1 注意迴歸自變量之間的共綫性問題172 4.2.2 相關係數、判定係數和迴歸係數之間到底什麼關係172 4.2.3 判定係數是否意味著相應的因果聯係173 4.2.4 注意應用迴歸模型時研究自變量是否産生變化173 4.2.5 如何選擇迴歸分析算[0法0]174 4.2.6 代碼實操:Python迴歸分析174 4.3 分類分析183 4.3.1 防止分類模型的過擬閤問題183 4.3.2 使用關聯算[0法0]做分類分析183 4.3.3 用分類分析來提煉規則、提取變量、處理缺失值184 4.3.4 類彆劃分-分類算[0法0]和聚類算[0法0]都是好手185 4.3.5 如何選擇分類分析算[0法0]186 4.3.6 代碼實操:Python分類分析187 4.4 關聯分析195 4.4.1 頻繁規則不一定是有效規則195 4.4.2 不要被啤酒尿布的故事緊固你的思維196 4.4.3 被忽略的“負相關”模式真的毫無用武之地嗎197 4.4.4 頻繁規則隻能打包組閤應用嗎198 4.4.5 關聯規則的序列模式199 4.4.6 代碼實操:Python關聯分析200 4.5 異常檢測分析206 4.5.1 異常檢測中的“新奇檢測”模式207 4.5.2 將數據異常與業務異常相分離207 4.5.3 麵臨維度災難時,異常檢測可能[0會0]失效208 4.5.4 異常檢測的結果能說明異常嗎208 4.5.5 代碼實操:Python異常檢測分析208 4.6 時間序列分析212 4.6.1 如果有自變量,為什麼還要用時間序列212 4.6.2 時間序列不適閤[0商0]業環境復雜的企業213 4.6.3 時間序列預測的整閤、橫嚮和縱嚮模式214 4.6.4 代碼實操:Python時間序列分析214 4.7 路徑、漏鬥、歸因和熱力圖分析234 4.7.1 不要輕易相信用戶的頁麵訪問路徑237 4.7.2 如何將路徑應用於更多用戶行為模式的挖掘?237 4.7.3 為什麼很多數據都顯示多渠道路徑的價值很小?238 4.7.4 點擊熱力圖真的反映瞭用戶的點擊喜好?239 4.7.5 為什麼歸因分析主要存在於綫上的轉化行為240 4.7.6 漏鬥分析和路徑分析有什麼區彆240 4.8 其他數據分析和挖掘的忠告241 4.8.1 不要忘記數據質量的驗證241 4.8.2 不要忽視數據的落地性242 4.8.3 不要把數據陳列[0當0]作數據結論242 4.8.4 數據結論不要産生於單一指標244 4.8.5 數據分析不要預設價值立場244 4.8.6 不要忽視數據與業務的需求衝突問題245 4.9 內容延伸:非結構化數據的分析與挖掘246 4.9.1 詞頻統計246 4.9.2 詞性標注249 4.9.3 關鍵字提取253 4.9.4 文本聚類255 4.10 本章小結258 [0第0]5章 [0會0]員數據化運營260 5.1 [0會0]員數據化運營概述260 5.2 [0會0]員數據化運營關鍵指標261 5.2.1 [0會0]員整體指標261 5.2.2 [0會0]員營銷指標261 5.2.3 [0會0]員活躍度指標263 5.2.4 [0會0]員價值度指標265 5.2.5 [0會0]員終生價值指標266 5.2.6 [0會0]員異動指標266 5.3 [0會0]員數據化運營應用場景267 5.3.1 [0會0]員營銷267 5.3.2 [0會0]員關懷267 5.4 [0會0]員數據化運營分析模型268 5.4.1 [0會0]員細分模型268 5.4.2 [0會0]員價值度模型269 5.4.3 [0會0]員活躍度模型270 5.4.4 [0會0]員流失預測模型271 5.4.5 [0會0]員特徵分析模型272 5.4.6 營銷響應預測模型273 5.5 [0會0]員數據化運營分析小技巧274 5 Python數據分析與數據化運營 計算機與互聯網 書籍|6998727 下載 mobi epub pdf txt 電子書 Python數據分析與數據化運營 計算機與互聯網 書籍|6998727 pdf epub mobi txt 電子書 下載 用戶評價
評分
評分
評分
評分
評分
評分
評分
評分
評分
類似圖書 點擊查看全場最低價
Python數據分析與數據化運營 計算機與互聯網 書籍|6998727 pdf epub mobi txt 電子書 下載 分享鏈接
去京東購買
去淘寶購買
去噹噹購買
去拼多多購買
相關圖書
|