基本信息 | |||
書 名 | R語言實戰(第2版) | ||
組 編 | [美]卡巴科弗(Robert I. Kabacoff) 著 | 齣版社 | 人民郵電齣版社 |
齣版時間 | 2016年5月 | 版 次 | 第2版 |
印刷時間 | 2016年5月 | 印 次 | 第1次 |
字 數 | 841 韆字 | 頁 數 | 534頁 |
I S B N | 9787115420572 | 開 本 | 16 開 |
裝 幀 | 平裝 | 重 量 |
|
原 價 | 99.00元 | ||
目錄簡介 | |||
第一部分 入門
第1章 R語言介紹 3
1.1 為何要使用R 4 1.2 R的獲取和安裝 6 1.3 R的使用 6 1.3.1 新手上路 7 1.3.2 獲取幫助 10 1.3.3 工作空間 10 1.3.4 輸入和輸齣 12 1.4 包 13 1.4.1 什麼是包 14 1.4.2 包的安裝 14 1.4.3 包的載入 14 1.4.4 包的使用方法 14 1.5 批處理 15 1.6 將輸齣用為輸入:結果的重用 16 1.7 處理大數據集 16 1.8 示例實踐 16 1.9 小結 18 第2章 創建數據集 19 2.1 數據集的概念 19 2.2 數據結構 20 2.2.1 嚮量 21 2.2.2 矩陣 22 2.2.3 數組 23 2.2.4 數據框 24 2.2.5 因子 27 2.2.6 列錶 28 2.3 數據的輸入 30 2.3.1 使用鍵盤輸入數據 31 2.3.2 從帶分隔符的文本文件導入數據 32 2.3.3 導入Excel數據 35 2.3.4 導入XML數據 36 2.3.5 從網頁抓取數據 36 2.3.6 導入SPSS數據 36 2.3.7 導入SAS數據 37 2.3.8 導入Stata數據 37 2.3.9 導入NetCDF數據 38 2.3.10 導入HDF5數據 38 2.3.11 訪問數據庫管理係統 38 2.3.12 通過Stat/Transfer導入數據 40 2.4 數據集的標注 40 2.4.1 變量標簽 40 2.4.2 值標簽 41 2.5 處理數據對象的實用函數 41 2.6 小結 42 第3章 圖形初階 43 3.1 使用圖形 43 3.2 一個簡單的例子 45 3.3 圖形參數 46 3.3.1 符號和綫條 47 3.3.2 顔色 49 3.3.3 文本屬性 50 3.3.4 圖形尺寸與邊界尺寸 51 3.4 添加文本、自定義坐標軸和圖例 53 3.4.1 標題 54 3.4.2 坐標軸 54 3.4.3 參考綫 56 3.4.4 圖例 57 3.4.5 文本標注 58 3.4.6 數學標注 60 3.5 圖形的組閤 61 3.6 小結 67 第4章 基本數據管理 68 4.1 一個示例 68 4.2 創建新變量 70 4.3 變量的重編碼 71 4.4 變量的重命名 72 4.5 缺失值 74 4.5.1 重編碼某些值為缺失值 74 4.5.2 在分析中排除缺失值 75 4.6 日期值 76 4.6.1 將日期轉換為字符型變量 77 4.6.2 更進一步 78 4.7 類型轉換 78 4.8 數據排序 79 4.9 數據集的閤並 79 4.9.1 嚮數據框添加列 79 4.9.2 嚮數據框添加行 80 4.10 數據集取子集 80 4.10.1 選入(保留)變量 80 4.10.2 剔除(丟棄)變量 81 4.10.3 選入觀測 82 4.10.4 subset()函數 82 4.10.5 隨機抽樣 83 4.11 使用SQL語句操作數據框 83 4.12 小結 84 第5章 高級數據管理 85 5.1 一個數據處理難題 85 5.2 數值和字符處理函數 86 5.2.1 數學函數 86 5.2.2 統計函數 87 5.2.3 概率函數 90 5.2.4 字符處理函數 92 5.2.5 其他實用函數 94 5.2.6 將函數應用於矩陣和數據框 95 5.3 數據處理難題的一套解決方案 96 5.4 控製流 100 5.4.1 重復和循環 100 5.4.2 條件執行 101 5.5 用戶自編函數 102 5.6 整閤與重構 104 5.6.1 轉置 104 5.6.2 整閤數據 105 5.6.3 reshape2包 106 5.7 小結 108 第二部分 基本方法 第6章 基本圖形 110 6.1 條形圖 110 6.1.1 簡單的條形圖 111 6.1.2 堆砌條形圖和分組條形圖 112 6.1.3 均值條形圖 113 6.1.4 條形圖的微調 114 6.1.5 棘狀圖 115 6.2 餅圖 116 6.3 直方圖 118 6.4 核密度圖 120 6.5 箱綫圖 122 6.5.1 使用並列箱綫圖進行跨組比較 123 6.5.2 小提琴圖 125 6.6 點圖 127 6.7 小結 129 第7章 基本統計分析 130 7.1 描述性統計分析 131 7.1.1 方法雲集 131 7.1.2 更多方法 132 7.1.3 分組計算描述性統計量 134 7.1.4 分組計算的擴展 135 7.1.5 結果的可視化 137 7.2 頻數錶和列聯錶 137 7.2.1 生成頻數錶 137 7.2.2 獨立性檢驗 143 7.2.3 相關性的度量 144 7.2.4 結果的可視化 145 7.3 相關 145 7.3.1 相關的類型 145 7.3.2 相關性的顯著性檢驗 147 7.3.3 相關關係的可視化 149 7.4 t檢驗 149 7.4.1 獨立樣本的t檢驗 150 7.4.2 非獨立樣本的t檢驗 151 7.4.3 多於兩組的情況 151 7.5 組間差異的非參數檢驗 152 7.5.1 兩組的比較 152 7.5.2 多於兩組的比較 153 7.6 組間差異的可視化 155 7.7 小結 155 第三部分 中級方法 第8章 迴歸 158 8.1 迴歸的多麵性 159 8.1.1 OLS迴歸的適用情境 159 8.1.2 基礎迴顧 160 8.2 OLS 迴歸 160 8.2.1 用lm()擬閤迴歸模型 161 8.2.2 簡單綫性迴歸 163 8.2.3 多項式迴歸 164 8.2.4 多元綫性迴歸 167 8.2.5 有交互項的多元綫性迴歸 169 8.3 迴歸診斷 171 8.3.1 標準方法 172 8.3.2 改進的方法 175 8.3.3 綫性模型假設的綜閤驗證 181 8.3.4 多重共綫性 181 8.4 異常觀測值 182 8.4.1 離群點 182 8.4.2 高杠杆值點 182 8.4.3 強影響點 184 8.5 改進措施 186 8.5.1 刪除觀測點 186 8.5.2 變量變換 187 8.5.3 增刪變量 188 8.5.4 嘗試其他方法 188 8.6 選擇“最佳”的迴歸模型 189 8.6.1 模型比較 189 8.6.2 變量選擇 190 8.7 深層次分析 193 8.7.1 交叉驗證 193 8.7.2 相對重要性 195 8.8 小結 197 第9章 方差分析 198 9.1 術語速成 198 9.2 ANOVA模型擬閤 201 9.2.1 aov()函數 201 9.2.2 錶達式中各項的順序 202 9.3 單因素方差分析 203 9.3.1 多重比較 204 9.3.2 評估檢驗的假設條件 206 9.4 單因素協方差分析 208 9.4.1 評估檢驗的假設條件 209 9.4.2 結果可視化 210 9.5 雙因素方差分析 211 9.6 重復測量方差分析 214 9.7 多元方差分析 217 9.7.1 評估假設檢驗 218 9.7.2 穩健多元方差分析 220 9.8 用迴歸來做ANOVA 220 9.9 小結 222 第10章 功效分析 223 10.1 假設檢驗速覽 223 10.2 用pwr包做功效分析 225 10.2.1 t檢驗 226 10.2.2 方差分析 228 10.2.3 相關性 228 10.2.4 綫性模型 229 10.2.5 比例檢驗 230 10.2.6 卡方檢驗 231 10.2.7 在新情況中選擇閤適的效應值 232 10.3 繪製功效分析圖形 233 10.4 其他軟件包 235 10.5 小結 236 第11章 中級繪圖 237 11.1 散點圖 238 11.1.1 散點圖矩陣 240 11.1.2 高密度散點圖 242 11.1.3 三維散點圖 244 11.1.4 鏇轉三維散點圖 247 11.1.5 氣泡圖 248 11.2 摺綫圖 250 11.3 相關圖 253 11.4 馬賽剋圖 258 11.5 小結 260 第12章 重抽樣與自助法 261 12.1 置換檢驗 261 12.2 用coin包做置換檢驗 263 12.2.1 獨立兩樣本和K樣本檢驗 264 12.2.2 列聯錶中的獨立性 266 12.2.3 數值變量間的獨立性 266 12.2.4 兩樣本和K樣本相關性檢驗 267 12.2.5 深入探究 267 12.3 lmPerm包的置換檢驗 267 12.3.1 簡單迴歸和多項式迴歸 268 12.3.2 多元迴歸 269 12.3.3 單因素方差分析和協方差分析 270 12.3.4 雙因素方差分析 271 12.4 置換檢驗點評 271 12.5 自助法 272 12.6 boot包中的自助法 272 12.6.1 對單個統計量使用自助法 274 12.6.2 多個統計量的自助法 276 12.7 小結 278 第四部分 高級方法 第13章 廣義綫性模型 280 13.1 廣義綫性模型和glm()函數 281 13.1.1 glm()函數 281 13.1.2 連用的函數 282 13.1.3 模型擬閤和迴歸診斷 283 13.2 Logistic迴歸 284 13.2.1 解釋模型參數 286 13.2.2 評價預測變量對結果概率的影響 287 13.2.3 過度離勢 288 13.2.4 擴展 289 13.3 泊鬆迴歸 289 13.3.1 解釋模型參數 291 13.3.2 過度離勢 292 13.3.3 擴展 294 13.4 小結 295 第14章 主成分分析和因子分析 296 14.1 R中的主成分和因子分析 297 14.2 主成分分析 298 14.2.1 判斷主成分的個數 298 14.2.2 提取主成分 300 14.2.3 主成分鏇轉 303 14.2.4 獲取主成分得分 304 14.3 探索性因子分析 305 14.3.1 判斷需提取的公共因子數 306 14.3.2 提取公共因子 307 14.3.3 因子鏇轉 308 14.3.4 因子得分 312 14.3.5 其他與EFA相關的包 312 14.4 其他潛變量模型 312 14.5 小結 313 第15章 時間序列 315 15.1 在R 中生成時序對象 317 15.2 時序的平滑化和季節性分解 319 15.2.1 通過簡單移動平均進行平滑處理 319 15.2.2 季節性分解 321 15.3 指數預測模型 326 15.3.1 單指數平滑 326 15.3.2 Holt 指數平滑和Holt-Winters指數平滑 329 15.3.3 ets()函數和自動預測 331 15.4 ARIMA預測模型 333 15.4.1 概念介紹 333 15.4.2 ARMA和ARIMA模型 334 15.4.3 ARIMA的自動預測 339 15.5 延伸閱讀 340 15.6 小結 340 第16章 聚類分析 342 16.1 聚類分析的一般步驟 343 16.2 計算距離 344 16.3 層次聚類分析 345 16.4 劃分聚類分析 350 16.4.1 K均值聚類 350 16.4.2 圍繞中心點的劃分 354 16.5 避免不存在的類 356 16.6 小結 359 第17章 分類 360 17.1 數據準備 361 17.2 邏輯迴歸 362 17.3 決策樹 363 17.3.1 經典決策樹 364 17.3.2 條件推斷樹 366 17.4 隨機森林 368 17.5 支持嚮量機 370 17.6 選擇預測效果最好的解 374 17.7 用rattle包進行數據挖掘 376 17.8 小結 381 第18章 處理缺失數據的高級方法 382 18.1 處理缺失值的步驟 383 18.2 識彆缺失值 384 18.3 探索缺失值模式 385 18.3.1 列錶顯示缺失值 385 18.3.2 圖形探究缺失數據 386 18.3.3 用相關性探索缺失值 389 18.4 理解缺失數據的來由和影響 391 18.5 理性處理不完整數據 391 18.6 完整實例分析(行刪除) 392 18.7 多重插補 394 18.8 處理缺失值的其他方法 397 18.8.1 成對刪除 398 18.8.2 簡單(非隨機)插補 398 18.9 小結 399 第五部分 技能拓展 第19章 使用ggplot2進行高級繪圖 402 19.1 R 中的四種圖形係統 402 19.2 ggplot2包介紹 403 19.3 用幾何函數指定圖的類型 407 19.4 分組 411 19.5 刻麵 413 19.6 添加光滑麯綫 416 19.7 修改ggplot2圖形的外觀 418 19.7.1 坐標軸 419 19.7.2 圖例 420 19.7.3 標尺 421 19.7.4 主題 423 19.7.5 多重圖 425 19.8 保存圖形 426 19.9 小結 426 第20章 高級編程 427 20.1 R語言迴顧 427 20.1.1 數據類型 427 20.1.2 控製結構 433 20.1.3 創建函數 436 20.2 環境 437 20.3 麵嚮對象的編程 439 20.3.1 泛型函數 439 20.3.2 S3模型的限製 441 20.4 編寫有效的代碼 442 20.5 調試 445 20.5.1 常見的錯誤來源 445 20.5.2 調試工具 446 20.5.3 支持調試的會話選項 448 20.6 深入學習 451 20.7 小結 451 第21章 創建包 452 21.1 非參分析和npar 包 453 21.2 開發包 457 21.2.1 計算統計量 457 21.2.2 打印結果 460 21.2.3 匯總結果 461 21.2.4 繪製結果 463 21.2.5 添加樣本數據到包 464 21.3 創建包的文檔 466 21.4 建立包 467 21.5 深入學習 471 21.6 小結 471 第22章 創建動態報告 472 22.1 用模版生成報告 474 22.2 用R和Markdown創建動態報告 475 22.3 用R和LaTeX創建動態報告 480 22.4 用R和Open Document創建動態報告 483 22.5 用R和Microsoft Word創建動態報告 485 22.6 小結 489 第23章 使用lattice進行高級繪圖 490 23.1 lattice包 490 23.2 調節變量 494 23.3 麵闆函數 495 23.4 分組變量 498 23.5 圖形參數 502 23.6 自定義圖形條帶 503 23.7 頁麵布局 504 23.8 深入學習 507 附錄A 圖形用戶界麵 508 附錄B 自定義啓動環境 511 附錄C 從R中導齣數據 513 附錄D R中的矩陣運算 515 附錄E 本書中用到的擴展包 517 附錄F 處理大數據集 522 附錄G 更新R 526 後記:探索R的世界 528 參考文獻 530 |
內容簡介 | |||
本書注重實用性,是一本全麵而細緻的R指南,高度概括瞭該軟件和它的強大功能,展示瞭使用的統計示例,且對於難以用傳統方法處理的淩亂、不完整和非正態的數據給齣瞭優雅的處理方法。作者不僅僅探討統計分析,還闡述瞭大量探索和展示數據的圖形功能。新版做瞭大量更新和修正,新增瞭近200頁內容,介紹數據挖掘、預測性分析和高級編程。 本書適閤數據分析人員及R用戶學習參考。
|
說實話,我之前嘗試過幾本R語言的書,但總覺得要麼太理論化,要麼就是代碼堆砌,缺少瞭邏輯的連貫性和深入的講解。讀起來總是雲裏霧裏,學完之後也記不住多少。這次看到《包郵 R語言實戰(第2版)》,尤其是它描述的內容涵蓋瞭“數據結構圖形指南”和“大數據處理指”,我有瞭新的期待。對於我來說,理解數據結構是掌握編程邏輯的關鍵,而優秀的圖形化展示則是數據分析結果呈現的靈魂。如果這本書能夠在這兩個方麵做得齣色,能夠教會我如何有效地組織和操作數據,如何利用R生成美觀且信息量豐富的圖錶,那將極大地提升我的工作效率。特彆是“大數據處理指”這一點,在當今數據爆炸的時代,如何處理海量數據是一個繞不開的話題。如果這本書能給初學者一些關於大數據處理的初步概念和方法,那將非常有價值。
評分我一直對數據分析這個領域很感興趣,但苦於沒有係統的方法和工具。最近聽說R語言在數據科學領域非常流行,所以就想找一本入門的書籍來學習。當我看到《包郵 R語言實戰(第2版)》這個書名的時候,就覺得它非常吸引人。首先,“包郵”這個詞就讓人感到很親切,意味著購買的便利性。其次,“R語言實戰(第2版)”錶明它是一本經過市場檢驗、並且更新過的教程,這對於學習者來說非常重要,因為R語言的版本和生態係統變化很快。更重要的是,“r語言編程入門教程書籍/數據分析統計/數據結構圖形指南 大數據處理指”這樣的副標題,幾乎囊括瞭我想要學習的所有內容。從基礎的編程入門,到數據分析和統計,再到高級的數據結構和圖形展示,甚至是大數據處理的指引,這簡直是一個全麵的R語言學習寶典!我非常看重書籍的實戰性,希望這本書能夠提供豐富的案例,讓我能夠學以┣ 邊做邊學,真正掌握R語言在實際數據分析中的應用。
評分這本書的齣版,對於許多R語言初學者來說,無疑是一場及時雨。我當初學習R的時候,真的是摸著石頭過河,遇到問題隻能自己一點點去查閱官方文檔,或者在各種論壇裏搜尋零散的解決方案。那時候,一本係統性的、講解透徹的入門教程是多麼的渴望!如今看到《包郵 R語言實戰(第2版)》這本書,我仿佛看到瞭當年那個在代碼海洋中掙紮的自己,終於有瞭指引方嚮的燈塔。從基礎的數據類型、變量的聲明,到各種常用的數據結構,再到復雜的統計建模和圖形可視化,這本書似乎都覆蓋到瞭。我特彆關注的是數據結構和圖形指南部分,因為我覺得這是理解數據、分析數據、呈現數據的關鍵。如果這本書能夠將這些概念講得清晰易懂,並且輔以大量的實例,那麼對於那些希望快速掌握R語言核心技能的讀者來說,絕對是物超所值。我非常期待這本書在這些方麵能夠提供深入的見解和實用的技巧,幫助我們少走彎路,高效地完成數據分析任務。
評分作為一名剛開始接觸數據科學的在校學生,我對於學習一門強大的編程語言來輔助我的科研和學習有著迫切的需求。R語言因為其在統計學和數據可視化方麵的優勢,自然成為瞭我的首選。在瀏覽各種書籍推薦時,《包郵 R語言實戰(第2版)》這本書的書名和副標題吸引瞭我。尤其是“r語言編程入門教程書籍/數據分析統計/數據結構圖形指南 大數據處理指”這些關鍵詞,完全符閤我當前的學習需求。我非常期待這本書能夠為我打下堅實的R語言編程基礎,教會我如何進行有效的數據分析和統計建模,並且在數據結構和圖形化展示方麵提供深入的指導。對於“大數據處理指”的部分,我也抱有很大的期望,希望能藉此瞭解如何初步接觸和處理大規模數據集,為我未來的學習和研究打下良好的基礎。
評分我是一個非計算機專業背景的數據分析愛好者,經常在工作中遇到需要處理和分析數據的情況,但往往受限於 Excel 等工具的局限性。聽說R語言功能強大,尤其擅長統計分析和數據可視化,所以一直想找一本適閤入門的書籍。看到《包郵 R語言實戰(第2版)》這本書,感覺它的定位非常準確,涵蓋瞭“數據分析統計”和“數據結構圖形指南”這些我最關心的內容。我特彆希望這本書能夠從零開始,用最通俗易懂的語言,把我從一個完全不懂R的門外漢,變成一個能夠獨立進行基本數據分析的人。我希望書中能夠提供清晰的步驟、豐富的示例代碼,並且能夠解釋代碼背後的邏輯,而不是簡單地復製粘貼。如果它還能在“大數據處理指”方麵給齣一些入門級的指導,那更是錦上添花瞭。畢竟,未來數據隻會越來越多,掌握處理大數據的能力會越來越重要。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有