基本信息 | |||
书 名 | R语言实战(第2版) | ||
组 编 | [美]卡巴科弗(Robert I. Kabacoff) 著 | 出版社 | 人民邮电出版社 |
出版时间 | 2016年5月 | 版 次 | 第2版 |
印刷时间 | 2016年5月 | 印 次 | 第1次 |
字 数 | 841 千字 | 页 数 | 534页 |
I S B N | 9787115420572 | 开 本 | 16 开 |
装 帧 | 平装 | 重 量 |
|
原 价 | 99.00元 | ||
目录简介 | |||
第一部分 入门
第1章 R语言介绍 3
1.1 为何要使用R 4 1.2 R的获取和安装 6 1.3 R的使用 6 1.3.1 新手上路 7 1.3.2 获取帮助 10 1.3.3 工作空间 10 1.3.4 输入和输出 12 1.4 包 13 1.4.1 什么是包 14 1.4.2 包的安装 14 1.4.3 包的载入 14 1.4.4 包的使用方法 14 1.5 批处理 15 1.6 将输出用为输入:结果的重用 16 1.7 处理大数据集 16 1.8 示例实践 16 1.9 小结 18 第2章 创建数据集 19 2.1 数据集的概念 19 2.2 数据结构 20 2.2.1 向量 21 2.2.2 矩阵 22 2.2.3 数组 23 2.2.4 数据框 24 2.2.5 因子 27 2.2.6 列表 28 2.3 数据的输入 30 2.3.1 使用键盘输入数据 31 2.3.2 从带分隔符的文本文件导入数据 32 2.3.3 导入Excel数据 35 2.3.4 导入XML数据 36 2.3.5 从网页抓取数据 36 2.3.6 导入SPSS数据 36 2.3.7 导入SAS数据 37 2.3.8 导入Stata数据 37 2.3.9 导入NetCDF数据 38 2.3.10 导入HDF5数据 38 2.3.11 访问数据库管理系统 38 2.3.12 通过Stat/Transfer导入数据 40 2.4 数据集的标注 40 2.4.1 变量标签 40 2.4.2 值标签 41 2.5 处理数据对象的实用函数 41 2.6 小结 42 第3章 图形初阶 43 3.1 使用图形 43 3.2 一个简单的例子 45 3.3 图形参数 46 3.3.1 符号和线条 47 3.3.2 颜色 49 3.3.3 文本属性 50 3.3.4 图形尺寸与边界尺寸 51 3.4 添加文本、自定义坐标轴和图例 53 3.4.1 标题 54 3.4.2 坐标轴 54 3.4.3 参考线 56 3.4.4 图例 57 3.4.5 文本标注 58 3.4.6 数学标注 60 3.5 图形的组合 61 3.6 小结 67 第4章 基本数据管理 68 4.1 一个示例 68 4.2 创建新变量 70 4.3 变量的重编码 71 4.4 变量的重命名 72 4.5 缺失值 74 4.5.1 重编码某些值为缺失值 74 4.5.2 在分析中排除缺失值 75 4.6 日期值 76 4.6.1 将日期转换为字符型变量 77 4.6.2 更进一步 78 4.7 类型转换 78 4.8 数据排序 79 4.9 数据集的合并 79 4.9.1 向数据框添加列 79 4.9.2 向数据框添加行 80 4.10 数据集取子集 80 4.10.1 选入(保留)变量 80 4.10.2 剔除(丢弃)变量 81 4.10.3 选入观测 82 4.10.4 subset()函数 82 4.10.5 随机抽样 83 4.11 使用SQL语句操作数据框 83 4.12 小结 84 第5章 高级数据管理 85 5.1 一个数据处理难题 85 5.2 数值和字符处理函数 86 5.2.1 数学函数 86 5.2.2 统计函数 87 5.2.3 概率函数 90 5.2.4 字符处理函数 92 5.2.5 其他实用函数 94 5.2.6 将函数应用于矩阵和数据框 95 5.3 数据处理难题的一套解决方案 96 5.4 控制流 100 5.4.1 重复和循环 100 5.4.2 条件执行 101 5.5 用户自编函数 102 5.6 整合与重构 104 5.6.1 转置 104 5.6.2 整合数据 105 5.6.3 reshape2包 106 5.7 小结 108 第二部分 基本方法 第6章 基本图形 110 6.1 条形图 110 6.1.1 简单的条形图 111 6.1.2 堆砌条形图和分组条形图 112 6.1.3 均值条形图 113 6.1.4 条形图的微调 114 6.1.5 棘状图 115 6.2 饼图 116 6.3 直方图 118 6.4 核密度图 120 6.5 箱线图 122 6.5.1 使用并列箱线图进行跨组比较 123 6.5.2 小提琴图 125 6.6 点图 127 6.7 小结 129 第7章 基本统计分析 130 7.1 描述性统计分析 131 7.1.1 方法云集 131 7.1.2 更多方法 132 7.1.3 分组计算描述性统计量 134 7.1.4 分组计算的扩展 135 7.1.5 结果的可视化 137 7.2 频数表和列联表 137 7.2.1 生成频数表 137 7.2.2 独立性检验 143 7.2.3 相关性的度量 144 7.2.4 结果的可视化 145 7.3 相关 145 7.3.1 相关的类型 145 7.3.2 相关性的显著性检验 147 7.3.3 相关关系的可视化 149 7.4 t检验 149 7.4.1 独立样本的t检验 150 7.4.2 非独立样本的t检验 151 7.4.3 多于两组的情况 151 7.5 组间差异的非参数检验 152 7.5.1 两组的比较 152 7.5.2 多于两组的比较 153 7.6 组间差异的可视化 155 7.7 小结 155 第三部分 中级方法 第8章 回归 158 8.1 回归的多面性 159 8.1.1 OLS回归的适用情境 159 8.1.2 基础回顾 160 8.2 OLS 回归 160 8.2.1 用lm()拟合回归模型 161 8.2.2 简单线性回归 163 8.2.3 多项式回归 164 8.2.4 多元线性回归 167 8.2.5 有交互项的多元线性回归 169 8.3 回归诊断 171 8.3.1 标准方法 172 8.3.2 改进的方法 175 8.3.3 线性模型假设的综合验证 181 8.3.4 多重共线性 181 8.4 异常观测值 182 8.4.1 离群点 182 8.4.2 高杠杆值点 182 8.4.3 强影响点 184 8.5 改进措施 186 8.5.1 删除观测点 186 8.5.2 变量变换 187 8.5.3 增删变量 188 8.5.4 尝试其他方法 188 8.6 选择“最佳”的回归模型 189 8.6.1 模型比较 189 8.6.2 变量选择 190 8.7 深层次分析 193 8.7.1 交叉验证 193 8.7.2 相对重要性 195 8.8 小结 197 第9章 方差分析 198 9.1 术语速成 198 9.2 ANOVA模型拟合 201 9.2.1 aov()函数 201 9.2.2 表达式中各项的顺序 202 9.3 单因素方差分析 203 9.3.1 多重比较 204 9.3.2 评估检验的假设条件 206 9.4 单因素协方差分析 208 9.4.1 评估检验的假设条件 209 9.4.2 结果可视化 210 9.5 双因素方差分析 211 9.6 重复测量方差分析 214 9.7 多元方差分析 217 9.7.1 评估假设检验 218 9.7.2 稳健多元方差分析 220 9.8 用回归来做ANOVA 220 9.9 小结 222 第10章 功效分析 223 10.1 假设检验速览 223 10.2 用pwr包做功效分析 225 10.2.1 t检验 226 10.2.2 方差分析 228 10.2.3 相关性 228 10.2.4 线性模型 229 10.2.5 比例检验 230 10.2.6 卡方检验 231 10.2.7 在新情况中选择合适的效应值 232 10.3 绘制功效分析图形 233 10.4 其他软件包 235 10.5 小结 236 第11章 中级绘图 237 11.1 散点图 238 11.1.1 散点图矩阵 240 11.1.2 高密度散点图 242 11.1.3 三维散点图 244 11.1.4 旋转三维散点图 247 11.1.5 气泡图 248 11.2 折线图 250 11.3 相关图 253 11.4 马赛克图 258 11.5 小结 260 第12章 重抽样与自助法 261 12.1 置换检验 261 12.2 用coin包做置换检验 263 12.2.1 独立两样本和K样本检验 264 12.2.2 列联表中的独立性 266 12.2.3 数值变量间的独立性 266 12.2.4 两样本和K样本相关性检验 267 12.2.5 深入探究 267 12.3 lmPerm包的置换检验 267 12.3.1 简单回归和多项式回归 268 12.3.2 多元回归 269 12.3.3 单因素方差分析和协方差分析 270 12.3.4 双因素方差分析 271 12.4 置换检验点评 271 12.5 自助法 272 12.6 boot包中的自助法 272 12.6.1 对单个统计量使用自助法 274 12.6.2 多个统计量的自助法 276 12.7 小结 278 第四部分 高级方法 第13章 广义线性模型 280 13.1 广义线性模型和glm()函数 281 13.1.1 glm()函数 281 13.1.2 连用的函数 282 13.1.3 模型拟合和回归诊断 283 13.2 Logistic回归 284 13.2.1 解释模型参数 286 13.2.2 评价预测变量对结果概率的影响 287 13.2.3 过度离势 288 13.2.4 扩展 289 13.3 泊松回归 289 13.3.1 解释模型参数 291 13.3.2 过度离势 292 13.3.3 扩展 294 13.4 小结 295 第14章 主成分分析和因子分析 296 14.1 R中的主成分和因子分析 297 14.2 主成分分析 298 14.2.1 判断主成分的个数 298 14.2.2 提取主成分 300 14.2.3 主成分旋转 303 14.2.4 获取主成分得分 304 14.3 探索性因子分析 305 14.3.1 判断需提取的公共因子数 306 14.3.2 提取公共因子 307 14.3.3 因子旋转 308 14.3.4 因子得分 312 14.3.5 其他与EFA相关的包 312 14.4 其他潜变量模型 312 14.5 小结 313 第15章 时间序列 315 15.1 在R 中生成时序对象 317 15.2 时序的平滑化和季节性分解 319 15.2.1 通过简单移动平均进行平滑处理 319 15.2.2 季节性分解 321 15.3 指数预测模型 326 15.3.1 单指数平滑 326 15.3.2 Holt 指数平滑和Holt-Winters指数平滑 329 15.3.3 ets()函数和自动预测 331 15.4 ARIMA预测模型 333 15.4.1 概念介绍 333 15.4.2 ARMA和ARIMA模型 334 15.4.3 ARIMA的自动预测 339 15.5 延伸阅读 340 15.6 小结 340 第16章 聚类分析 342 16.1 聚类分析的一般步骤 343 16.2 计算距离 344 16.3 层次聚类分析 345 16.4 划分聚类分析 350 16.4.1 K均值聚类 350 16.4.2 围绕中心点的划分 354 16.5 避免不存在的类 356 16.6 小结 359 第17章 分类 360 17.1 数据准备 361 17.2 逻辑回归 362 17.3 决策树 363 17.3.1 经典决策树 364 17.3.2 条件推断树 366 17.4 随机森林 368 17.5 支持向量机 370 17.6 选择预测效果最好的解 374 17.7 用rattle包进行数据挖掘 376 17.8 小结 381 第18章 处理缺失数据的高级方法 382 18.1 处理缺失值的步骤 383 18.2 识别缺失值 384 18.3 探索缺失值模式 385 18.3.1 列表显示缺失值 385 18.3.2 图形探究缺失数据 386 18.3.3 用相关性探索缺失值 389 18.4 理解缺失数据的来由和影响 391 18.5 理性处理不完整数据 391 18.6 完整实例分析(行删除) 392 18.7 多重插补 394 18.8 处理缺失值的其他方法 397 18.8.1 成对删除 398 18.8.2 简单(非随机)插补 398 18.9 小结 399 第五部分 技能拓展 第19章 使用ggplot2进行高级绘图 402 19.1 R 中的四种图形系统 402 19.2 ggplot2包介绍 403 19.3 用几何函数指定图的类型 407 19.4 分组 411 19.5 刻面 413 19.6 添加光滑曲线 416 19.7 修改ggplot2图形的外观 418 19.7.1 坐标轴 419 19.7.2 图例 420 19.7.3 标尺 421 19.7.4 主题 423 19.7.5 多重图 425 19.8 保存图形 426 19.9 小结 426 第20章 高级编程 427 20.1 R语言回顾 427 20.1.1 数据类型 427 20.1.2 控制结构 433 20.1.3 创建函数 436 20.2 环境 437 20.3 面向对象的编程 439 20.3.1 泛型函数 439 20.3.2 S3模型的限制 441 20.4 编写有效的代码 442 20.5 调试 445 20.5.1 常见的错误来源 445 20.5.2 调试工具 446 20.5.3 支持调试的会话选项 448 20.6 深入学习 451 20.7 小结 451 第21章 创建包 452 21.1 非参分析和npar 包 453 21.2 开发包 457 21.2.1 计算统计量 457 21.2.2 打印结果 460 21.2.3 汇总结果 461 21.2.4 绘制结果 463 21.2.5 添加样本数据到包 464 21.3 创建包的文档 466 21.4 建立包 467 21.5 深入学习 471 21.6 小结 471 第22章 创建动态报告 472 22.1 用模版生成报告 474 22.2 用R和Markdown创建动态报告 475 22.3 用R和LaTeX创建动态报告 480 22.4 用R和Open Document创建动态报告 483 22.5 用R和Microsoft Word创建动态报告 485 22.6 小结 489 第23章 使用lattice进行高级绘图 490 23.1 lattice包 490 23.2 调节变量 494 23.3 面板函数 495 23.4 分组变量 498 23.5 图形参数 502 23.6 自定义图形条带 503 23.7 页面布局 504 23.8 深入学习 507 附录A 图形用户界面 508 附录B 自定义启动环境 511 附录C 从R中导出数据 513 附录D R中的矩阵运算 515 附录E 本书中用到的扩展包 517 附录F 处理大数据集 522 附录G 更新R 526 后记:探索R的世界 528 参考文献 530 |
内容简介 | |||
本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近200页内容,介绍数据挖掘、预测性分析和高级编程。 本书适合数据分析人员及R用户学习参考。
|
说实话,我之前尝试过几本R语言的书,但总觉得要么太理论化,要么就是代码堆砌,缺少了逻辑的连贯性和深入的讲解。读起来总是云里雾里,学完之后也记不住多少。这次看到《包邮 R语言实战(第2版)》,尤其是它描述的内容涵盖了“数据结构图形指南”和“大数据处理指”,我有了新的期待。对于我来说,理解数据结构是掌握编程逻辑的关键,而优秀的图形化展示则是数据分析结果呈现的灵魂。如果这本书能够在这两个方面做得出色,能够教会我如何有效地组织和操作数据,如何利用R生成美观且信息量丰富的图表,那将极大地提升我的工作效率。特别是“大数据处理指”这一点,在当今数据爆炸的时代,如何处理海量数据是一个绕不开的话题。如果这本书能给初学者一些关于大数据处理的初步概念和方法,那将非常有价值。
评分我是一个非计算机专业背景的数据分析爱好者,经常在工作中遇到需要处理和分析数据的情况,但往往受限于 Excel 等工具的局限性。听说R语言功能强大,尤其擅长统计分析和数据可视化,所以一直想找一本适合入门的书籍。看到《包邮 R语言实战(第2版)》这本书,感觉它的定位非常准确,涵盖了“数据分析统计”和“数据结构图形指南”这些我最关心的内容。我特别希望这本书能够从零开始,用最通俗易懂的语言,把我从一个完全不懂R的门外汉,变成一个能够独立进行基本数据分析的人。我希望书中能够提供清晰的步骤、丰富的示例代码,并且能够解释代码背后的逻辑,而不是简单地复制粘贴。如果它还能在“大数据处理指”方面给出一些入门级的指导,那更是锦上添花了。毕竟,未来数据只会越来越多,掌握处理大数据的能力会越来越重要。
评分我一直对数据分析这个领域很感兴趣,但苦于没有系统的方法和工具。最近听说R语言在数据科学领域非常流行,所以就想找一本入门的书籍来学习。当我看到《包邮 R语言实战(第2版)》这个书名的时候,就觉得它非常吸引人。首先,“包邮”这个词就让人感到很亲切,意味着购买的便利性。其次,“R语言实战(第2版)”表明它是一本经过市场检验、并且更新过的教程,这对于学习者来说非常重要,因为R语言的版本和生态系统变化很快。更重要的是,“r语言编程入门教程书籍/数据分析统计/数据结构图形指南 大数据处理指”这样的副标题,几乎囊括了我想要学习的所有内容。从基础的编程入门,到数据分析和统计,再到高级的数据结构和图形展示,甚至是大数据处理的指引,这简直是一个全面的R语言学习宝典!我非常看重书籍的实战性,希望这本书能够提供丰富的案例,让我能够学以┣ 边做边学,真正掌握R语言在实际数据分析中的应用。
评分这本书的出版,对于许多R语言初学者来说,无疑是一场及时雨。我当初学习R的时候,真的是摸着石头过河,遇到问题只能自己一点点去查阅官方文档,或者在各种论坛里搜寻零散的解决方案。那时候,一本系统性的、讲解透彻的入门教程是多么的渴望!如今看到《包邮 R语言实战(第2版)》这本书,我仿佛看到了当年那个在代码海洋中挣扎的自己,终于有了指引方向的灯塔。从基础的数据类型、变量的声明,到各种常用的数据结构,再到复杂的统计建模和图形可视化,这本书似乎都覆盖到了。我特别关注的是数据结构和图形指南部分,因为我觉得这是理解数据、分析数据、呈现数据的关键。如果这本书能够将这些概念讲得清晰易懂,并且辅以大量的实例,那么对于那些希望快速掌握R语言核心技能的读者来说,绝对是物超所值。我非常期待这本书在这些方面能够提供深入的见解和实用的技巧,帮助我们少走弯路,高效地完成数据分析任务。
评分作为一名刚开始接触数据科学的在校学生,我对于学习一门强大的编程语言来辅助我的科研和学习有着迫切的需求。R语言因为其在统计学和数据可视化方面的优势,自然成为了我的首选。在浏览各种书籍推荐时,《包邮 R语言实战(第2版)》这本书的书名和副标题吸引了我。尤其是“r语言编程入门教程书籍/数据分析统计/数据结构图形指南 大数据处理指”这些关键词,完全符合我当前的学习需求。我非常期待这本书能够为我打下坚实的R语言编程基础,教会我如何进行有效的数据分析和统计建模,并且在数据结构和图形化展示方面提供深入的指导。对于“大数据处理指”的部分,我也抱有很大的期望,希望能借此了解如何初步接触和处理大规模数据集,为我未来的学习和研究打下良好的基础。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有