学习如何利用R语言洞察、知晓、理解原始数据。本书介绍了R、RStudio以及tidyverse,后者是一组相互配合工作的R包,能够使数据科学更快速、流畅、富有乐趣。本书旨在帮助你尽快地上手数据科学相关的工作,并不要求读者先前具备编程经验。
作者Hadley Wickham和Garrett Grolemund将一步步指导你对数据进行导入、提炼、探索以及建模并发布成果。除了处理数据所需的基本工具,你还将会对数据科学的周期拥有一个完整的、宏观的理解。
学习如何利用R语言洞察、知晓、理解原始数据。
《数据科学:R语言实现(影印版 英文版)》介绍了R、RStudio以及tidyverse,后者是一组相互配合工作的R包,能够使数据科学快速、流畅、富有乐趣。
《数据科学:R语言实现(影印版 英文版)》旨在帮助你尽快地上手数据科学相关的工作,并不要求读者具备编程经验。
《数据科学:R语言实现(影印版 英文版)》Hadley Wickham和Garrett Grolernund将一步步指导你对数据进行导入、提炼、探索以及建模并发布成果。除了处理数据所需的基本工具,你还将会对数据科学的周期拥有一个完整的、宏观的理解。
Hadley Wickham是RStudio的首席科学家以及R基金会成员。他构建了一套使数据科学变得更加快捷、富有乐趣的工具。可以通过其个人网站了解更多的信息:http://hadley.nz。
Garrett Grolemund是一名统计学家、教师以及RStudio的硕士生导师。他还是《Hands-On Programming with R 》(O'Reilly)一书的作者。Garrett的很多授课视频可以在oreilly.com/safari上找到。
“Hadley Wickham是数据科学领域的一位传奇人物,他创造出了一套之前无人想到过的进行数据分析的全新方法。他这本和Garrett Grolemund合著的新书用代码展示了这种新奇的方法,本书可谓是数据分析方面的圣经。” —— Roger D.Peng (约翰?霍普金斯大学布隆博格公共卫生学院生物统计学教授)
Preface
Part I. Explore
1. Data Visualization with ggplot2
Introduction
First Steps
Aesthetic Mappings
Common Problems
Facets
Geometric Objects
Statistical Transformations
Position Adjustments
Coordinate Systems
The Layered Grammar of Graphics
2. Workflow: Basics
Coding Basics
What's in a Name?
Calling Functions
3. Data Transformation with dplyr
Introduction
Filter Rows with filter()
Arrange Rows with arrange()
Select Columns with select()
Add New Variables with mutate()
Grouped Summaries with summarize()
Grouped Mutates (and Filters)
4. W0rkfl0w: Scripts
Running Code
RStudio Diagnostics
5. Exploratory Data Analysis
Introduction
Questions
Variation
Missing Values
Covariation
Patterns and Models
ggplot2 Calls
Learning More
6. Workflow: Projects
What Is Real?
Where Does Your Analysis Live?
Paths and Directories
RStudio Projects
Summary
Part II. Wrangle
7. Tibbles with tibble
Introduction
Creating Tibbles
Tibbles Versus data.frame
Interacting with Older Code
8. Data Import with readr
Introduction
Getting Started
Parsing a Vector
Parsing a File
Writing to a File
Other Types of Data
9. Tidy Data with tidyr
Introduction
Tidy Data
Spreading and Gathering
Separating and Pull
Missing Values
Case Study
Nontidy Data
10. Relational Data with dplyr
Introduction
nycflightsl3
Keys
Mutating loins
Filtering loins
loin Problems
Set Operations
11. Strings with stringr
Introduction
String Basics
Matching Patterns with Regular Expressions
Tools
Other Types of Pattern
Other Uses of Regular Expressions
stringi
12. Factors with forcats
Introduction
Creating Factors
General Social Survey
Modifying Factor Order
Modifying Factor Levels
13. Dates and Times with lubridate
Introduction
Creating Date/Times
Date-Time Components
Time Spans
Time Zones
Part III. Program
14. Pipeswith magrittr
Introduction
Piping Alternatives
When Not to Use the Pipe
Other Tools from magrittr
15. Functions
Introduction
When Should You Write a Function?
Functions Are for Humans and Computers
Conditional Execution
Function Arguments
Return Values
Environment
16. Vectors
Introduction
Vector Basics
Important Types of Atomic Vector
Using Atomic Vectors
Recursive Vectors (Lists)
Attributes
Augmented Vectors
17. Iteration with purrr
Introduction
For Loops
For Loop Variations
For Loops Versus Functionals
The Map Functions
Dealing with Failure
Mapping over Multiple Arguments
Walk
Other Patterns of For Loops
Part IV. Model
18. Model Basics with modelr
Introduction
A Simple Model
Visualizing Models
Formulas and Model Families
Missing Values
Other Model Families
19. Model Building
Introduction
Why Are Low-Quality Diamonds More Expensive?
What Affects the Number of Daily Flights?
Learning More About Models
20. Many Models with purrr and broom
Introduction
gapminder
List-Columns
Creating List-Columns
Simplifying List-Columns
Making Tidy Data with broom
Part V. Communicate
21. R Markdown
Introduction
R Markdown Basics
Text Formatting with Markdown
Code Chunks
Troubleshooting
YAML Header
Learning More
22. Graphics for Communication with ggplot2
Introduction
Label
Annotations
Scales
Zooming
Themes
Saving Your Plots
Learning More
23. R Markdown Formats
Introduction
Output Options
Documents
Notebooks
Presentations
Dashboards
Interactivity
Websites
Other Formats
Learning More
24. R Markdown Workflow
Index
书的厚度让人感觉内容很充实,不过分冗长,每一页都有其实用价值。作为一本参考书,它非常耐读,可以经常翻阅,回顾关键概念和技巧。对我来说,它更像是一个可靠的伙伴,在我遇到数据处理的难题时,总能提供及时的帮助和清晰的指引。
评分我发现这本书的内容组织非常注重实践性,很多例子都是贴近真实工作场景的,这对我解决实际问题帮助很大。它不只是停留在理论层面,而是手把手地教你如何操作,如何构建模型,如何解释结果。这种“干货”满满的感觉,让学习过程充满了成就感。
评分这本书的排版布局很合理,章节划分清晰,从基础概念到高级应用都有涉及。我特别喜欢它在代码示例上的处理方式,不仅仅是给出代码,还配有详细的解释,让我这个初学者也能很容易跟上思路。很多时候,一本好的技术书,光有内容是不够的,排版和讲解的逻辑性才是王道,这本书在这方面做得相当到位。
评分这本书的封面设计挺吸引人的,尤其是那个简洁的蓝色调,感觉很专业。我当初就是被这个封面吸引才决定买的。拿到书的时候,感觉纸张质量不错,印刷也很清晰,这对于一本技术类的书籍来说非常重要,毕竟阅读体验直接影响学习效率。
评分虽然是影印版,但整体阅读起来没有太大障碍,英文原文的表达方式非常地道,对于希望提升英文技术阅读能力的人来说,也是一个不错的辅助工具。有时候,直接阅读原汁原味的英文材料,能更好地理解作者的本意,而不是依赖翻译带来的理解偏差。对于那些想在数据科学领域深入发展的人来说,这是个加分项。
评分本书写的很好,读这本书发现一些之前不太理解的地方,而且解释很好。
评分很好的一本工具书,之前在图书馆看过,这一次买来收藏
评分确实是一本机器学习领域的名著,非常经典!
评分大神的新作品,介绍数据科学与R编程,注定成为经典的一本书!
评分实在是很不错的书,五星推荐
评分不错,质量还可以,很清晰。慢慢看
评分纸质挺好的,希望自己能够坚持看完吧
评分很多大牛推荐的一本书,好好看看
评分在京东买书成了固定模式,质量好,送货快。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有