作 者:(美)麦金尼;唐学韬 等 定 价:89 出 版 社:机械工业出版社 出版日期:2014年01月01日 页 数:464 装 帧:平装 ISBN:9787111436737 ●前言1
●第1章 准备工作 5
●本书主要内容 5
●为什么要使用Python进行数据分析 6
●重要的Python库 7
●安装和设置 10
●社区和研讨会 16
●使用本书 16
●致谢 18
●第2章 引言 20
●来自bit.ly的1.usa.gov数据 21
●MovieLens 1M数据集 29
●1880—2010年间全美婴儿姓名 35
●小结及展望 47
●第3章 IPython:一种交互式计算和开发环境 48
●IPython基础 49
●内省 51
●使用命令历史 60
●与操作系统交互 63
●软件开发工具 66
●部分目录
内容简介
由于作者麦金尼是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境。
《利用Python进行数据分析》:
学习NumPy(NumericalPython)的基础和不错知识。
从pandas库的数据分析工具开始。
利用高性能工具对数据进行加载、清理、转换、合并以及重塑。
利用matpIotlib创建散点图以及静态或交互式的可视化结果。
利用pandas的groupby功能对数据集进行切片、切块和汇总操作。
处理各种各样的时间序列数据。
通过详细的案例学习如何解决Web分析、社会科学、金融学以及经济学等领域的问题。 (美)麦金尼;唐学韬 等 WesMcKinney,资历数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区认可的人物之一。开发了用于数据分析的有名开源Python库---pandas,广获用户好评。在创建LambdaFoundry(一家致力于企业数据分析的公司)之前,他曾是AQRCapitalManagement的定量分析师。 靠前章
准备工作
本书主要内容
本书讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。本书重点介绍了用于高效解决各种数据分析问题的Python语言和库。本书没有阐述如何利用Python实现具体的分析方法。
当书中出现“数据”时,究竟指的是什么呢?主要指的是结构化数据(structureddata),这个故意含糊其辞的术语代指了所有通用格式的数据,例如:
多维数组等
利用Python进行数据分析 电子书 下载 mobi epub pdf txt