Python数据分析与挖掘实战 计算机与互联网 书籍|4894338

Python数据分析与挖掘实战 计算机与互联网 书籍|4894338 pdf epub mobi txt 电子书 下载 2025

张良均,王路,谭立云,苏剑林 著
图书标签:
  • Python
  • 数据分析
  • 数据挖掘
  • 实战
  • 计算机
  • 互联网
  • 书籍
  • 编程
  • 机器学习
  • 统计分析
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 互动出版网图书专营店
出版社: 机械工业出版社
ISBN:9787111521235
商品编码:10116982526
丛书名: 大数据技术丛书
出版时间:2016-01-01
页数:335

具体描述

> 书名:  Python数据分析与挖掘实战|4894338
> 图书定价: 69元
> 图书作者: 张良均;王路;谭立云;苏剑林
> 出版社:  机械工业出版社
> 出版日期:  2016/1/1 0:00:00
> ISBN号: 9787111521235
> 开本: 16开
> 页数: 335
> 版次: 1-1
 作者简介
张良均
资深大数据挖掘专家和模式识别专家,高级信息项目管理师,有10多年的大数据挖掘应用、咨询和培训经验。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学、华南师范大学、华南农业大学、贵州师范学院、韩山师范学院、广东技术师范学院兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》《R语言数据分析与挖掘实战》等畅销书。
 内容简介
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。
本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。
基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。
实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。
 目录

前 言
基 础 篇
第1章 数据挖掘基础2
1.1 某知名连锁餐饮企业的困惑2
1.2 从餐饮服务到数据挖掘3
1.3 数据挖掘的基本任务4
1.4 数据挖掘建模过程4
1.4.1 定义挖掘目标4
1.4.2 数据取样5
1.4.3 数据探索6
1.4.4 数据预处理7
1.4.5 挖掘建模7
1.4.6 模型评价7
1.5 常用的数据挖掘建模工具7
1.6 小结9
第2章 Python数据分析简介10
2.1 搭建Python开发平台12
2.1.1 所要考虑的问题12
2.1.2 基础平台的搭建12
2.2 Python使用入门13
2.2.1 运行方式14
2.2.2 基本命令15
2.2.3 数据结构17
2.2.4 库的导入与添加20
2.3 Python数据分析工具22
2.3.1 Numpy23
2.3.2 Scipy24
2.3.3 Matplotlib24
2.3.4 Pandas26
2.3.5 StatsModels27
2.3.6 Scikit-Learn28
2.3.7 Keras29
2.3.8 Gensim30
2.4 配套资源使用设置31
2.5 小结32
第3章 数据探索33
3.1 数据质量分析33
3.1.1 缺失值分析34
3.1.2 异常值分析34
3.1.3 一致性分析37
3.2 数据特征分析37
3.2.1 分布分析37
3.2.2 对比分析40
3.2.3 统计量分析41
3.2.4 周期性分析44
3.2.5 贡献度分析45
3.2.6 相关性分析47
3.3 Python主要数据探索函数50
3.3.1 基本统计特征函数50
3.3.2 拓展统计特征函数53
3.3.3 统计作图函数54
3.4 小结59
第4章 数据预处理60
4.1 数据清洗60
4.1.1 缺失值处理60
4.1.2 异常值处理64
4.2 数据集成64
4.2.1 实体识别64
4.2.2 冗余属性识别65
4.3 数据变换65
4.3.1 简单函数变换65
4.3.2 规范化66
4.3.3 连续属性离散化68
4.3.4 属性构造70
4.3.5 小波变换71
4.4 数据规约74
4.4.1 属性规约74
4.4.2 数值规约77
4.5 Python主要数据预处理函数80
4.6 小结81
第5章 挖掘建模83
5.1 分类与预测83
5.1.1 实现过程83
5.1.2 常用的分类与预测算法84
5.1.3 回归分析85
5.1.4 决策树89
5.1.5 人工神经网络95
5.1.6 分类与预测算法评价100
5.1.7 Python分类预测模型特点103
5.2 聚类分析104
5.2.1 常用聚类分析算法104
5.2.2 K-Means聚类算法105
5.2.3 聚类分析算法评价111
5.2.4 Python主要聚类分析算法111
5.3 关联规则113
5.3.1 常用关联规则算法114
5.3.2 Apriori算法114
5.4 时序模式119
5.4.1 时间序列算法120
5.4.2 时间序列的预处理120
5.4.3 平稳时间序列分析122
5.4.4 非平稳时间序列分析124
5.4.5 Python主要时序模式算法132
5.5 离群点检测134
5.5.1 离群点检测方法135
5.5.2 基于模型的离群点检测方法136
5.5.3 基于聚类的离群点检测方法138
5.6 小结141
实 战 篇
第6章 电力窃漏电用户自动识别144
6.1 背景与挖掘目标144
6.2 分析方法与过程147
6.2.1 数据抽取148
6.2.2 数据探索分析148
6.2.3 数据预处理151
6.2.4 构建专家样本156
6.2.5 模型构建157
6.3 上机实验161
6.4 拓展思考162
6.5 小结163
第7章 航空公司客户价值分析164
7.1 背景与挖掘目标164
7.2 分析方法与过程166
7.2.1 数据抽取168
7.2.2 数据探索分析168
7.2.3 数据预处理169
7.2.4 模型构建173
7.3 上机实验177
7.4 拓展思考178
7.5 小结179
第8章 中医证型关联规则挖掘180
8.1 背景与挖掘目标180
8.2 分析方法与过程181
8.2.1 数据获取183
8.2.2 数据预处理186
8.2.3 模型构建190
8.3 上机实验193
8.4 拓展思考194
8.5 小结194
第9章 基于水色图像的水质评价195
9.1 背景与挖掘目标195
9.2 分析方法与过程195
9.2.1 数据预处理197
9.2.2 模型构建199
9.2.3 水质评价201
9.3 上机实验202
9.4 拓展思考202
9.5 小结203
第10章 家用电器用户行为分析与事件识别204
10.1 背景与挖掘目标204
10.2 分析方法与过程205
10.2.1 数据抽取206
10.2.2 数据探索分析207
10.2.3 数据预处理207
10.2.4 模型构建217
10.2.5 模型检验219
10.3 上机实验220
10.4 拓展思考221
10.5 小结222
第11章 应用系统负载分析与磁盘容量预测223
11.1 背景与挖掘目标223
11.2 分析方法与过程225
11.2.1 数据抽取226
11.2.2 数据探索分析226
11.2.3 数据预处理227
11.2.4 模型构建229
11.3 上机实验235
11.4 拓展思考236
11.5 小结237
第12章 电子商务网站用户行为分析及服务推荐238
12.1 背景与挖掘目标238
12.2 分析方法与过程240
12.2.1 数据抽取242
12.2.2 数据探索分析244
12.2.3 数据预处理251
12.2.4 模型构建256
12.3 上机实验266
12.4 拓展思考267
12.5 小结269
第13章 财政收入影响因素分析及预测模型270
13.1 背景与挖掘目标270
13.2 分析方法与过程272
13.2.1 灰色预测与神经网络的组合模型273
13.2.2 数据探索分析274
13.2.3 模型构建277
13.3 上机实验294
13.4 拓展思考295
13.5 小结296
第14章 基于基站定位数据的商圈分析297
14.1 背景与挖掘目标297
14.2 分析方法与过程299
14.2.1 数据抽取299
14.2.2 数据探索分析299
14.2.3 数据预处理301
14.2.4 模型构建304
14.3 上机实验308
14.4 拓展思考309
14.5 小结309
第15章 电商产品评论数据情感分析310
15.1 背景与挖掘目标310
15.2 分析方法与过程310
15.2.1 评论数据采集311
15.2.2 评论预处理314
15.2.3 文本评论分词320
15.2.4 模型构建320
15.3 上机实验333
15.4 拓展思考334
15.5 小结335
参考文献336

 编辑推荐
10余位数据挖掘领域专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。
从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强

《Python数据分析与挖掘实战 计算机与互联网 书籍|4894338》 探索数据世界的奥秘,解锁商业价值的钥匙 在信息爆炸的时代,数据已成为企业决策、科学研究乃至个人生活不可或缺的核心要素。如何从海量数据中提取有价值的信息,如何利用这些信息洞察趋势、预测未来,已成为衡量个人和组织竞争力的重要标准。本书,并非聚焦于某一本具体的书籍,而是旨在为您构建一个全面的、深入的数据分析与挖掘知识体系,为您打开一扇通往数据世界的大门,让您掌握驾驭数据的强大能力。 本书将带领您踏上一段系统而详实的学习之旅,从基础概念的建立,到高级技术的掌握,再到实际应用的落地,全程贯穿清晰的逻辑、丰富的案例以及实用的技巧。我们深知,数据分析的魅力在于其强大的实践性和广泛的应用前景,因此,本书的编写理念始终围绕“学以致用”,力求让每一位读者都能在掌握理论知识的同时,切实感受到数据驱动的巨大力量。 第一篇:数据分析与挖掘的基石—— Python入门与数据处理 在数据分析的征途上,Python凭借其简洁的语法、丰富的库以及活跃的社区,已成为事实上的标准语言。本书将从零开始,为您构建扎实的Python基础。 Python语言基础精讲: 我们将为您讲解Python的核心概念,包括变量、数据类型、运算符、控制流(条件语句、循环语句)、函数、类与对象等。您将学会如何编写高效、可读性强的Python代码,为后续的数据处理和分析打下坚实基础。 数据结构与算法: 理解常见的数据结构(如列表、元组、字典、集合)和基础算法(如排序、搜索)是优化代码性能的关键。本书将深入浅出地介绍这些内容,帮助您更好地组织和操作数据。 NumPy:科学计算的基石: NumPy是Python科学计算的核心库,提供了强大的N维数组对象和用于数组计算的函数。您将学习如何创建、操作和索引NumPy数组,进行向量化计算,以及利用其广播机制实现高效的数值计算。 Pandas:数据处理的瑞士军刀: Pandas库是数据分析的利器,其核心是DataFrame和Series对象,提供了强大的数据清洗、转换、合并、重塑和分组聚合功能。本书将详细讲解Pandas的使用,包括读取和写入各种格式的数据(CSV、Excel、SQL数据库等),处理缺失值、重复值,进行数据筛选、排序、分组,以及数据合并与连接操作。您将学会如何像处理表格一样轻松处理和操作数据。 数据可视化基础:Matplotlib与Seaborn: 数据可视化是将抽象数据转化为直观图表的过程,是理解数据模式、发现异常值、沟通分析结果的关键。本书将介绍Matplotlib库,让您掌握绘制各种基本图表(如折线图、散点图、柱状图、饼图)的能力。在此基础上,将进一步讲解Seaborn库,它提供了更高级、更美观的统计图形,能够更便捷地探索数据分布、变量关系以及模型结果。 第二篇:深入挖掘—— 数据挖掘的核心技术与算法 在掌握了数据处理和可视化的基础后,我们将深入数据挖掘的腹地,探索各种强大的算法和技术,以揭示数据背后隐藏的模式和规律。 数据预处理与特征工程: 真实世界的数据往往是“脏”的,充满噪声、缺失和不一致。本篇将详细讲解数据预处理的各项技术,包括数据清洗(处理异常值、缺失值)、数据规范化与标准化、离散化以及数据编码等。同时,我们将重点介绍特征工程的重要性,教授您如何从原始数据中提取、构建有意义的特征,以提升模型的性能。 监督学习:预测与分类的艺术: 监督学习是利用带有标签的数据进行模型训练,以预测未知数据的标签或值。 回归算法: 您将学习线性回归、多项式回归、岭回归、Lasso回归等经典回归算法,用于预测连续型变量,如房价预测、销售额预测等。 分类算法: 您将深入理解逻辑回归、K近邻(KNN)、支持向量机(SVM)、决策树、随机森林、梯度提升树(如XGBoost, LightGBM)等强大的分类算法,用于解决文本分类、图像识别、客户流失预测等问题。本书将详细讲解算法的原理、优缺点以及参数调优方法。 无监督学习:发现隐藏的结构: 无监督学习处理的是没有标签的数据,旨在发现数据固有的模式和结构。 聚类算法: 您将学习K-Means、DBSCAN、层次聚类等聚类算法,用于将相似的数据点分组,如客户细分、市场分割等。 降维算法: 主成分分析(PCA)、t-SNE等降维技术将帮助您在高维数据中提取最重要的信息,可视化高维数据,并减少模型训练的复杂度。 关联规则挖掘: Apriori算法等将帮助您发现数据项之间的有趣关联,例如“购买了尿布的顾客很可能也会购买啤酒”,广泛应用于购物篮分析。 模型评估与选择: 如何评价一个模型的优劣?本书将详细介绍各种模型评估指标,如准确率、精确率、召回率、F1分数、ROC曲线、AUC值、均方误差(MSE)、R²分数等。您将学会如何选择合适的指标来评估不同类型的模型,以及如何进行模型交叉验证、网格搜索等技术来寻找最优模型。 第三篇:实战应用—— 将数据分析应用于实际场景 理论知识的学习固然重要,但将所学技能转化为解决实际问题的能力,才是本书最终的目标。本篇将通过一系列贴近实际的案例,带您体验数据分析的完整流程,从问题定义到最终的业务洞察。 案例一:电商用户行为分析: 分析用户浏览、点击、购买等行为数据,构建用户画像,预测用户购买意愿,优化推荐系统,提升用户体验和销售额。 案例二:金融风险评估: 利用历史客户数据,构建信用评分模型,预测客户违约概率,辅助信贷决策,降低坏账风险。 案例三:市场营销活动优化: 分析营销活动的效果数据,评估不同渠道的ROI,识别目标客户群体,制定更有效的营销策略。 案例四:文本情感分析: 对用户评论、社交媒体内容等文本数据进行情感倾向分析,了解公众对产品或服务的态度,为产品改进和品牌管理提供依据。 案例五:时间序列预测: 对股票价格、天气数据、销售量等具有时间依赖性的数据进行建模和预测,为未来的决策提供支持。 在每个案例中,您将学习如何: 1. 明确业务问题: 将业务需求转化为可分析的数据问题。 2. 数据获取与理解: 从各种来源获取数据,并对数据进行初步的探索性分析。 3. 数据预处理与特征工程: 清洗、转换数据,构建有用的特征。 4. 模型选择与训练: 根据问题类型选择合适的算法,并进行模型训练。 5. 模型评估与调优: 评估模型性能,并进行参数优化。 6. 结果解释与业务洞察: 将模型结果转化为可行的业务建议。 第四篇:进阶探索与未来展望 在掌握了上述核心内容后,本书还将为您打开数据科学的更广阔视野,介绍一些进阶技术和未来发展趋势。 深度学习入门: 简要介绍神经网络的基本概念,以及在图像识别、自然语言处理等领域的应用,为有兴趣的读者指明进一步学习的方向。 大数据处理框架简介: 了解Hadoop、Spark等大数据处理技术的基本原理和应用场景。 数据科学项目管理: 介绍数据科学项目的生命周期,以及团队协作、版本控制等实践方法。 道德与隐私: 强调在数据分析过程中对数据隐私和伦理的关注。 本书特色: 系统性强: 从基础到进阶,层层递进,构建完整的知识体系。 实践性突出: 大量贴近实际的案例,让您在动手实践中掌握技能。 代码示例丰富: 提供清晰、可运行的Python代码,方便读者学习和参考。 概念解释透彻: 深入剖析算法原理,帮助读者理解“为什么”而不是仅仅“怎么做”。 前沿技术兼顾: 在夯实基础的同时,也为您展望了数据科学的未来发展。 无论您是希望提升职业技能的数据爱好者、渴望从数据中挖掘商业价值的从业者,还是希望在学术研究中运用数据分析的研究者,本书都将是您不可多得的良师益友。它将赋能您以数据驱动的思维方式,让您在瞬息万变的市场和科技浪潮中,捕捉机遇,解决挑战,实现更卓越的价值。准备好,和我们一起,在数据的海洋中扬帆远航,探索无限可能!

用户评价

评分

这本《Python数据分析与挖掘实战》真的让我眼前一亮。作为一个对数据分析充满兴趣但又刚入门的新手,我一直希望能找到一本既能系统讲解理论,又能提供大量实操案例的书籍。这本书在这方面做得非常出色。它从Python基础讲起,循序渐进地介绍了数据清洗、数据可视化、特征工程、机器学习算法等关键环节。我尤其喜欢它在每个章节都提供了详细的代码示例,而且这些代码不仅能运行,还附带了解释,让我能清楚地理解每一步操作的含义和背后的逻辑。书中使用的案例也非常贴近实际,涵盖了用户行为分析、商品推荐、金融风险预测等多个领域,这让我能够将学到的知识与现实世界的业务场景联系起来,增加了学习的动力。书中的图表也画得清晰明了,帮助我更好地理解复杂的数据模式和模型结果。总的来说,这本书为我打下了坚实的数据分析基础,让我对未来深入学习和应用数据科学充满了信心。我不再害怕面对庞大的数据集,也敢于尝试使用各种工具和算法去挖掘数据背后的价值。

评分

我是一名经验丰富的程序员,近期想拓展自己的技能栈,学习数据挖掘方面的知识,所以选择了这本书《Python数据分析与挖掘实战》。坦白说,我一开始对纯理论的书籍有些抵触,更倾向于动手实践。这本书在这方面做得非常到位,它紧密结合实际项目,用大量代码示例来演示各种数据挖掘技术。从数据预处理到特征工程,再到各种监督学习和无监督学习算法的应用,书中都提供了详细的代码实现和解释。我尤其欣赏它在讲解算法时,不仅仅是罗列公式,而是通过实际案例来展示算法的原理和应用场景。例如,在讲解聚类算法时,它会用用户画像的例子来阐释K-Means的应用,让我能快速地理解算法的精髓。此外,书中还涉及了数据挖掘项目中的一些高级话题,如模型评估、参数调优、特征选择策略等,这些对于想要深入理解数据挖掘过程的开发者来说,是非常有价值的。这本书让我能够将Python的编程能力与数据挖掘技术相结合,为我开辟了新的职业发展方向。

评分

作为一名对互联网行业充满好奇的学生,我一直想了解数据在互联网公司中是如何被使用的。这本书《Python数据分析与挖掘实战》恰好满足了我的需求。它用非常通俗易懂的语言,解释了许多在互联网公司里常见的数据分析场景。比如,如何通过分析用户点击流数据来优化网站设计,如何利用用户购买记录来做精准营销,如何识别欺诈行为等。书中不仅提供了代码,还对每一个步骤背后的商业逻辑做了深入的剖析,让我不仅仅是学会了“怎么做”,更理解了“为什么要这样做”。我特别喜欢它关于数据可视化那一章,通过丰富的图表示例,我学会了如何用图表来讲述数据故事,让复杂的数据变得直观易懂。而且,它介绍的爬虫技术,也让我对如何获取互联网上的公开数据有了初步的了解,这对于一些需要大量数据进行分析的项目来说,是非常有用的技能。这本书让我看到了数据分析在互联网领域的巨大潜力,也让我对未来的职业发展有了更清晰的规划。

评分

我最近读了这本《Python数据分析与挖掘实战》,感觉它特别适合有一定编程基础,但想在数据分析领域有所建树的开发者。它并没有停留在简单的概念介绍,而是直接深入到实际操作层面。书中对Pandas、NumPy、Matplotlib、Scikit-learn等常用库的讲解,都是围绕实际应用展开的。比如,在处理缺失值和异常值时,它会介绍不同的策略,并给出相应的Python代码实现,让你学会如何根据数据特性选择最合适的方法。在特征工程部分,书中讲解了如何进行特征编码、特征选择、特征降维等,这些都是提升模型性能的关键步骤。而且,它还详细介绍了多种机器学习算法,如线性回归、逻辑回归、决策树、随机森林、支持向量机、K-Means聚类等,并提供了使用Scikit-learn库来实现这些算法的范例。最让我印象深刻的是,书中对于模型评估和调优的部分也讲解得非常到位,让我们能够理解如何衡量模型的优劣,以及如何通过交叉验证、网格搜索等方法来优化模型参数。这本书的内容非常充实,涵盖了数据分析从数据获取到模型部署的整个流程,是一本非常宝贵的实战指南。

评分

这本书《Python数据分析与挖掘实战》给我带来的最大价值在于它对于“实战”二字的深刻诠释。它不是一本停留在概念层面、空泛地讲解理论的书籍,而是真正地将读者带入到数据分析的实际操作中。从最基础的数据加载、清洗、转换,到中级的特征工程、模型选择,再到高级的模型评估与优化,书中每一个环节都提供了详细的代码和解释。我个人最看重的是它在处理实际问题时的策略和方法。例如,在面对不完整数据时,它会给出多种填充策略的对比,并分析它们的优劣。在进行特征选择时,它会介绍不同的过滤法、包裹法和嵌入式方法,并给出相应的代码实现。书中大量的案例,覆盖了文本分析、时间序列预测、用户行为分析等多个领域,让我能清晰地看到不同技术在实际应用中的效果。这种“学以致用”的学习方式,极大地提升了我解决实际数据问题的能力,让我能够更自信地将所学应用于工作中。

评分

专业必备,正版

评分

非常好啊,学习用的上

评分

对于我来说此书很好

评分

包装很精美,配送很给力,内容很详细。

评分

好书,值得推荐

评分

物流很快 书的内容很不错

评分

好书,值得推荐

评分

很赞

评分

很赞

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有