| > 书名: | Python数据分析与挖掘实战|4894338 |
| > 图书定价: | 69元 |
| > 图书作者: | 张良均;王路;谭立云;苏剑林 |
| > 出版社: | 机械工业出版社 |
| > 出版日期: | 2016/1/1 0:00:00 |
| > ISBN号: | 9787111521235 |
| > 开本: | 16开 |
| > 页数: | 335 |
| > 版次: | 1-1 |
| 作者简介 |
| 张良均 资深大数据挖掘专家和模式识别专家,高级信息项目管理师,有10多年的大数据挖掘应用、咨询和培训经验。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学、华南师范大学、华南农业大学、贵州师范学院、韩山师范学院、广东技术师范学院兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》《R语言数据分析与挖掘实战》等畅销书。 |
| 内容简介 |
| 10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。 |
| 目录 |
前 言 基 础 篇 第1章 数据挖掘基础2 1.1 某知名连锁餐饮企业的困惑2 1.2 从餐饮服务到数据挖掘3 1.3 数据挖掘的基本任务4 1.4 数据挖掘建模过程4 1.4.1 定义挖掘目标4 1.4.2 数据取样5 1.4.3 数据探索6 1.4.4 数据预处理7 1.4.5 挖掘建模7 1.4.6 模型评价7 1.5 常用的数据挖掘建模工具7 1.6 小结9 第2章 Python数据分析简介10 2.1 搭建Python开发平台12 2.1.1 所要考虑的问题12 2.1.2 基础平台的搭建12 2.2 Python使用入门13 2.2.1 运行方式14 2.2.2 基本命令15 2.2.3 数据结构17 2.2.4 库的导入与添加20 2.3 Python数据分析工具22 2.3.1 Numpy23 2.3.2 Scipy24 2.3.3 Matplotlib24 2.3.4 Pandas26 2.3.5 StatsModels27 2.3.6 Scikit-Learn28 2.3.7 Keras29 2.3.8 Gensim30 2.4 配套资源使用设置31 2.5 小结32 第3章 数据探索33 3.1 数据质量分析33 3.1.1 缺失值分析34 3.1.2 异常值分析34 3.1.3 一致性分析37 3.2 数据特征分析37 3.2.1 分布分析37 3.2.2 对比分析40 3.2.3 统计量分析41 3.2.4 周期性分析44 3.2.5 贡献度分析45 3.2.6 相关性分析47 3.3 Python主要数据探索函数50 3.3.1 基本统计特征函数50 3.3.2 拓展统计特征函数53 3.3.3 统计作图函数54 3.4 小结59 第4章 数据预处理60 4.1 数据清洗60 4.1.1 缺失值处理60 4.1.2 异常值处理64 4.2 数据集成64 4.2.1 实体识别64 4.2.2 冗余属性识别65 4.3 数据变换65 4.3.1 简单函数变换65 4.3.2 规范化66 4.3.3 连续属性离散化68 4.3.4 属性构造70 4.3.5 小波变换71 4.4 数据规约74 4.4.1 属性规约74 4.4.2 数值规约77 4.5 Python主要数据预处理函数80 4.6 小结81 第5章 挖掘建模83 5.1 分类与预测83 5.1.1 实现过程83 5.1.2 常用的分类与预测算法84 5.1.3 回归分析85 5.1.4 决策树89 5.1.5 人工神经网络95 5.1.6 分类与预测算法评价100 5.1.7 Python分类预测模型特点103 5.2 聚类分析104 5.2.1 常用聚类分析算法104 5.2.2 K-Means聚类算法105 5.2.3 聚类分析算法评价111 5.2.4 Python主要聚类分析算法111 5.3 关联规则113 5.3.1 常用关联规则算法114 5.3.2 Apriori算法114 5.4 时序模式119 5.4.1 时间序列算法120 5.4.2 时间序列的预处理120 5.4.3 平稳时间序列分析122 5.4.4 非平稳时间序列分析124 5.4.5 Python主要时序模式算法132 5.5 离群点检测134 5.5.1 离群点检测方法135 5.5.2 基于模型的离群点检测方法136 5.5.3 基于聚类的离群点检测方法138 5.6 小结141 实 战 篇 第6章 电力窃漏电用户自动识别144 6.1 背景与挖掘目标144 6.2 分析方法与过程147 6.2.1 数据抽取148 6.2.2 数据探索分析148 6.2.3 数据预处理151 6.2.4 构建专家样本156 6.2.5 模型构建157 6.3 上机实验161 6.4 拓展思考162 6.5 小结163 第7章 航空公司客户价值分析164 7.1 背景与挖掘目标164 7.2 分析方法与过程166 7.2.1 数据抽取168 7.2.2 数据探索分析168 7.2.3 数据预处理169 7.2.4 模型构建173 7.3 上机实验177 7.4 拓展思考178 7.5 小结179 第8章 中医证型关联规则挖掘180 8.1 背景与挖掘目标180 8.2 分析方法与过程181 8.2.1 数据获取183 8.2.2 数据预处理186 8.2.3 模型构建190 8.3 上机实验193 8.4 拓展思考194 8.5 小结194 第9章 基于水色图像的水质评价195 9.1 背景与挖掘目标195 9.2 分析方法与过程195 9.2.1 数据预处理197 9.2.2 模型构建199 9.2.3 水质评价201 9.3 上机实验202 9.4 拓展思考202 9.5 小结203 第10章 家用电器用户行为分析与事件识别204 10.1 背景与挖掘目标204 10.2 分析方法与过程205 10.2.1 数据抽取206 10.2.2 数据探索分析207 10.2.3 数据预处理207 10.2.4 模型构建217 10.2.5 模型检验219 10.3 上机实验220 10.4 拓展思考221 10.5 小结222 第11章 应用系统负载分析与磁盘容量预测223 11.1 背景与挖掘目标223 11.2 分析方法与过程225 11.2.1 数据抽取226 11.2.2 数据探索分析226 11.2.3 数据预处理227 11.2.4 模型构建229 11.3 上机实验235 11.4 拓展思考236 11.5 小结237 第12章 电子商务网站用户行为分析及服务推荐238 12.1 背景与挖掘目标238 12.2 分析方法与过程240 12.2.1 数据抽取242 12.2.2 数据探索分析244 12.2.3 数据预处理251 12.2.4 模型构建256 12.3 上机实验266 12.4 拓展思考267 12.5 小结269 第13章 财政收入影响因素分析及预测模型270 13.1 背景与挖掘目标270 13.2 分析方法与过程272 13.2.1 灰色预测与神经网络的组合模型273 13.2.2 数据探索分析274 13.2.3 模型构建277 13.3 上机实验294 13.4 拓展思考295 13.5 小结296 第14章 基于基站定位数据的商圈分析297 14.1 背景与挖掘目标297 14.2 分析方法与过程299 14.2.1 数据抽取299 14.2.2 数据探索分析299 14.2.3 数据预处理301 14.2.4 模型构建304 14.3 上机实验308 14.4 拓展思考309 14.5 小结309 第15章 电商产品评论数据情感分析310 15.1 背景与挖掘目标310 15.2 分析方法与过程310 15.2.1 评论数据采集311 15.2.2 评论预处理314 15.2.3 文本评论分词320 15.2.4 模型构建320 15.3 上机实验333 15.4 拓展思考334 15.5 小结335 参考文献336 |
| 编辑推荐 |
| 10余位数据挖掘领域专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。 从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强 |
这本《Python数据分析与挖掘实战》真的让我眼前一亮。作为一个对数据分析充满兴趣但又刚入门的新手,我一直希望能找到一本既能系统讲解理论,又能提供大量实操案例的书籍。这本书在这方面做得非常出色。它从Python基础讲起,循序渐进地介绍了数据清洗、数据可视化、特征工程、机器学习算法等关键环节。我尤其喜欢它在每个章节都提供了详细的代码示例,而且这些代码不仅能运行,还附带了解释,让我能清楚地理解每一步操作的含义和背后的逻辑。书中使用的案例也非常贴近实际,涵盖了用户行为分析、商品推荐、金融风险预测等多个领域,这让我能够将学到的知识与现实世界的业务场景联系起来,增加了学习的动力。书中的图表也画得清晰明了,帮助我更好地理解复杂的数据模式和模型结果。总的来说,这本书为我打下了坚实的数据分析基础,让我对未来深入学习和应用数据科学充满了信心。我不再害怕面对庞大的数据集,也敢于尝试使用各种工具和算法去挖掘数据背后的价值。
评分我是一名经验丰富的程序员,近期想拓展自己的技能栈,学习数据挖掘方面的知识,所以选择了这本书《Python数据分析与挖掘实战》。坦白说,我一开始对纯理论的书籍有些抵触,更倾向于动手实践。这本书在这方面做得非常到位,它紧密结合实际项目,用大量代码示例来演示各种数据挖掘技术。从数据预处理到特征工程,再到各种监督学习和无监督学习算法的应用,书中都提供了详细的代码实现和解释。我尤其欣赏它在讲解算法时,不仅仅是罗列公式,而是通过实际案例来展示算法的原理和应用场景。例如,在讲解聚类算法时,它会用用户画像的例子来阐释K-Means的应用,让我能快速地理解算法的精髓。此外,书中还涉及了数据挖掘项目中的一些高级话题,如模型评估、参数调优、特征选择策略等,这些对于想要深入理解数据挖掘过程的开发者来说,是非常有价值的。这本书让我能够将Python的编程能力与数据挖掘技术相结合,为我开辟了新的职业发展方向。
评分作为一名对互联网行业充满好奇的学生,我一直想了解数据在互联网公司中是如何被使用的。这本书《Python数据分析与挖掘实战》恰好满足了我的需求。它用非常通俗易懂的语言,解释了许多在互联网公司里常见的数据分析场景。比如,如何通过分析用户点击流数据来优化网站设计,如何利用用户购买记录来做精准营销,如何识别欺诈行为等。书中不仅提供了代码,还对每一个步骤背后的商业逻辑做了深入的剖析,让我不仅仅是学会了“怎么做”,更理解了“为什么要这样做”。我特别喜欢它关于数据可视化那一章,通过丰富的图表示例,我学会了如何用图表来讲述数据故事,让复杂的数据变得直观易懂。而且,它介绍的爬虫技术,也让我对如何获取互联网上的公开数据有了初步的了解,这对于一些需要大量数据进行分析的项目来说,是非常有用的技能。这本书让我看到了数据分析在互联网领域的巨大潜力,也让我对未来的职业发展有了更清晰的规划。
评分我最近读了这本《Python数据分析与挖掘实战》,感觉它特别适合有一定编程基础,但想在数据分析领域有所建树的开发者。它并没有停留在简单的概念介绍,而是直接深入到实际操作层面。书中对Pandas、NumPy、Matplotlib、Scikit-learn等常用库的讲解,都是围绕实际应用展开的。比如,在处理缺失值和异常值时,它会介绍不同的策略,并给出相应的Python代码实现,让你学会如何根据数据特性选择最合适的方法。在特征工程部分,书中讲解了如何进行特征编码、特征选择、特征降维等,这些都是提升模型性能的关键步骤。而且,它还详细介绍了多种机器学习算法,如线性回归、逻辑回归、决策树、随机森林、支持向量机、K-Means聚类等,并提供了使用Scikit-learn库来实现这些算法的范例。最让我印象深刻的是,书中对于模型评估和调优的部分也讲解得非常到位,让我们能够理解如何衡量模型的优劣,以及如何通过交叉验证、网格搜索等方法来优化模型参数。这本书的内容非常充实,涵盖了数据分析从数据获取到模型部署的整个流程,是一本非常宝贵的实战指南。
评分这本书《Python数据分析与挖掘实战》给我带来的最大价值在于它对于“实战”二字的深刻诠释。它不是一本停留在概念层面、空泛地讲解理论的书籍,而是真正地将读者带入到数据分析的实际操作中。从最基础的数据加载、清洗、转换,到中级的特征工程、模型选择,再到高级的模型评估与优化,书中每一个环节都提供了详细的代码和解释。我个人最看重的是它在处理实际问题时的策略和方法。例如,在面对不完整数据时,它会给出多种填充策略的对比,并分析它们的优劣。在进行特征选择时,它会介绍不同的过滤法、包裹法和嵌入式方法,并给出相应的代码实现。书中大量的案例,覆盖了文本分析、时间序列预测、用户行为分析等多个领域,让我能清晰地看到不同技术在实际应用中的效果。这种“学以致用”的学习方式,极大地提升了我解决实际数据问题的能力,让我能够更自信地将所学应用于工作中。
评分专业必备,正版
评分非常好啊,学习用的上
评分对于我来说此书很好
评分包装很精美,配送很给力,内容很详细。
评分好书,值得推荐
评分物流很快 书的内容很不错
评分好书,值得推荐
评分很赞
评分很赞
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有