Python机器学习经典实例

Python机器学习经典实例 pdf epub mobi txt 电子书 下载 2025

[美] 普拉提克·乔西(Prateek Joshi) 著,陶俊杰,陈小莉 译
图书标签:
  • Python
  • 机器学习
  • 经典实例
  • 数据分析
  • 算法
  • 模型
  • 实践
  • 代码
  • 入门
  • 教程
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 人民邮电出版社
ISBN:9787115465276
版次:1
商品编码:12163851
包装:平装
丛书名: 图灵程序设计丛书
开本:16开
出版时间:2017-08-01
用纸:胶版纸
页数:244
正文语种:中文

具体描述

产品特色

编辑推荐

  用火的Python语言、通过各种各样的机器学习算法来解决实际问题!  书中介绍的主要问题如下。  - 探索分类分析算法并将其应用于收入等级评估问题  - 使用预测建模并将其应用到实际问题中  - 了解如何使用无监督学习来执行市场细分  - 探索数据可视化技术以多种方式与数据进行交互  - 了解如何构建推荐引擎  - 理解如何与文本数据交互并构建模型来分析它  - 使用隐马尔科夫模型来研究语音数据并识别语音

内容简介

  在如今这个处处以数据驱动的世界中,机器学习正变得越来越大众化。它已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。本书首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。

作者简介

  Prateek Joshi 人工智能专家,重点关注基于内容的分析和深度学习,曾在英伟达、微软研究院、高通公司以及硅谷的几家早期创业公司任职。个人博客地址: www.prateekj.com

目录

第1 章 监督学习 ............................................. 1
1.1 简介 ................................................. 1
1.2 数据预处理技术 ....................................... 2
1.2.1 准备工作 ....................................... 2
1.2.2 详细步骤 ....................................... 2
1.3 标记编码方法 ........................................... 4
1.4 创建线性回归器 ....................................... 6
1.4.1 准备工作 ....................................... 6
1.4.2 详细步骤 ....................................... 7
1.5 计算回归准确性 ....................................... 9
1.5.1 准备工作 ....................................... 9
1.5.2 详细步骤 ...................................... 10
1.6 保存模型数据 .......................................... 10
1.7 创建岭回归器 .......................................... 11
1.7.1 准备工作 ...................................... 11
1.7.2 详细步骤 ...................................... 12
1.8 创建多项式回归器 .................................. 13
1.8.1 准备工作 ...................................... 13
1.8.2 详细步骤 ...................................... 14
1.9 估算房屋价格 .......................................... 15
1.9.1 准备工作 ...................................... 15
1.9.2 详细步骤 ...................................... 16
1.10 计算特征的相对重要性 ......................... 17
1.11 评估共享单车的需求分布 ..................... 19
1.11.1 准备工作 .................................. 19
1.11.2 详细步骤 .................................. 19
1.11.3 更多内容 .................................. 21
第2 章 创建分类器 ........................................ 24
2.1 简介 ........................................... 24
2.2 建立简单分类器 ...................................... 25
2.2.1 详细步骤 ...................................... 25
2.2.2 更多内容 ...................................... 27
2.3 建立逻辑回归分类器 .............................. 27
2.4 建立朴素贝叶斯分类器 ........................... 31
2.5 将数据集分割成训练集和测试集 ........... 32
2.6 用交叉验证检验模型准确性 ................... 33
2.6.1 准备工作 ...................................... 34
2.6.2 详细步骤 ...................................... 34
2.7 混淆矩阵可视化 ...................................... 35
2.8 提取性能报告 .......................................... 37
2.9 根据汽车特征评估质量 ........................... 38
2.9.1 准备工作 ...................................... 38
2.9.2 详细步骤 ...................................... 38
2.10 生成验证曲线 ........................................ 40
2.11 生成学习曲线 ........................................ 43
2.12 估算收入阶层 ........................................ 45
第3 章 预测建模 ............................................ 48
3.1 简介 ............................................ 48
3.2 用SVM 建立线性分类器 ........................ 49
3.2.1 准备工作 ...................................... 49
3.2.2 详细步骤 ...................................... 50
3.3 用SVM 建立非线性分类器 .................... 53
3.4 解决类型数量不平衡问题 ....................... 55
3.5 提取置信度 .............................................. 58
3.6 寻找最优超参数 ...................................... 60
3.7 建立事件预测器 ...................................... 62
3.7.1 准备工作 ...................................... 62
3.7.2 详细步骤 ...................................... 62
3.8 估算交通流量 .......................................... 64
3.8.1 准备工作 ...................................... 64
3.8.2 详细步骤 ...................................... 64
第4 章 无监督学习——聚类....................... 67
4.1 简介 ....................................... 67
4.2 用k-means 算法聚类数据 ....................... 67
4.3 用矢量量化压缩图片 .............................. 70
4.4 建立均值漂移聚类模型 ........................... 74
4.5 用凝聚层次聚类进行数据分组 ............... 76
4.6 评价聚类算法的聚类效果 ....................... 79
4.7 用DBSCAN 算法自动估算集群数量 ..... 82
4.8 探索股票数据的模式 .............................. 86
4.9 建立客户细分模型 .................................. 88
第5 章 构建推荐引擎 ................................... 91
5.1 简介 ...................................... 91
5.2 为数据处理构建函数组合 ....................... 92
5.3 构建机器学习流水线 .............................. 93
5.3.1 详细步骤 ...................................... 93
5.3.2 工作原理 ...................................... 95
5.4 寻找最近邻 .............................................. 95
5.5 构建一个KNN 分类器 ............................ 98
5.5.1 详细步骤 ...................................... 98
5.5.2 工作原理 .................................... 102
5.6 构建一个KNN 回归器 .......................... 102
5.6.1 详细步骤 .................................... 102
5.6.2 工作原理 .................................... 104
5.7 计算欧氏距离分数 ................................ 105
5.8 计算皮尔逊相关系数 ............................ 106
5.9 寻找数据集中的相似用户 ..................... 108
5.10 生成电影推荐 ...................................... 109
第6 章 分析文本数据 ................................. 112
6.1 简介 ....................................... 112
6.2 用标记解析的方法预处理数据 ............. 113
6.3 提取文本数据的词干 ............................ 114
6.3.1 详细步骤 .................................... 114
6.3.2 工作原理 .................................... 115
6.4 用词形还原的方法还原文本的基本形式 .................... 116
6.5 用分块的方法划分文本 ........................ 117
6.6 创建词袋模型 ........................................ 118
6.6.1 详细步骤 .................................... 118
6.6.2 工作原理 .................................... 120
6.7 创建文本分类器 .................................... 121
6.7.1 详细步骤 .................................... 121
6.7.2 工作原理 .................................... 123
6.8 识别性别 ............................................. 124
6.9 分析句子的情感 .................................... 125
6.9.1 详细步骤 .................................... 126
6.9.2 工作原理 .................................... 128
6.10 用主题建模识别文本的模式 ............... 128
6.10.1 详细步骤 .................................. 128
6.10.2 工作原理 .................................. 131
第7 章 语音识别 ......................................... 132
7.1 简介 .......................................... 132
7.2 读取和绘制音频数据 ............................ 132
7.3 将音频信号转换为频域 ........................ 134
7.4 自定义参数生成音频信号 ..................... 136
7.5 合成音乐 .......................................... 138
7.6 提取频域特征 ........................................ 140
7.7 创建隐马尔科夫模型 ............................ 142
7.8 创建一个语音识别器 ............................ 143
第8 章 解剖时间序列和时序数据 ............ 147
8.1 简介 ............................................. 147
8.2 将数据转换为时间序列格式 ................. 148
8.3 切分时间序列数据 ................................ 150
8.4 操作时间序列数据 ................................ 152
8.5 从时间序列数据中提取统计数字 ......... 154
8.6 针对序列数据创建隐马尔科夫模型 ..... 157
8.6.1 准备工作 .................................... 158
8.6.2 详细步骤 .................................... 158
8.7 针对序列文本数据创建条件随机场 ..... 161
8.7.1 准备工作 .................................... 161
8.7.2 详细步骤 .................................... 161
8.8 用隐马尔科夫模型分析股票市场数据.......................... 164
第9 章 图像内容分析 ................................. 166
9.1 简介 .............................................. 166
9.2 用OpenCV-Pyhon 操作图像 ................. 167
9.3 检测边 ........................................ 170
9.4 直方图均衡化 ........................................ 174
9.5 检测棱角 .................................. 176
9.6 检测SIFT 特征点 .................................. 178
9.7 创建Star 特征检测器 ............................ 180
9.8 利用视觉码本和向量量化创建特征 ...... 182
9.9 用极端随机森林训练图像分类器 .......... 185
9.10 创建一个对象识别器 ........................... 187
第10 章 人脸识别 ........................................ 189
10.1 简介 ........................................... 189
10.2 从网络摄像头采集和处理视频信息 .... 189
10.3 用Haar 级联创建一个人脸识别器 ...... 191
10.4 创建一个眼睛和鼻子检测器 ............... 193
10.5 做主成分分析 ...................................... 196
10.6 做核主成分分析 .................................. 197
10.7 做盲源分离 .......................................... 201
10.8 用局部二值模式直方图创建一个人脸识别器 ................ 205
第11 章 深度神经网络 ............................... 210
11.1 简介 ........................................ 210
11.2 创建一个感知器 .................................. 211
11.3 创建一个单层神经网络 ....................... 213
11.4 创建一个深度神经网络 ....................... 216
11.5 创建一个向量量化器........................... 219
11.6 为序列数据分析创建一个递归神经网络 ...................... 221
11.7 在光学字符识别数据库中将字符可视化 ...................... 225
11.8 用神经网络创建一个光学字符识别器 ....................... 226
第12 章 可视化数据 ................................... 230
12.1 简介 ............................................... 230
12.2 画3D 散点图 ....................................... 230
12.3 画气泡图 ............................................ 232
12.4 画动态气泡图 ...................................... 233
12.5 画饼图 ............................................... 235
12.6 画日期格式的时间序列数据 ............... 237
12.7 画直方图 ............................................ 239
12.8 可视化热力图 ...................................... 241
12.9 动态信号的可视化模拟 ....................... 242
《Python数据科学实战:从理论到应用》 内容简介: 在信息爆炸的时代,数据已成为驱动决策、洞察趋势、预测未来的核心要素。掌握有效处理、分析和利用数据的能力,正变得前所未有的重要。本书《Python数据科学实战:从理论到应用》正是为你量身打造的学习指南,旨在帮助你系统地掌握使用Python进行数据科学探索的全过程,从基础概念的理解,到高级分析技术的运用,再到最终将数据洞察转化为实际价值。 本书并非一个简单的工具手册,而是力求在理论深度与实践广度之间取得精妙平衡。我们相信,只有深刻理解数据科学背后的原理,才能在面对真实世界复杂多变的数据时,游刃有余地运用各种工具和技术。因此,本书将循序渐进地引导读者走进数据科学的殿堂,深入剖析每一个关键概念,并通过丰富的实例,将抽象的理论转化为可操作的代码。 本书内容详尽,涵盖以下核心模块: 第一部分:数据科学基石 —— Python与核心库 在进入复杂的数据分析流程之前,扎实的基础是必不可少的。本部分将为你搭建坚实的Python编程基础,并重点介绍数据科学领域最为核心和广泛使用的Python库。 Python入门与进阶: 我们将从Python的基本语法、数据类型、控制流、函数等入手,逐步深入到面向对象编程、模块化开发等更高级的概念。无需你有深厚的编程背景,本书将从零开始,让你快速掌握Python的编程思维和技巧,为后续的数据科学学习打下坚实基础。 NumPy:数值计算的利器: NumPy是Python科学计算的基石,其强大的N维数组对象(ndarray)为高效的数值运算提供了基础。本书将详细讲解NumPy数组的创建、索引、切片、数学运算、统计函数以及广播机制等核心功能。通过大量的示例,你将学会如何利用NumPy进行向量化计算,显著提升数据处理和分析的效率。 Pandas:数据处理与分析的瑞士军刀: Pandas是数据科学家必不可少的工具,它提供了Series和DataFrame两种核心数据结构,能够优雅地处理结构化数据。本部分将深入剖析Pandas的常用操作,包括数据读取与写入(CSV, Excel, SQL等)、数据清洗(缺失值处理、重复值识别与删除、数据类型转换)、数据选择与过滤、数据分组与聚合(groupby)、数据合并与连接(merge, join, concat)、时间序列数据处理等。我们将通过真实数据集,演示如何利用Pandas解决常见的数据预处理难题。 Matplotlib与Seaborn:数据可视化的艺术: 数据可视化是理解数据、沟通洞察的关键。Matplotlib作为Python最基础的绘图库,将为你展示如何绘制各种静态图表,如折线图、散点图、柱状图、饼图、直方图等。在此基础上,Seaborn库将进一步简化复杂统计图表的创建,并提供更美观的默认样式。本书将指导你如何根据数据类型和分析目的,选择合适的图表类型,并学会定制图表元素,使其清晰、准确地传达信息。 第二部分:探索性数据分析(EDA)—— 深入理解数据 一旦数据准备就绪,就需要通过探索性数据分析来深入理解数据的内在规律和潜在模式。本部分将聚焦于EDA的方法论和实践。 数据概览与统计摘要: 学习如何计算和解释数据的基本统计量,如均值、中位数、方差、标准差、最小值、最大值、分位数等。理解这些统计量如何帮助我们快速把握数据的分布和离散程度。 数据分布分析: 通过直方图、密度图、箱线图等可视化工具,深入探究单个变量的分布特征,识别数据的偏态、峰度以及异常值。 变量间关系探索: 学习如何使用散点图、相关矩阵、热力图等技术,分析变量之间的线性或非线性关系,发现潜在的关联性。 分类变量分析: 掌握如何分析分类变量的频率分布,以及其与其他变量之间的关系,例如使用条形图、堆叠柱状图等。 数据聚合与透视: 深入运用Pandas的`groupby`和`pivot_table`等功能,对数据进行多维度分组和聚合,提取更有意义的统计信息。 特征工程初步: 在EDA过程中,我们会接触到如何根据现有特征创造新特征,或对特征进行变换,为后续的模型构建做准备。 第三部分:机器学习基础与模型实践 掌握了数据处理与探索的能力后,本书将引导你进入机器学习的核心领域,学习如何构建和训练模型来解决实际问题。 机器学习概述: 介绍机器学习的基本概念,包括监督学习、无监督学习、半监督学习和强化学习。阐述模型训练、评估、泛化能力等关键术语。 特征工程进阶: 深入探讨特征工程的重要性和技巧,包括特征缩放(标准化、归一化)、编码(独热编码、标签编码)、多项式特征、交互特征、缺失值插补策略等。理解特征工程对模型性能的影响。 监督学习算法: 线性回归与逻辑回归: 学习最基础的回归和分类模型,理解其原理、适用场景以及模型参数的解释。 决策树与随机森林: 掌握基于树的模型,理解其工作机制、剪枝技术,以及随机森林如何通过集成学习提高鲁棒性。 支持向量机(SVM): 学习SVM的原理,包括核函数的使用,以及其在分类和回归问题中的应用。 K近邻(KNN): 理解基于距离的分类和回归算法。 朴素贝叶斯: 学习概率模型在分类任务中的应用。 无监督学习算法: K-Means聚类: 学习如何发现数据中的簇结构,并进行可视化分析。 主成分分析(PCA): 掌握降维技术,用于去除数据冗余、提高模型效率。 模型评估与选择: 交叉验证: 学习如何使用交叉验证来更可靠地评估模型性能,避免过拟合。 评估指标: 掌握回归问题的评估指标(MSE, RMSE, MAE, R²),以及分类问题的评估指标(准确率、精确率、召回率、F1分数、ROC曲线、AUC)。 模型调优(超参数优化): 介绍网格搜索(Grid Search)和随机搜索(Random Search)等方法,优化模型超参数以获得最佳性能。 第四部分:实际应用案例与项目实战 理论学习最终需要落实在实践中。本部分将通过一系列精心设计的案例,将前几部分所学知识融会贯通,并带领你完成小型到中型的实际项目。 案例研究: 电商用户行为分析: 运用Pandas进行用户购买行为数据的清洗、分析,并进行用户分群。 房价预测: 使用回归模型,基于房屋特征预测房价,并进行特征工程和模型评估。 文本情感分析: 学习文本预处理技术,并使用分类模型分析文本的情感倾向。 图像数据初步处理: 介绍图像数据的基本格式和初步的加载与展示方法,为后续更复杂的计算机视觉任务铺垫。 项目流程指导: 书中将提供完整的项目开发流程,包括问题定义、数据获取、数据预处理、特征工程、模型选择与训练、模型评估与优化、结果解释与报告。 代码实现与解释: 每个案例都附带完整、可运行的Python代码,并对关键代码段进行详细解释,帮助读者理解每一步操作的逻辑和目的。 本书特色: 理论与实践并重: 既有对核心概念的深入讲解,也有大量代码示例和实际案例。 循序渐进的学习路径: 从Python基础到高级算法,结构清晰,易于理解。 丰富的实战案例: 涵盖多个领域,帮助读者将所学知识应用于解决实际问题。 代码质量高: 提供清晰、规范、可复用的Python代码。 面向初学者与进阶者: 无论你是刚接触数据科学,还是希望系统巩固和提升,本书都能提供价值。 通过阅读《Python数据科学实战:从理论到应用》,你将不仅掌握一套强大的数据分析工具,更能培养出独立解决数据问题的能力,为你在学术研究、商业分析、技术开发等各个领域的发展奠定坚实的基础。现在,就开始你的数据科学探索之旅吧!

用户评价

评分

不得不说,这本书在知识体系的构建上非常有条理。它不是零散地罗列各种技术点,而是将它们有机地组织起来,形成一个完整而流畅的学习路径。从基础的概念引入,到核心算法的讲解,再到实际应用的展示,整个过程的衔接非常自然。我感觉自己仿佛在攀登一座知识的山峰,每一步都踩得很稳,并且视野也在不断开阔。这种结构化的学习方式,让我能够更好地理解各个知识点之间的内在联系,从而形成对整个领域的全局认知。对于我这种希望系统性学习的读者来说,这简直是福音。它帮助我建立起了一个清晰的学习框架,让我知道自己站在哪里,下一步该往哪里走。

评分

让我感到惊喜的是,这本书在提供理论知识的同时,还非常注重实际操作的指导。我注意到其中有许多细节的处理,比如代码的注释、环境配置的建议,以及对常见错误的处理方法。这些看似细微的地方,实际上对于一个初学者来说至关重要,它们能够大大降低入门的门槛,避免我们在实践中走太多弯路。作者似乎预想到了我们可能会遇到的各种困难,并在书中为我们准备了“避坑指南”。这种以读者为中心的写作态度,让这本书显得格外亲切和实用。我能想象,当我真正开始动手去实现那些案例时,这些细致的指导将会成为我最得力的助手。

评分

这本书带来的启发性远远超出了我最初的预期。在阅读的过程中,我不断地思考“为什么会这样?”,以及“还有没有其他的实现方式?”,这些问题促使我去主动地查阅更多资料,甚至开始尝试修改书中的代码,看看会有什么不同的结果。这种主动探索的过程,比单纯地照搬书本内容要更有价值得多。它不只是一本“告诉”你如何做的书,更像是一本“激发”你思考的书。我发现,在解决实际问题的过程中,掌握方法论比记住具体指令更重要,而这本书恰恰在这方面做得非常出色。它教会了我如何去分析问题,如何去选择合适的工具,以及如何去评估解决方案的优劣。这对于我在面对未来更复杂的项目时,无疑会打下坚实的基础。

评分

我特别欣赏作者在讲解概念时那种循序渐进的逻辑,即便是一些我之前接触过但理解得不太透彻的理论,通过他的阐述,仿佛被重新梳理了一遍,豁然开朗。书中的一些例子,虽然我还没有完全动手实践,但光是看文字描述,就能感受到其精心设计的巧妙之处,能够直观地展示出理论与实践之间的联系。作者并没有一味地堆砌复杂的术语,而是用一种更易于理解的方式来解释,让初学者也能跟上节奏。有时候,一些经典书籍之所以经典,就在于它能够抓住核心,并且用最有效的方式传达给读者。这本书似乎就具备这样的特质。我感觉我在阅读过程中,不只是在被动接收信息,更像是在和一位经验丰富的导师进行一场深入的对话,他引导我思考,帮助我建立起扎实的知识体系。

评分

收到!这里有五段以读者口吻撰写的、不包含《Python机器学习经典实例》具体内容,但风格迥异、内容充实且力求自然的图书评价: 这本书的包装和印刷质量是真的不错,拿在手里就很有质感,我之前买过一些技术类的书籍,封面和内页的纸质都让人有些失望,但这本书触感就很好,字体清晰,排版也很舒服,阅读体验上已经先拔头筹了。封面设计也很大方,不是那种花里胡哨的,一眼就能看出是关于编程和技术的,这点很符合我的审美。而且,书的尺寸也比较适中,放在书架上不会显得突兀,也不会太大不方便携带。装订也很牢固,我翻阅的时候不用担心书页会散架。在内容还没有深入了解之前,单从这个“硬件”上,就已经让我对它产生了好感,觉得这本书是值得投入时间和精力的。有时候,好的书籍设计本身就是一种吸引力,它能让你更愿意去翻开它,去探索其中的奥秘。希望内容也能像它的外在一样,给我带来惊喜。

评分

好书,介绍的很全面,书虽然薄,但是精辟,纸的质量也很好。

评分

挺好的书,简单易学,京东,618,不买书太亏了,赶紧囤书,希望京东多多举办活动。

评分

价格便宜,很好,值得信赖,可以吧!

评分

非常喜欢的一本书,很不错。

评分

科普之作,可以先系统了解学习下

评分

京东的书很好,经常在这里买,价格实惠,送货上门。

评分

人工智能的发展过程,可以一翻。

评分

不错 还可以 不错 还可以 不错 还可以 不错 还可以 不错 还可以

评分

买这本书我以为是一本很厚很详实的教程,结果...书虽然很薄,但是科普的还是挺好的,有几个例子,唯一问题就是和我想要的书还是有些差距

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有