【国外引进版】机器学习实战（新编）图灵程序设计丛书 Python语言编程入门书人工智能书 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

peter harrington 著

图书标签:

机器学习
人工智能
Python
数据科学
算法
编程入门
图灵图书
国外引进
实战
机器学习新编

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到静流书站

book.coffeedeals.club

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

店铺：华纳博文图书专营店

出版社：人民邮电出版社

ISBN：9787115317957N

商品编码：28407539605

品牌：青葫芦

具体描述

商品参数 书名:机器学习实战作者:[美] Peter Harrington 著，李锐，李鹏译出版社：人民邮电出版社出版日期：2013-06 I S B N：9787115317957 页码：315 版次：1 装帧：平装开本：16开重量：555g 定价：69.00元
目录部分分类第1章机器学习基础 1.1 何谓机器学习 1.1.1 传感器和海量数据 1.1.2 机器学习非常重要 1.2 关键术语 1.3 机器学习的主要任务 1.4 如何选择合适的算法 1.5 开发机器学习应用程序的步骤 1.6 Python语言的优势 1.6.1 可执行伪代码 1.6.2 Python比较流行 1.6.3 Python语言的特色 1.6.4 Python语言的缺点 1.7 NumPy函数库基础 1.8 本章小结第2章 k-近邻算法 2.1 k-近邻算法概述 2.1.1 准备：使用Python导入数据 2.1.2 从文本文件中解析数据 2.1.3 如何测试分类器 2.2 示例：使用k-近邻算法改进约会网站的配对效果 2.2.1 准备数据：从文本文件中解析数据 2.2.2 分析数据：使用Matplotlib创建散点图 2.2.3 准备数据：归一化数值 2.2.4 测试算法：作为完整程序验证分类器 2.2.5 使用算法：构建完整可用 2.3 示例：手写识别 2.3.1 准备数据：将图像转换为测试向量 2.3.2 测试算法：使用k-近邻算法识别手写数字 2.4 本章小结第3章决策树 3.1 决策树的构造 3.1.1 信息增益 3.1.2 划分数据集 3.1.3 递归构建决策树 3.2 在Python中使用Matplotlib注解绘制树形图 3.2.1 Matplotlib注解 3.2.2 构造注解树 3.3 测试和存储分类器 3.3.1 测试算法：使用决策树执行分类 3.3.2 使用算法：决策树的存储 3.4 示例：使用决策树预测隐形眼镜类型 3.5 本章小结第4章基于概率论的分类方法：朴素贝叶斯 4.1 基于贝叶斯决策理论的分类方法 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类 4.5 使用Python进行文本分类 4.5.1 准备数据：从文本中构建词向量 4.5.2 训练算法：从词向量计算概率 4.5.3 测试算法：根据现实情况修改分类器 4.5.4 准备数据：文档词袋模型 4.6 示例：使用朴素贝叶斯过滤垃圾邮件 4.6.1 准备数据：切分文本 4.6.2 测试算法：使用朴素贝叶斯进行交叉验证 4.7 示例：使用朴素贝叶斯分类器从个人广告中获取区域倾向 4.7.1 收集数据：导入RSS源 4.7.2 分析数据：显示地域相关的用词 4.8 本章小结第5章 Logistic回归 5.1 基于Logistic回归和Sigmoid函数的分类 5.2 基于化方法的回归系数确定 5.2.1 梯度上升法 5.2.2 训练算法：使用梯度上升找到*zui参数 5.2.3 分析数据：画出决策边界 5.2.4 训练算法：随机梯度上升 5.3 示例：从疝气病症预测病马的死亡率 5.3.1 准备数据：处理数据中的缺失值 5.3.2 测试算法：用Logistic回归进行分类 5.4 本章小结第6章支持向量机 6.1 基于*大间隔分隔数据 6.2 寻找*大间隔 6.2.1 分类器求解的优化问题 6.2.2 SVM应用的一般框架 6.3 SMO高效优化算法 6.3.1 Platt的SMO算法 6.3.2 应用简化版SMO算法处理小规模数据集 6.4 利用完整Platt SMO算法加速优化 6.5 在复杂数据上应用核函数 6.5.1 利用核函数将数据映射到高维空间 6.5.2 径向基核函数 6.5.3 在测试中使用核函数 6.6 示例：手写识别问题回顾 6.7 本章小结第7章利用AdaBoost元算法提高分类性能 7.1 基于数据集多重抽样的分类器 7.1.1 bagging：基于数据随机重抽样的分类器构建方法 7.1.2 boosting 7.2 训练算法：基于提升分类器的性能 7.3 基于单层决策树构建弱分类器 7.4 完整AdaBoost算法的实现 7.5 测试算法：基于AdaBoost的分类 7.6 示例：在一个难数据集上应用AdaBoost 7.7 非均衡分类问题 7.7.1 其他分类性能度量指标：正确率、召回率及ROC曲线 7.7.2 基于代价函数的分类器决策控制 7.7.3 处理非均衡问题的数据抽样方法 7.8 本章小结第二部分利用回归预测数值型数据第8章预测数值型数据：回归 8.1 用线性回归找到*拟合直线 8.2 局部加权线性回归 8.3 示例：预测鲍鱼的年龄 8.4 缩减系数来“理解”数据 8.4.1 岭回归 8.4.2 lasso 8.4.3 前向逐步回归 8.5 权衡偏差与方差 8.6 示例：预测乐高玩具套装的价格 8.6.1 收集数据：使用Google购物的API 8.6.2 训练算法：建立模型 8.7 本章小结第9章树回归 9.1 复杂数据的局部性建模 9.2 连续和离散型特征的树的构建 9.3 将CART算法用于回归 9.3.1 构建树 9.3.2 运行代码 9.4 树剪枝 9.4.1 预剪枝 9.4.2 后剪枝 9.5 模型树 9.6 示例：树回归与标准回归的比较 9.7 使用Python的Tkinter库创建GUI 9.7.1 用Tkinter创建GUI 9.7.2 集成Matplotlib和Tkinter 9.8 本章小结第三部分无监督学习第10章利用K-均值聚类算法对未标注数据分组 10.1 K-均值聚类算法 10.2 使用后处理来提高聚类性能 10.3 二分K-均值算法 10.4 示例：对地图上的点进行聚类 10.4.1 Yahoo！ PlaceFinder API 10.4.2 对地理坐标进行聚类 10.5 本章小结第11章使用Apriori算法进行关联分析 11.1 关联分析 11.2 Apriori原理 11.3 使用Apriori算法来发现频繁集 11.3.1 生成候选项集 11.3.2 组织完整的Apriori算法 11.4 从频繁项集中挖掘关联规则 11.5 示例：发现国会投票中的模式 11.5.1 收集数据：构建美国国会投票记录的事务数据集 11.5.2 测试算法：基于美国国会投票记录挖掘关联规则 11.6 示例：发现毒蘑菇的相似特征 11.7 本章小结第12章使用FP-growth算法来高效发现频繁项集 12.1 FP树：用于编码数据集的有效方式 12.2 构建FP树 12.2.1 创建FP树的数据结构 12.2.2 构建FP树 12.3 从一棵FP树中挖掘频繁项集 12.3.1 抽取条件模式基 12.3.2 创建条件FP树 12.4 示例：在Twitter源中发现一些共现词 12.5 示例：从新闻网站点击流中挖掘 12.6 本章小结第四部分其他工具第13章利用PCA来简化数据 13.1 降维技术 13.2 PCA 13.2.1 移动坐标轴 13.2.2 在NumPy中实现PCA 13.3 示例：利用PCA对半导体制造数据降维 13.4 本章小结第14章利用SVD简化数据 14.1 SVD的应用 14.1.1 隐性语义索引 14.1.2 14.2 矩阵分解 14.3 利用Python实现SVD 14.4 基于协同过滤的引擎 14.4.1 相似度计算 14.4.2 基于物品的相似度还是基于用户的相似度？ 14.4.3 引擎的评价 14.5 示例：餐馆菜肴引擎 14.5.1 未尝过的菜肴 14.5.2 利用SVD提高的效果 14.5.3 构建引擎面临的挑战 14.6 基于SVD的图像压缩 14.7 本章小结第15章大数据与MapReduce 15.1 MapReduce：分布式计算的框架 15.2 Hadoop流 15.2.1 分布式计算均值和方差的mapper 15.2.2 分布式计算均值和方差的reducer 15.3 在yamaxun网络服务上运行Hadoop程序 15.3.1 AWS上的可用服务 15.3.2 开启yamaxun网络服务之旅 15.3.3 在EMR上运行Hadoop作业 15.4 MapReduce上的机器学习 15.5 在Python中使用mrjob来自动化MapReduce 15.5.1 mrjob与EMR的无缝集成 15.5.2 mrjob的一个MapReduce脚本剖析 15.6 示例：分布式SVM的Pegasos算法 15.6.1 Pegasos算法 15.6.2 训练算法：用mrjob实现MapReduce版本的SVM 15.7 你真的需要MapReduce吗？ 15.8 本章小结附录A Python入门附录B 线性代数附录C 概率论复习附录D 资源索引版权声明

内容介绍 机器学习是人工智能研究领域中的一个极其重要的方向。在现今大数据时代的背景下，捕获数据并从中萃取有价值的信息或模式，使得这一过去为分析师与数学家所专属的研究领域越来越为人们瞩目。本书通过精心编排的实例，切入日常工作任务，摒弃学术化语言，利用高效可复用的Python代码阐释如何处理统计数据，进行数据分析及可视化。读者可从中学到一些核心的机器学习算法，并将其运用于某些策略性任务中，如分类、预测及等。本书适合机器学习相关研究人员及互联网从业人员学习参考。

探索智能的奥秘，赋能未来的创新在信息爆炸的时代，数据如同奔腾的河流，蕴藏着无限的价值与洞察。而机器学习，作为人工智能皇冠上最璀璨的明珠，正以前所未有的力量，驱动着各行各业的变革。它赋予机器“学习”的能力，使其能够从海量数据中提炼规律，做出预测，甚至进行决策，从而极大地拓展了人类的能力边界，开启了通往智能未来的大门。本书并非一本简单的技术手册，而是一次深刻的智慧启迪之旅。它旨在引领读者深入理解机器学习的核心概念，掌握其精妙的算法原理，并学会如何将其应用于解决现实世界中的复杂问题。我们不拘泥于冰冷的公式与枯燥的理论，而是通过生动形象的语言、循序渐进的讲解，以及丰富多样的实际案例，带领你一步步揭开机器学习神秘的面纱。为何是机器学习？想象一下，你的智能手机能够精准识别你的面部，为你量身定制新闻推送；电商平台能够预测你的购物喜好，为你推荐心仪的商品；医疗机构能够通过分析病历数据，辅助医生做出更准确的诊断；自动驾驶汽车能够在复杂的交通环境中安全行驶……这些令人惊叹的应用，都离不开机器学习的支持。机器学习的核心在于“学习”。与传统的程序设计需要人为编写所有规则不同，机器学习算法能够通过分析数据，自动发现隐藏在其中的模式和关系。这种“从数据中学习”的能力，使得机器能够处理那些传统方法难以应对的复杂任务，例如图像识别、自然语言处理、推荐系统、风险评估等等。它不仅提高了效率，更带来了前所未有的精准度和智能化水平。本书将带你领略什么？本书将带你踏上一段系统而全面的学习旅程，从基础概念到高级应用，让你掌握构建智能系统的核心技能。一、理解智能的基石：机器学习概览何为机器学习？我们将从根本上定义机器学习，阐述其在人工智能领域的核心地位，并介绍其与传统编程的区别，让你对其本质有一个清晰的认识。机器学习的分类：监督学习、无监督学习、强化学习……我们将详细介绍这几种主要的学习范式，解释它们各自的特点、适用场景以及工作原理。你将了解到，不同的问题需要不同的学习策略。数据的重要性：数据是机器学习的燃料。我们将探讨数据在机器学习过程中的作用，如何收集、清洗、预处理数据，以及特征工程的概念，为模型的训练奠定坚实的基础。模型评估与选择：构建模型只是第一步，如何判断模型的优劣？我们将介绍各种评估指标，如准确率、精确率、召回率、F1分数等，并指导你如何根据具体任务选择最合适的模型。二、深入算法的殿堂：核心模型解析本书将精选一系列具有代表性和实用价值的机器学习算法，并对其进行深入浅出的讲解。线性回归与逻辑回归：作为最基础但又应用广泛的模型，我们将详细解析它们的数学原理，理解如何利用线性模型来预测连续值和分类概率。决策树与随机森林：易于理解且可解释性强的决策树，以及由多棵决策树组成的集成模型——随机森林，我们将探讨它们如何进行数据划分和预测，以及如何处理非线性关系。支持向量机（SVM）：强大且高效的SVM，我们将揭示其在高维空间中寻找最优超平面以进行分类和回归的原理。 K近邻（KNN）：直观的KNN算法，我们将学习如何基于样本之间的距离来进行分类或预测。聚类算法（K-Means等）：无监督学习的代表，我们将探索如何让算法自动发现数据中的隐藏群体，例如用户分群、市场细分等。降维技术（PCA等）：在处理高维数据时，降维是关键。我们将学习如何使用主成分分析（PCA）等技术来提取数据的本质信息，降低计算复杂度。神经网络与深度学习入门：作为当前人工智能领域最热门的分支，我们将为你构建深入理解神经网络的基础，介绍其基本结构、激活函数、反向传播算法等，并初步涉足深度学习的应用。三、从理论到实践：模型构建与优化仅仅理解算法是不够的，更重要的是能够将理论应用于实际。本书将引导你完成一个完整的模型构建过程。数据预处理的艺术：真实世界的数据往往是“脏”的。我们将教授你如何进行缺失值处理、异常值检测、数据标准化/归一化等关键步骤，确保数据质量。特征工程的魔力：如何从原始数据中提取出对模型最有用的特征？我们将分享各种特征工程的技巧和策略，极大地提升模型的性能。模型训练的技巧：如何有效地训练模型？我们将介绍过拟合与欠拟合的概念，以及如何使用交叉验证、正则化等技术来提升模型的泛化能力。超参数调优：模型有许多可调参数，它们对模型性能有着至关重要的影响。我们将介绍网格搜索、随机搜索等自动化调优方法。模型解释性：理解模型为何做出某个预测，对于建立信任和进行改进至关重要。我们将探讨一些模型解释性的方法。四、人工智能的广阔天地：应用场景探索学习机器学习的最终目的是解决实际问题。本书将带领你探索机器学习在各行各业的广泛应用。图像识别与计算机视觉：从人脸识别到物体检测，从医学影像分析到自动驾驶，我们将了解机器学习如何让计算机“看懂”世界。自然语言处理（NLP）：机器翻译、文本情感分析、智能问答、语音助手……我们将探索机器学习如何理解和生成人类语言。推荐系统：电商、影音平台、新闻资讯……你将学习如何构建个性化的推荐引擎，提升用户体验。金融风控与欺诈检测：信用评分、贷款风险评估、交易欺诈识别……机器学习在守护金融安全方面发挥着关键作用。医疗健康：疾病诊断辅助、药物研发、个性化治疗方案……人工智能正在重塑医疗行业。其他前沿领域：随着技术的发展，机器学习的应用场景还在不断拓展，我们也会提及一些新兴的探索方向。本书的独特之处注重实战，而非纸上谈兵：我们不回避复杂的数学细节，但更强调其背后的直观理解和应用。通过大量的代码示例和项目实践，让你亲手构建出能够工作的模型。循序渐进，由浅入深：无论是初学者还是有一定基础的读者，都能从中找到适合自己的学习路径。从基础概念到高级算法，我们层层递进，确保知识的连贯性和深度。强调理解，而非死记硬背：算法的本质和原理是理解的关键。本书力求让你真正理解每一个算法的设计思路和工作机制，从而能够灵活运用。引导思考，激发创新：机器学习是一个不断发展的领域，本书不仅传授知识，更注重培养读者的独立思考和解决问题的能力，鼓励你成为未来的创新者。谁适合阅读本书？计算机科学、人工智能、数据科学专业的学生：为你的专业学习打下坚实的基础，掌握前沿的技术。希望转型进入人工智能领域的工程师、开发者：学习必备的技能，开启新的职业生涯。对数据分析和智能应用感兴趣的业余爱好者：满足你的求知欲，探索数据背后的无穷魅力。希望将机器学习应用于自己业务的行业专家：学习如何利用AI技术解决实际业务挑战，提升竞争力。踏入智能时代，机器学习是不可或缺的驱动力。本书将是你探索这个激动人心领域的最佳向导。让我们一起，用数据赋能智慧，用代码创造未来！

用户评价

评分☆☆☆☆☆

这本书的封面设计简直是直击心灵，那种带着点复古未来感的排版，一下子就把我拉回了那个刚刚接触编程的年代，但同时又透露出一种对前沿技术的敬畏感。我拿到手后，第一感觉就是沉甸甸的，能感觉到作者在内容组织上的用心。说实话，我刚开始对“国外引进版”这个标签有点犹豫，总担心翻译腔太重，晦涩难懂。但翻开目录和前几章的内容，那种担忧就烟消云散了。译者显然下了大功夫，不仅是字面上的精准，更是对编程思维和技术概念的精准传达。尤其是一些涉及到复杂数学推导的部分，配上图示和清晰的注释，即便是初学者也能顺着思路走下去，不会因为卡在某个公式上就彻底放弃。那种循序渐进、层层递进的讲解方式，让我仿佛有了一个耐心的导师在身边指导，而不是面对一本冰冷的技术手册。我特别欣赏它在代码示例上的处理，注释详尽到几乎不需要你去查阅任何外部资料就能理解每一行代码的意图，这对于快速建立实践信心至关重要。

评分☆☆☆☆☆

这本书最让我感到惊喜的是它对“理解偏差与方差的权衡”这一核心难题的处理。很多教材要么用过于简化的例子带过，要么就直接甩出复杂的数学公式让读者自己消化。但这本书，通过引入几个经典的、对比鲜明的案例，直观地展示了欠拟合和过拟合的危害，并清晰地阐述了正则化（L1/L2）是如何从数学上约束模型复杂度，从而平衡偏差和方差的。那种“豁然开朗”的感觉，是我在其他很多号称“实战”的书籍中未能获得的。它不仅教会了我如何跑模型，更重要的是，它教会了我如何像一个真正的机器学习工程师那样去“诊断”和“优化”我的模型，使其具备更强的泛化能力，这才是真正有价值的知识沉淀。

评分☆☆☆☆☆

我原本对Python语言的掌握仅限于日常脚本编写，对于构建复杂的机器学习流水线感到有些力不从心。这本书的侧重点明显不仅仅是算法本身，它对如何使用Python生态系统中的主流库（比如NumPy、Pandas、Scikit-learn）进行了非常细致的讲解和整合。它教的不是孤立的库函数，而是一套完整的“工具箱使用方法论”。例如，如何高效地利用Pandas进行大规模数据集的内存优化处理，以及如何用Scikit-learn的Pipeline功能来自动化模型的训练和评估流程。这对于我这种希望快速将理论知识转化为生产力的读者来说，简直是雪中送炭，让我的编程能力和算法理解同步得到了质的飞跃。

评分☆☆☆☆☆

作为一名资深技术爱好者，我阅过的编程书籍不下百本，很多AI入门书读完后总感觉知识点是零散的，像一堆散落的珍珠。但这本书的厉害之处在于它的“结构美学”。它从最基础的概率论回顾开始，稳健地过渡到核心的监督学习模型，然后自然而然地引入到更复杂的无监督学习和集成方法。整个逻辑链条就像一条精心编织的锁链，每一个环节都紧密相扣，推导出下一个概念。阅读过程中，我很少需要频繁地在前后章节之间跳跃查阅，因为作者已经预设了读者的认知路径，并提前铺设好了通往更深层次知识的阶梯。这种整体性强的教材，读完后带来的知识体系的充实感，是碎片化学习完全无法比拟的。

评分☆☆☆☆☆

我最近在尝试将理论知识应用到实际项目中，市面上很多入门书要么过于偏重理论而缺乏实操指导，要么就是代码堆砌，代码跑起来了却不知道背后原理。这本书完美地找到了那个黄金平衡点。它不是简单地罗列算法，而是深入探讨了为什么选择这个算法、它的适用场景以及在什么情况下它会失效。特别是关于特征工程那一块的论述，简直是打开了我新的大门。作者没有把数据清洗和预处理当成一个例行公事，而是将其提升到了艺术的高度，详细阐述了如何通过直觉和经验去“雕琢”数据，让机器能更好地学习。这种对实践细节的打磨，让这本书的含金量瞬间提升了好几个档次，真正做到了“知其然，更知其所以然”。