Python机器学习入门(影印版 英文版)

Python机器学习入门(影印版 英文版) pdf epub mobi txt 电子书 下载 2025

[美] 安德烈亚斯·穆勒,莎拉·圭多 著
图书标签:
  • Python
  • 机器学习
  • 入门
  • 英文
  • 影印版
  • 数据科学
  • 人工智能
  • 编程
  • 算法
  • 技术
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 东南大学出版社
ISBN:9787564169060
版次:1
商品编码:12148360
包装:平装
开本:16开
出版时间:2017-01-01
用纸:胶版纸
页数:376
字数:480000
正文语种:英文

具体描述

内容简介

  机器学习已经成为许多商业应用和研究项目的一个组成部分,同时拥有广泛研究团队的大型公司也投入到这个领域。如果你使用Python,即使是初学者,《Python机器学习入门(影印版 英文版)》也将教你如何构建自己的机器学习解决方案。有了目前可用的丰富数据,机器学习应用程序只受限于你的想象力。
  你将学习使用Python和scikit-learn库所需的全部步骤来创建成功的机器学习应用程序。《Python机器学习入门(影印版 英文版)》作者安德烈亚斯·穆勒、莎拉·圭多专注于使用机器学习算法的实践方面,而不会过多讨论其背后的数学原理。熟悉NumPy和matplotlib库将有助于你从《Python机器学习入门(影印版 英文版)》中获得*多信息。
  有了《Python机器学习入门(影印版 英文版)》,你会学到:机器学习的基本概念和应用程序各种广泛使用的机器学习算法的优点和缺点如何呈现通过机器学习处理后的数据,包括需要关注的数据方面于模型评估和参数调整的**方法用于连接模型和封装工作流的管道的概念处理文本数据的方法,包括特定于文本的处理技术改善你的机器学习和数据科学技能的建议

作者简介

  AndreasMuller,在波恩大学的机器学习专业获得博士学位。在担任计算机视觉应用的机器学习研究员后,他加入了纽约大学数据科学中心:他也是scikit-learn维护者和核心贡献者。SarahGuido,是一位数据科学家,与许多创业公司有密切合作,近担任Bitly的首席数据科学家。Sarah获得密歇根大学信息科学硕士学位,在多个学术会议上成功地发表了演讲。

目录

Preface
1. Introduction
Why Machine Learning?
Problems Machine Learning Can Solve
Knowing Your Task and Knowing Your Data
Why Python?
scikit-learn
Installing scikit-learn
Essential Libraries and Tools
Jupyter Notebook
NumPy
SciPy
matplotlib
pandas
mglearn
Python 2 Versus Python 3
Versions Used in this Book
A First Application: Classifying Iris Species
Meet the Data
Measuring Success: Training and Testing Data
First Things First: Look at Your Data
Building Your First Model: k-Nearest Neighbors
Making Predictions
Evaluating the Model
Summary and Outlook

2. Supervised Learning
Classification and Regression
Generalization, Overfitting, and Underfitting
Relation of Model Complexity to Dataset Size
Supervised Machine Learning Algorithms
Some Sample Datasets
k-Nearest Neighbors
Linear Models
Naive Bayes Classifiers
Decision Trees
Ensembles of Decision Trees
Kernelized Support Vector Machines
Neural Networks (Deep Learning)
Uncertainty Estimates from Classifiers
The Decision Function
Predicting Probabilities
Uncertainty in Multiclass Classification
Summary and Outlook

3. Unsupervised Learning and Preprocessing
Types of Unsupervised Learning
Challenges in Unsupervised Learning
Preprocessing and Scaling
Different Kinds of Preprocessing
Applying Data Transformations
Scaling Training and Test Data the Same Way
The Effect of Preprocessing on Supervised Learning
Dimensionality Reduction, Feature Extraction, and Manifold Learning
Principal Component Analysis (PCA)
Non-Negative Matrix Factorization (NMF)
Manifold Learning with t-SNE
Clustering
k-Means Clustering
Agglomerative Clustering
DBSCAN
Comparing and Evaluating Clustering Algorithms
Summary of Clustering Methods
Summary and Outlook

4. Representing Data and Engineering Features
Categorical Variables
One-Hot-Encoding (Dummy Variables)
Numbers Can Encode Categoricals
Binning, Discretization, Linear Models, and Trees
Interactions and Polynomials
Univariate Nonlinear Transformations
Automatic Feature Selection
Univariate Statistics
Model-Based Feature Selection
Iterative Feature Selection
Utilizing Expert Knowledge
Summary and Outlook

5. Model Evaluation and Improvement
Cross-Validation
Cross-Validation in scikit-learn
Benefits of Cross-Validation
Stratified k-Fold Cross-Validation and Other Strategies
Grid Search
Simple Grid Search
The Danger of Overfitting the Parameters and the Validation Set
Grid Search with Cross-Validation
Evaluation Metrics and Scoring
Keep the End Goal in Mind
Metrics for Binary Classification
Metrics for Multiclass Classification
Regression Metrics
Using Evaluation Metrics in Model Selection
Summary and Outlook

6. Algorithm Chains and Pipelines
Parameter Selection with Preprocessing
Building Pipelines
Using Pipelines in Grid Searches
The General Pipeline Interface
Convenient Pipeline Creation with make_pipeline
Accessing Step Attributes
Accessing Attributes in a Grid-Searched Pipeline
Grid-Searching Preprocessing Steps and Model Parameters
Grid-Searching Which Model To Use
Summary and Outlook

7. Working with Text Data
Types of Data Represented as Strings
Example Application: Sentiment Analysis of Movie Reviews
Representing Text Data as a Bag of Words
Applying Bag-of-Words to a Toy Dataset
Bag-of-Words for Movie Reviews
Stopwords
Rescaling the Data with tf-idf
Investigating Model Coefficients
Bag-of-Words with More Than One Word (n-Grams)
Advanced Tokenization, Stemming, and Lemmatization
Topic Modeling and Document Clustering
Latent Dirichlet Allocation
Summary and Outlook

8. Wrapping Up
Approaching a Machine Learning Problem
Humans in the Loop
From Prototype to Production
Testing Production Systems
Building Your Own Estimator
Where to Go from Here
Theory
Other Machine Learning Frameworks and Packages
Ranking, Recommender Systems, and Other Kinds of Learning
Probabilistic Modeling, Inference, and Probabilistic Programming
Neural Networks
Scaling to Larger Datasets
Honing Your Skills
Conclusion
Index

精彩书摘

  《Python机器学习入门(影印版 英文版)》:
  Another very useful clustering algorithm is DBSCAN(which stands for"densitybased spatial clustering of applications with noise").The main benefits of DBSCAN are that it does not require the user to set the number of clusters a priori,it can capture clusters of complex shapes,and it can identify points that are not part of anycluster.DBSCAN is somewhat slower than agglomerative clustering and k—means,butstill scales to relatively large datasets.
  DBSCAN works by identifying points that are in"crowded"regions of the feature space,where many data points are close together.These regions are referred to as dense regions in feature space.The idea behind DBSCAN is that clusters form dense regions of data,separated by regions that are relatively empty.
  Points that are within a dense region are called core samples(or core points),and they are defmed as follows.There are two parameters in DBSCAN: min_samples and eps.
  If there are at least rnin_samples many data points within a distance of eps to a given data point,that data point is classified as a core sample.Core samples that are closerto each other than the distance eps are put into the same cluster by DBSCAN.
  ……
深入探索人工智能的基石:Python机器学习实战指南 在这个数据驱动的时代,人工智能(AI)以前所未有的速度渗透到我们生活的方方面面,从智能推荐系统到自动驾驶汽车,再到精准的医疗诊断,AI的触角无处不在。而驱动这一切的核心技术之一,便是机器学习。对于那些渴望理解并驾驭这一强大力量的开发者、数据科学家以及技术爱好者而言,掌握机器学习的原理与实践至关重要。本书便是为您精心打造的一本集理论深度与实践广度于一体的Python机器学习实战指南。 本书并非简单罗列算法,而是旨在构建一个坚实的理论框架,并辅以大量详实的代码示例,让您能够切实地将理论知识转化为解决实际问题的能力。我们深知,对于初学者而言,机器学习的概念可能显得抽象而复杂。因此,本书将从最基础的统计学和线性代数概念入手,为您铺平学习之路。您将深入理解概率论在模型构建中的作用,掌握向量和矩阵运算如何成为数据处理的基石,以及微积分如何支撑起模型优化的核心机制。这些基础知识的扎实掌握,将使您在后续的学习中事半功倍,更能触及更深层次的理论内涵。 本书的核心内容围绕着一系列经典且实用的机器学习算法展开。我们将首先介绍监督学习的强大威力,从最简单的线性回归开始,逐步深入理解逻辑回归,后者在二分类问题中扮演着不可或缺的角色。您将学习如何利用这些模型来预测连续数值,或者区分不同的类别,并通过实际数据集进行训练和评估。随后,我们将聚焦于决策树,一种直观易懂且解释性强的模型,并进一步探讨集成学习的聚合力量,如随机森林和梯度提升树(Gradient Boosting Trees)。这些集成方法通过组合多个弱学习器,往往能达到比单个模型更优异的性能,是解决复杂问题的利器。 在分类问题方面,我们将深入讲解支持向量机(SVM)的核技巧,它能有效地处理非线性可分的数据,并将高维空间的奥秘巧妙地应用于低维空间。同时,我们也将详细阐述K近邻(K-NN)算法,一种基于“相似性”的简单而有效的分类器。此外,概率模型如朴素贝叶斯(Naive Bayes)也将得到深入剖析,理解其背后概率推断的逻辑,对于处理文本分类等任务至关重要。 无监督学习作为机器学习的另一大分支,在数据探索和模式发现方面展现出独特的价值。本书将为您系统介绍聚类算法,从经典的K-Means算法,到层次聚类(Hierarchical Clustering)和DBSCAN等更复杂的模型,您将学会如何发现数据中隐藏的自然分组。降维技术也将是本书的重点,我们将深入讲解主成分分析(PCA),一种广泛应用于数据压缩和可视化技术,以及t-SNE(t-distributed Stochastic Neighbor Embedding),它在高维数据可视化方面表现出色。 此外,本书还将为您开启深度学习的大门。我们将从神经网络的基本结构——感知机(Perceptron)开始,逐步构建多层感知机(MLP),并深入理解反向传播算法(Backpropagation)的原理,它是训练深度神经网络的关键。您将学习如何构建和训练卷积神经网络(CNN),这种强大的模型在图像识别和计算机视觉领域取得了辉煌的成就,并将探索循环神经网络(RNN)及其变种(如LSTM和GRU)在序列数据处理,如自然语言处理(NLP)和时间序列分析中的应用。 为了使学习过程更加生动和实用,本书贯穿了大量的Python代码示例。我们将充分利用NumPy、Pandas和Matplotlib等核心Python科学计算库,它们是数据科学领域不可或缺的工具。在模型实现方面,我们将重点介绍Scikit-learn,一个功能强大且易于使用的机器学习库,它提供了丰富的算法实现和数据预处理工具。对于深度学习部分,我们将转向TensorFlow和Keras,它们是业界领先的深度学习框架,能够帮助您高效地构建和训练复杂的神经网络模型。 本书的实践部分将指导您完成一系列引人入胜的项目。您将学习如何使用机器学习模型进行房价预测,构建一个垃圾邮件过滤器,开发一个图像识别系统,甚至尝试构建一个简单的推荐系统。每一个项目都将涵盖从数据收集、预处理、特征工程,到模型选择、训练、评估和调优的完整流程。您将亲身体验数据科学的工作流程,并学会如何将抽象的算法应用于解决真实世界的问题。 在模型评估与选择方面,本书将详细介绍各种评估指标,如准确率、精确率、召回率、F1分数、ROC曲线和AUC值等,并讲解如何选择最适合您任务的评估方法。我们还将深入探讨交叉验证(Cross-validation)技术,以确保模型的泛化能力,避免过拟合。模型的调优,包括超参数优化(Hyperparameter Tuning)等关键环节,也将得到详尽的讲解,帮助您打造性能卓越的模型。 本书还关注机器学习在实际应用中的挑战和伦理考量。您将了解如何处理不平衡数据集,如何应对特征工程的复杂性,以及如何理解和解释模型的决策过程。同时,我们也将探讨机器学习的公平性、透明度和隐私保护等重要议题,引导您在技术实践中秉持负责任的态度。 无论您是刚刚踏入编程世界,还是拥有扎实的编程基础,渴望进军人工智能领域,抑或是一位希望深化机器学习理论与实践的开发者,本书都将是您不可多得的宝贵资源。它将引导您从零开始,系统地掌握机器学习的核心概念和技术,并赋予您运用Python构建强大AI应用的能力。通过本书的学习,您将不仅能理解“是什么”,更能掌握“怎么做”,从而自信地应对未来数据科学和人工智能领域的各种挑战。 我们相信,通过本书的学习,您将能构建起坚实的机器学习知识体系,培养出敏锐的数据洞察力,并最终能够运用Python的力量,创造出富有价值的智能解决方案。立即开始您的机器学习探索之旅吧!

用户评价

评分

这本《Python机器学习入门(影印版 英文版)》的出现,对我而言,简直是一场及时雨。我之前尝试过一些中文的机器学习书籍,但总觉得少了点什么——要么是翻译腔太重,影响了阅读的流畅度;要么是内容过于浅显,不能满足我深入探索的渴望。当我看到这本书是英文原版影印的时候,我心里就打定主意要收一本。拿到书后,我的预感得到了证实。书的纸张质量不错,虽然是影印版,但印刷清晰,一点也不影响阅读。更重要的是,书中对于机器学习的讲解,逻辑清晰,条理分明。作者没有回避那些稍微复杂一些的数学概念,而是用一种相对易懂的方式将其呈现出来,并与Python代码的实现紧密结合。我最喜欢的部分是书中对监督学习和无监督学习的划分,以及对各种算法的详细介绍。例如,在讲到决策树的时候,作者不仅解释了ID3、C4.5等算法的原理,还通过具体的Python代码演示了如何构建和使用决策树。这种“理论+实践”的模式,让我能够快速地将学到的知识应用到实际问题中。这本书并没有提供大量的“开箱即用”的模板,而是鼓励读者去理解算法背后的逻辑,去自己动手实现,去调整参数。这对于培养真正的机器学习能力非常有帮助。我花了很多时间去消化书中的每一个例子,尝试去修改代码,观察结果的变化。每一次小小的成功,都让我对机器学习的理解更深一层。可以说,这本书为我开启了一扇通往机器学习世界的大门。

评分

在我看来,这本书《Python机器学习入门(影印版 英文版)》之所以如此受欢迎,绝非偶然。它最打动我的地方在于,它真正做到了“授人以渔”。我之前接触过不少机器学习的书籍,但很多都侧重于“告诉”你某个模型是什么,如何用,却很少深入讲解“为什么”它是这样工作的。而这本书,恰恰弥补了这一点。它在介绍每一个算法的时候,都会先从数学原理出发,用清晰的逻辑让你明白它的底层机制。例如,在讲到神经网络的时候,作者并没有止步于简单的“层”和“神经元”的介绍,而是详细讲解了反向传播算法的数学推导,这让我第一次真正理解了梯度下降在神经网络训练中的作用。更难能可贵的是,它将这些理论与Python代码实现完美结合。书中提供的代码示例,都是非常实用的,而且质量很高。我经常会自己动手去修改代码中的参数,观察模型性能的变化,这种亲身实践的经验,远比死记硬背来得深刻。这本书的英文原版影印,也让我能够保持对技术的敏感度,避免了翻译带来的信息损耗。虽然阅读英文对我来说需要一些额外的努力,但这一切都是值得的,因为我学到的是最直接、最权威的知识。这本书不仅仅是一本入门书,更像是我在机器学习道路上的一位良师益友,它指引了我方向,也给了我前进的动力。

评分

坦白说,在接触到这本《Python机器学习入门(影印版 英文版)》之前,我尝试过好几本号称“入门”的书籍,但要么是内容过于理论化,让我看得云里雾里;要么是代码示例过于简单,学完之后感觉对实际问题帮助不大。当我抱着试一试的心态翻开这本书时,我立刻就被它独特的气质吸引了。这本书的讲解风格非常独特,它不是那种枯燥乏味的教科书式叙述,而是更像一位经验丰富的老师,循循善诱地引导你一步步走进机器学习的世界。我尤其喜欢书中对一些基础概念的解释,比如“特征工程”的意义,“过拟合”和“欠拟合”的区别,作者都用非常生动的例子和比喻来阐述,让我这种初学者也能轻易理解。而且,书中大量的Python代码示例,都经过了精心设计,不仅仅是展示了如何调用库函数,更是通过这些代码,让读者亲身去体验算法的运行过程。我曾经花了一个下午的时间,就为了弄明白书中关于K-Means聚类算法的一个代码细节。虽然过程有些曲折,但最终豁然开朗的那一刻,真的非常有成就感。这本书让我明白,机器学习并非高不可攀,它可以通过系统的学习和大量的实践,掌握在自己手中。我还会经常回顾书中的某些章节,因为每次重读,都会有新的体会和发现。

评分

这本书我拿到手的时候,正值我对机器学习的兴趣刚被点燃,还在到处搜寻入门资料的阶段。当时我看了好几本书的目录和试读,最终被这本书的英文原版影印吸引了。虽然我英语不算顶尖,但看到它清晰的排版和似乎很扎实的理论基础,就觉得这可能是值得我花时间和精力去啃的。拿到书之后,我确实是花了不少时间,一点一点地消化里面的内容。有时候会为了弄懂一个概念,需要查阅大量的其他资料,有时候也会因为一个小小的代码示例,反复调试几次。这本书的优点在于,它不像有些入门书那样只讲理论,也不像有些实战书那样只给代码。它是在理论讲解和实际应用之间找到了一个很好的平衡点。每讲到一个算法或者模型,作者都会先给出清晰的数学原理讲解,让你明白“为什么”这样做,然后再给出相应的Python代码实现,让你知道“怎么”做。这种循序渐进的方式,对于我这种需要深入理解底层逻辑的学习者来说,真的太友好了。而且,它用的很多库都是机器学习领域非常主流的,比如Scikit-learn,NumPy,Pandas等,这为我后续的学习打下了坚实的基础。我尤其喜欢书中对一些经典算法的讲解,比如线性回归、逻辑回归、支持向量机等等,作者的解释逻辑严谨,很容易让人理解。即使有些地方我一开始没完全领会,但随着后面的学习深入,回过头来再看,就会豁然开朗。这本书真的给了我一个非常棒的起点,让我对机器学习这个领域有了更清晰的认识和更浓厚的兴趣。

评分

这本《Python机器学习入门(影印版 英文版)》对我这个有一定编程基础,但机器学习领域小白来说,真是一本难得的好书。我之所以选择英文原版,是因为我希望能够接触到最原汁原味的知识,避免翻译过程中可能出现的误解或信息丢失。拿到书后,我被它的结构和内容深深吸引。它不是那种堆砌代码的“速成”教材,而是从基础概念出发,逐步深入。我特别欣赏书中对数学原理的阐述,虽然我不是数学专业出身,但作者用非常直观的方式解释了诸如梯度下降、最大似然估计等核心概念。而且,每一部分的理论讲解之后,都会有相应的Python代码示例,这些代码都使用了非常流行的库,比如NumPy、Pandas和Matplotlib。我花了大量时间去理解这些代码,并尝试在自己的环境中运行和修改。通过这些练习,我不仅学会了如何使用这些库,更重要的是,我开始理解不同算法在实际数据上是如何运作的。书中对模型的评估和选择部分也做得非常出色,它教会了我如何用交叉验证、评估指标来判断模型的优劣,而不是仅仅看训练误差。这让我意识到,一个好的机器学习模型,不仅仅是会“拟合”数据,更重要的是能够“泛化”到未见过的数据。这本书的难度对我来说是恰到好处的,既有挑战性,又不会让我感到沮丧。它让我体会到了学习的乐趣,也让我对未来在机器学习领域深入研究充满了信心。

评分

正版印刷,可以放心购买。

评分

哈哈哈哈哈哈哈哈哈

评分

活动买的,价格很实惠。

评分

老外写的书,就要看原版的。

评分

物流给力,是学习Python3的好书

评分

久仰大名,能够帮助开发人员写出pythonic的代码

评分

有塑封,比较厚,评价不错,努力看完~

评分

书不错,教你怎么写出真正的Python代码。

评分

不错不错很喜欢闲暇时候可以充充电

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有