支持向量机:理论、算法与拓展

支持向量机:理论、算法与拓展 pdf epub mobi txt 电子书 下载 2025

邓乃扬,田英杰 著
图书标签:
  • 支持向量机
  • 机器学习
  • 模式识别
  • 数据挖掘
  • 算法
  • 理论
  • 优化
  • 核方法
  • 统计学习
  • 人工智能
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030250315
版次:1
商品编码:11879051
包装:平装
开本:16开
出版时间:2009-08-01
用纸:胶版纸
页数:244
字数:307000
正文语种:中文

具体描述

内容简介

  《支持向量机:理论、算法与拓展》以分类问题(模式识别、判别分析)和回归问题为背景,介绍支持向量机的基本理论、方法和应用。特别强调对所讨论的问题和处理方法的实质进行直观的解释和说明,因此具有很强的可读性。为使具有一般高等数学知识的读者能够顺利阅读,书中首先介绍了优化的基础知识。
  《支持向量机:理论、算法与拓展》可作为理工类、管理学等专业的高年级本科生、研究生和教师的教材或教学参考书,也可供相关领域的科研人员和实际工作者阅读参考。

内页插图

目录

序言
符号表

第1章 最优化基础
1.1 欧式空间上的最优化问题
1.1.1 最优化问题实例
1.1.2 最优化问题及其解
1.1.3 最优化问题的几何解释
1.2 欧式空间上的凸规划
1.2.1 凸集和凸函数
1.2.2 凸规划问题及其基本性质
1.2.3 凸规划的对偶理论
1.2.4 凸规划的最优性条件
1.2.5 线性规划
1.3 Hilbert空间上的凸规划
1.3.1 凸函数及Frechet导数
1.3.2 凸规划问题
1.3.3 凸规划的对偶理论
1.3.4 凸规划的最优性条件
1.4 欧式空间上带有广义不等式约束的凸规划
1.4.1 带有广义不等式约束的凸规划
1.4.2 带有广义不等式约束的凸规划的对偶理论
1.4.3 带有广义不等式约束的凸规划的最优性条件
1.4.4 二阶锥规划
1.4.5 半定规划
1.5 Hilbert空间上带有广义不等式约束的凸规划
1.5.1 K-凸函数与Frechet导数
1.5.2 凸规划问题
1.5.3 凸规划的对偶理论
1.5.4 凸规划的最优性条件

第2章 线性分类机
2.1 分类问题的提出
2.1.1 例子(心脏病诊断)
2.1.2 分类问题和分类机
2.2 线性可分问题的支持向量分类机
2.2.1 最大间隔法_
2.2.2 线性可分问题的支持向量分类机
2.2.3 支持向量
2.3 线性支持向量分类机
2.3.1 最大间隔法
2.3.2 线性支持向量分类机

第3章 线性回归机
3.1 回归问题和线性回归问题
3.2 硬ε带超平面
3.2.1 从线性回归问题到硬乒带超平面
3.2.2 硬ε-带超平面与线性分划
3.2.3 构造硬ε带超平面的最优化问题
3.3 线性硬ε-带支持向量回归机
3.3.1 原始问题
3.3.2 对偶问题及其与原始问题解的关系
3.3.3 线性硬ε-带支持向量回归机
3.4 线性ε-支持向量回归机
3.4.1 原始问题
3.4.2 对偶问题及其与原始问题解的关系
3.4.3 线性ε-支持向量回归机

第4章 核与支持向量机
4.1 从线性分划到非线性分划
4.1.1 非线性分划的例子
4.1.2 基于非线性分划的分类算法
4.1.3 基于非线性分划的回归算法
4.2 核函数
4.2.1 核函数及其特征
4.2.2 核函数的判定和常用的核函数
4.3 支持向量机及其性质
4.3.1 支持向量分类机
4.3.2 支持向量回归机
4.4 支持向量机中核函数的选取
4.4.1 已知训练集时核函数的选取
4.4.2 核函数的直接构造

第5章 C-支持向量分类机的统计学基础
5.1 分类问
5.1.1 概率分布
5.1.2 分类问题的统计学提法
5.2 经验风险最小化原则
5.3 VC维
5.4 结构风险最小化原则
5.5 结构风险最小化原则的一个直接实现
5.5.1 原始问题
5.5.2 拟对偶问题及其与原始问题的关系
5.5.3 结构风险最小化分类机
5.6 C-支持向量分类机的统计学习理论基础
5.6.1 C-支持向量分类机的回顾
5.6.2 对偶问题与拟对偶问题的关系
5.6.3 C-线性支持向量分类机的统计学习理论解释
……
第6章模型选择
第7章算法
第8章支持向量机的变形与拓广
参考文献
索引

前言/序言

  支持向量机是借助于优化方法解决数据挖掘中若干问题的有力工具,它在一定程度上克服了“维数灾难”和“过学习”等传统困难,并在文本分类、生物信息、语音识别、遥感图像分析、故障识别和预测、时间序列预测、信息安全等诸多领域有了成功的应用。
  支持向量机不仅有着统计学习理论的坚实理论基础,而且具有直观的几何解释和完美的数学形式。虽然自20世纪90年代由Vapnik提出以来一直处于飞速发展的阶段,但是支持向量机的理论基础和各种算法实现的基本框架已经形成。自2000年开始,国外已陆续有专著出版。
  2004年,作者在科学出版社出版了学术专著《数据挖掘中的新方法——支持向量机》,该书是国内一本专门对支持向量机进行全面完整介绍和论述的著作,出版后读者反映良好,并被中国科学院研究生院、清华大学、中国农业大学等用作研究生教材,被评为2006年北京市精品教材。经过五年的继续研究与教学实践,我们决定对该书进行全面改写,增加新的研究成果,并更名为“支持向量机——理论、算法与拓展”。
  本书特别强调可读性,强调直观对理解问题实质的重要作用。在给出系统严谨的论述之前,一般先用图像等直观手段引进各种概念、方法和结论,并特别注意对它们的本质给予形象的解释和说明。对于原始文献中没有提及直观解释的内容,我们也尽可能予以补充,例如,对求解多类分类问题的Crammer-Singer支持向量机,我们给出了清晰的几何解释。与第一部著作相比,本书的逻辑系统更加清晰,对问题的阐述也更加简明,
  本书主要讨论分类问题和回归问题,基于把回归问题转化为分类问题的研究工作,全书以分类问题为主线,形成了统一的格局。主要内容如下:第1章介绍优化基础。该章着重于凸规划的介绍,添加了引领优化方法应用研究的锥规划(包括二阶锥规划和半定规划),以及Hilbert空间中的凸规划理论。这是以后章节以及进一步研究新的支持向量机的优化基础。第2章和第3章则分别对线性分类问题和线性回归问题直观地导出最基本的线性支持向量机。第4章介绍核的基本概念,并在此基础上介绍求解一般的分类问题和回归问题的支持向量机。第5章则从间隔法的统计学解释入手,讨论支持向量机的统计学习理论基础。第6章介绍支持向量机实际应用中的模型选择问题,第7章介绍实现支持内量机的几个主流算法。第8章是前面讨论过的基本的支持向量机的变形与拓广,包括求解多类分类问题、半监督问题、带有扰动的问题和多示例问题的支持向量机。
  本书包含了我们自己的研究工作,例如第5。6节,就是我们完善支持向量机的统计学习理论基础的研究成果。我们相信,这是迄今为止对C-支持向量分类机的一种最确切、最直接、最简明的统计学习理论解释。此外,这里还给出了C-支持向量分类机中的参数C以全新的意义。又如第8章中给出的利用顺序回归的思想求解多类分类问题的支持向量机,通过构建二阶锥规划或者半定规划模型求解半监督问题和带有扰动的问题的支持向量机,以及处理多示例问题的支持向量机等内容。
  本书所设定的读者范围较广,既包括初涉支持向量机的人员,也包括希望利用支持向量机解决实际问题的人士,还可作为对支持向量机进行深入研究的参考书,
  本书得以出版,我们要感谢国家自然科学基金连续多年对我们研究工作的资助和国家科学技术学术著作出版基金的资助;感谢北京航空航天大学的王日爽教授、曲阜师范大学的王长钰和王宜举教授、大连理工大学的夏尊铨和张立卫教授、北京交通大学的修乃华教授、北京理工大学的刘宝光教授、空军指挥学院的李意起教授、上海大学的白延琴教授、中国农业大学的经玲教授和甄苓副教授,感谢中国科学院马志明院士、章祥荪研究员、石勇教授,中国微软亚洲研究院李航研究员,香港中文大学张树中教授对本书的关心和支持,感谢桂林电子科技大学的朱志斌教授和中国人民大学的张春华博士给予的宝贵建议,同时感谢我们讨论班的成员:杨志霞博士、赵琨博士和王永翠、邵小健、秦如新、赵艳梅、高婷婷、邵元海、徐岩、李玉欣等同学,他们都对本书提供了帮助。
机器学习的基石:深度解析统计学习的经典范式 在这浩瀚的算法海洋中,总有一些经典的身影,它们不仅奠定了今日机器学习研究的基石,更以其优雅的数学理论和强大的实践能力,持续影响着人工智能的演进。本书,正是这样一部对机器学习领域中一类核心理论——统计学习理论——进行的深度挖掘与系统阐释。它并非聚焦于某个具体模型的技术细节,而是旨在勾勒出统计学习方法的宏观图景,展现其背后的数学逻辑、核心思想以及解决各类问题的普适性框架。 理论的深度:洞察学习的本质 统计学习理论,其核心在于为“学习”赋予一个严谨的数学定义。它认为,学习的过程本质上是从数据中寻找一个能够最好地逼近真实世界规律的模型。那么,何为“最好”?如何衡量“逼近”的程度?本书将带领读者深入探索这些根本性问题。 首先,我们将追溯统计学习的源头,理解其与概率论、信息论、最优化等数学学科的紧密联系。我们将详细介绍PAC(Probably Approximately Correct)学习理论,这是一种旨在为学习算法提供理论保证的框架。在PAC框架下,一个成功的学习算法必须满足两个条件:其一,以很高的概率(Probably)输出一个近似(Approximately)真实函数(Correct)的模型。我们将剖析PAC理论中的关键概念,如样本复杂度(需要多少数据才能保证学习的成功)和算法复杂度(学习算法的效率),以及它们如何共同决定一个学习算法的性能上限。 接着,本书将聚焦于 VC(Vapnik-Chervonenkis)维的概念。VC维是衡量一个函数类(hypothesis class)“复杂度”的刻度尺。它直观地反映了一个模型族“记忆”数据的能力,即能够“打散”(shatter)多少个数据点。我们将详细阐述VC维的定义,并通过具体的例子展示如何计算不同函数族的VC维。更重要的是,我们将揭示VC维与泛化误差(generalization error)之间的深刻联系。泛化误差是衡量模型在未见过数据上表现好坏的关键指标,而VC维则为控制泛化误差提供了理论依据。本书将详细推导VC维界,展示VC维如何作为数据样本量和模型复杂度之间的权衡因子,指导我们选择合适的模型复杂度以避免过拟合(overfitting)和欠拟合(underfitting)的问题。 此外,我们还将探讨Rademacher 复杂度,作为VC维的一种更普适且更精细的刻度尺。Rademacher 复杂度能够更准确地衡量函数类在不同分布下的泛化能力,并在许多情况下提供比VC维更紧致的界。我们将介绍Rademacher 随机变量及其期望的意义,以及Rademacher 复杂度如何与经验风险(empirical risk)和期望风险(expected risk)建立联系,从而进一步深化对模型泛化能力的理解。 理论部分还将深入剖析经验风险最小化(Empirical Risk Minimization, ERM)原理。ERM是统计学习中最基本也是最强大的学习范式之一,其核心思想是找到在训练数据上表现最好的模型。然而,仅仅最小化训练误差并不足以保证模型在未知数据上的良好表现。本书将深入探讨ERM的局限性,以及如何通过引入正则化(regularization)等技术来克服这些局限,从而提升模型的泛化能力。我们将讨论不同类型的正则化方法,例如L1和L2正则化,以及它们如何通过增加模型复杂度上的惩罚项来约束模型,从而实现更好的泛化。 算法的逻辑:构建有效的学习机器 在坚实的理论基础上,本书将转向构建实际的学习算法。这里的“算法”并非特指某一个模型的训练过程,而是更广泛地指代用于从数据中学习模型参数或结构的一系列计算步骤和优化策略。 我们将详细介绍损失函数(loss function)的设计原则。损失函数是衡量模型预测与真实值之间差异的数学工具,它是模型学习过程中优化的目标。本书将涵盖各种经典的损失函数,如0-1损失(用于分类问题)、平方损失(用于回归问题)、绝对损失以及交叉熵损失等。我们将分析不同损失函数在数学性质和实际应用中的优劣,以及它们如何影响模型的学习过程和最终性能。 对于凸优化(convex optimization),本书将给予重点关注。许多统计学习算法的训练过程都可以转化为一个凸优化问题,其目标是最小化某个凸函数。我们将介绍凸函数、凸集、梯度下降法(gradient descent)、牛顿法(Newton's method)等基本的凸优化算法,并分析它们在解决大规模学习问题时的效率和收敛性。此外,我们还将探讨次梯度法(subgradient method),用于处理非光滑凸函数,这在处理诸如L1正则化等情况下尤为重要。 除了通用的优化技术,本书还将介绍一些针对特定学习任务的算法设计思想。例如,在分类问题中,我们将探讨如何设计能够有效区分不同类别的决策边界。在回归问题中,我们将关注如何精确地预测连续数值。本书还将触及集成学习(ensemble learning)的基本思想,即通过组合多个弱学习器来构建一个强学习器,例如AdaBoost和Bagging等方法,并分析它们在提升模型鲁棒性和泛化能力方面的作用。 拓展的视野:从理论到实践的桥梁 本书的价值不仅在于对基础理论和核心算法的深入剖析,更在于其理论联系实际、拓展应用边界的视野。 在理论层面,我们将探讨核方法(kernel methods)的核心思想。核方法提供了一种在原始特征空间中计算内积的便捷方式,从而能够在更高维度的特征空间中隐式地进行计算,极大地增强了模型的表达能力。我们将详细介绍核技巧的原理,以及核函数(如多项式核、高斯核、Sigmoid核)的选择原则。 在算法层面,本书将讨论在线学习(online learning)的模式。与传统的批量学习不同,在线学习算法能够逐个处理数据样本,并能够不断地更新模型,这在处理大规模、流式数据时具有显著优势。我们将探讨在线学习算法的设计思路,以及其在动态环境下的适应性。 此外,本书还将触及半监督学习(semi-supervised learning)和无监督学习(unsupervised learning)的一些基础概念。我们将探讨如何在只有少量标注数据的情况下,利用大量的未标注数据来提升学习效果,以及如何从无标注数据中发现隐藏的结构和模式。 本书的另一重要贡献在于,它将以一种系统、严谨的视角来解读机器学习领域中的各种算法和方法。读者将能够理解,许多看似不同的算法,其背后可能共享着相同的统计学习原理。这种深刻的理解,将有助于读者在面对新的问题和新的算法时,能够更快地抓住核心,做出明智的选择,并能够根据具体需求对现有算法进行改进和创新。 总而言之,本书旨在为读者构建一个关于机器学习的理论认知框架。它强调的是“为什么”和“怎么做”背后的根本原因,而非仅仅停留在“是什么”的表面描述。通过对统计学习理论的深度解析,以及对核心算法的逻辑梳理,本书将赋予读者一种洞察机器学习本质的能力,为他们在数据科学、模式识别、人工智能等领域的进一步探索打下坚实的基础。这本书将成为任何渴望真正理解机器学习,而非仅仅掌握皮毛的读者的必备参考。

用户评价

评分

坦白说,在看到这本书的书名时,我一度犹豫是否要入手,因为“支持向量机”这个概念对我来说似乎有些遥远和复杂。然而,事实证明我的顾虑是多余的。这本书的叙述方式非常生动有趣,即使是对于那些对数学不那么敏感的读者,也能轻松跟上作者的思路。我特别欣赏书中关于“为何要使用SVM”的论述,作者通过一系列精心设计的对比实验和案例,生动地展示了SVM相对于其他分类器在某些场景下的优势。书中还讨论了一些“工程化”的议题,比如如何优化SVM的训练速度,如何进行模型的评估和选择,这些内容对于我这样希望将理论知识落地到实际项目中的人来说,具有非常高的参考价值。这本书让我对SVM有了更全面、更深刻的认识,也激发了我进一步探索机器学习其他领域的热情。

评分

作为一名在业界摸爬滚打多年的数据科学家,我见过太多的机器学习书籍,有的过于理论化,有的又过于浮于表面。这本书的出现,如同一股清流,完美地平衡了理论深度与工程实践。我尤其欣赏作者在讨论SVM的“拓展”部分所展现出的前瞻性。除了经典的核方法,书中还涵盖了如多类分类、结构化SVM等更高级的主题,这对于我希望在复杂问题上应用SVM的场景至关重要。而且,作者并没有回避SVM在某些方面的局限性,例如对大规模数据的处理能力,并给出了相应的改进思路和算法,这体现了作者严谨的学术态度和丰富的实践经验。阅读过程中,我仿佛和一位经验丰富的导师在进行一场深入的知识交流,受益匪浅。

评分

这本书简直是为那些想要在机器学习领域“打下坚实基础”的同学量身定做的!我是一名刚入门机器学习的学生,之前学习SVM总是觉得云里雾里,很多公式看了半天也无法理解其含义。但是,自从我翻开这本书,一切都变得豁然开朗。作者的讲解风格非常清晰,从最简单的概念开始,一步一步地引导读者建立起完整的知识体系。书中的图解设计得非常巧妙,每一个图都恰到好处地解释了某个原理,让我能够直观地理解SVM的工作机制。我最喜欢的部分是关于核函数的介绍,作者用了大量的篇幅去解释为什么核函数如此强大,以及如何巧妙地选择不同的核函数来适应不同的数据类型。读完这些章节,我感觉自己对SVM的理解达到了一个新的高度。

评分

如果说机器学习领域有“基石”级别的著作,那这本《支持向量机:理论、算法与拓展》绝对占据一席之地。我是在参与一个图像识别项目时,第一次深入接触到SVM,当时只是浅尝辄止,对它的强大之处略有耳闻。这次是抱着“一次性搞懂”的心态来阅读这本书,结果远超预期。它不仅仅是停留在理论层面,更重要的是,书中对各种算法的实现细节做了非常细致的阐述,包括不同优化算法的选择、参数调优的策略等等,这对于我这种需要将理论转化为实际应用的研究人员来说,简直是福音。书中的案例分析也十分贴合实际,让人能立刻感受到SVM在解决现实问题时的威力,例如文本分类、人脸识别等,读完之后,我感觉自己对如何选择和应用SVM有了全新的认识。

评分

一本理论严谨、实践导向的机器学习宝典!作为一名渴望深入理解机器学习底层逻辑的研究生,我一直希望找到一本能够系统讲解核心算法的书籍。这本书无疑满足了我对“深入”的期待。它从最基础的线性可分情况出发,层层递进,详细剖析了支持向量机的几何解释、核函数的神奇之处,以及如何处理非线性可分问题。书中不仅有详实的数学推导,更是穿插了大量的图示和直观的比喻,让那些原本晦涩的数学概念变得清晰易懂。我特别喜欢其中对拉格朗日乘子法和对偶问题的讲解,这是理解SVM的关键,作者的处理方式避免了枯燥的公式轰炸,而是将其置于解决实际问题的框架下,读来引人入胜。

评分

送货快,比较方便。

评分

还没看,质量还行

评分

印刷质量还可以,内容精炼,有一定的参考价值。

评分

还不错,可以的

评分

这本书是只降级到国内的最棒的一本书了,所以买来读一下,希望能够获得一些新的体验

评分

很好.........................

评分

好东西,值得推荐,很好用哦。

评分

理论上很翔实,但关于如何应用的少了些,纯理论的书

评分

这本书是只降级到国内的最棒的一本书了,所以买来读一下,希望能够获得一些新的体验

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有