包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习

包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习 pdf epub mobi txt 电子书 下载 2025

图书标签:
  • 深度学习
  • 机器学习
  • 人工智能
  • AI
  • 深度学习教程
  • 中文版
  • 北大张志华
  • 算法
  • 数据科学
  • 机器学习教材
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 墨马图书旗舰店
出版社: 人民邮电出版社
ISBN:9787115461476
商品编码:14398630146

具体描述












 商品基本信息,请以下列介绍为准
商品名称:

 

  深度学习

作者:

  [美]Ian Goodfellow(伊恩·古德费洛)、[加]Yoshua Bengio(约书亚·本吉奥)

  、[加]Aaron Courville(亚伦·库维尔)

市场价:  168元
ISBN号:  9787115461476
出版社:  人民邮电出版社
商品类型:  图书


  其他参考信息(以实物为准)
  
  装帧:平装-胶订  开本:16开  语种:中文
  出版时间:2018-08  版次:1  页数:500
  印刷时间:2017年08月01日  印次:1  字数:484.00千字


编辑推荐

AI圣经!深度学习领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐! 深度学习是机器学习的一个分支,它能够使计算机通过层次概念来学习经验和理解世界。因为计算机能够从经验中获取知识,所以不需要人类来形式化地定义计算机需要的所有知识。层次概念允许计算机通过构造简单的概念来学习复杂的概念,而这些分层的图结构将具有很深的层次。本书会介绍深度学习领域的许多主题。 本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容。同时,它还介绍了工业界中实践者用到的深度学习技术,包括深度前馈网络、正则化、优化算法、卷积网络、序列建模和实践方法等,并且调研了诸如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学以及视频游戏方面的应用。*后,本书还提供了一些研究方向,涵盖的理论主题包括线性因子模型、自编码器、表示学习、结构化概率模型、蒙特卡罗方法、配分函数、近似推断以及深度生成模型。 《深度学习》这本书既可以被本科生或研究生用于规划其学术界或工业界生涯,也适用于希望在各种产品或平台上开始使用深度学习技术的软件工程师。作者在本书的配套网站上为读者和教师提供了补充资料。中文版读者可以访问人民邮电出版社异步社区www.epubit.com.cn获取相关信息。 封面特色: 由艺术家Daniel Ambrosi提供的中央公园杜鹃花步道梦幻景观。在Ambrosi的亿级像素全景图上,应用Joseph Smarr(Google)和Chirs Lamb(NVIDIA)修改后的Google DeepDream开源程序,创造了Daniel Ambrosi的“幻景”。 


目录

第 1 章 引言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 
1.1 本书面向的读者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 
1.2 深度学习的历史趋势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 
1.2.1 神经网络的众多名称和命运变迁 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 
1.2.2 与日俱增的数据量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 
1.2.3 与日俱增的模型规模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 
1.2.4 与日俱增的精度、复杂度和对现实世界的冲击 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

第 1 部分 应用数学与机器学习基础 
第 2 章 线性代数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 
2.1 标量、向量、矩阵和张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 
2.2 矩阵和向量相乘. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21 
2.3 单位矩阵和逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 
2.4 线性相关和生成子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 
2.5 范数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24 
2.6 特殊类型的矩阵和向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 
2.7 特征分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 
2.8 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 
2.9 Moore-Penrose 伪逆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 
2.10 迹运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 
2.11 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 
2.12 实例:主成分分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 
第 3 章 概率与信息论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34 
3.1 为什么要使用概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 
3.2 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 
3.3 概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 
3.3.1 离散型变量和概率质量函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 
3.3.2 连续型变量和概率密度函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 
3.4 边缘概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.5 条件概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 
3.6 条件概率的链式法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.7 独立性和条件独立性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 
3.8 期望、方差和协方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 
3.9 常用概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 
3.9.1 Bernoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 
3.9.2 Multinoulli 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 
3.9.3 高斯分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 
3.9.4 指数分布和 Laplace 分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 
3.9.5 Dirac 分布和经验分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 
3.9.6 分布的混合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 
3.10 常用函数的有用性质. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43 
3.11 贝叶斯规则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.12 连续型变量的技术细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 
3.13 信息论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 
3.14 结构化概率模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 
第 4 章 数值计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 
4.1 上溢和下溢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 
4.2 病态条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 
4.3 基于梯度的优化方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 
4.3.1 梯度之上:Jacobian 和 Hessian 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 
4.4 约束优化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 
4.5 实例:线性zui小二乘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 
第 5 章 机器学习基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63 
5.1 学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 
5.1.1 任务 T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 
5.1.2 性能度量 P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 
5.1.3 经验 E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 
5.1.4 示例:线性回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 
5.2 容量、过拟合和欠拟合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 
5.2.1 没有免费午餐定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 
5.2.2 正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 
5.3 超参数和验证集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76 
5.3.1 交叉验证 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 
5.4 估计、偏差和方差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77 
5.4.1 点估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 
5.4.2 偏差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 
5.4.3 方差和标准差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 
5.4.4 权衡偏差和方差以zui小化均方误差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 
5.4.5 一致性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 
5.5 zui大似然估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 
5.5.1 条件对数似然和均方误差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84
5.5.2 zui大似然的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 
5.6 贝叶斯统计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 
5.6.1 zui大后验 (MAP) 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 
5.7 监督学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 
5.7.1 概率监督学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 
5.7.2 支持向量机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 
5.7.3 其他简单的监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 
5.8 无监督学习算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 
5.8.1 主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 
5.8.2 k-均值聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 
5.9 随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 
5.10 构建机器学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 
5.11 促使深度学习发展的挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 
5.11.1 维数灾难 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 
5.11.2 局部不变性和平滑正则化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 
5.11.3 流形学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 

第 2 部分 深度网络:现代实践 
第 6 章 深度前馈网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 
6.1 实例:学习 XOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 
6.2 基于梯度的学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 
6.2.1 代价函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 
6.2.2 输出单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 
6.3 隐藏单元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .119 
6.3.1 整流线性单元及其扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 
6.3.2 logistic sigmoid 与双曲正切函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 
6.3.3 其他隐藏单元 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 
6.4 架构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 
6.4.1 万能近似性质和深度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .123 
6.4.2 其他架构上的考虑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 
6.5 反向传播和其他的微分算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 
6.5.1 计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 
6.5.2 微积分中的链式法则. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128 
6.5.3 递归地使用链式法则来实现反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 
6.5.4 全连接 MLP 中的反向传播计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 
6.5.5 符号到符号的导数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131 
6.5.6 一般化的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 
6.5.7 实例:用于 MLP 训练的反向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135 
6.5.8 复杂化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.5.9 深度学习界以外的微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 
6.5.10 高阶微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 
6.6 历史小记. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139 

.........



作者简介

 Ian Goodfellow,谷歌公司(Google) 的研究科学家,2014 年蒙特利尔大学机器学习博士。他的研究兴趣涵盖大多数深度学习主题,特别是生成模型以及机器学习的安全和隐私。Ian Goodfellow 在研究对抗样本方面是一位有影响力的早期研究者,他发明了生成式对抗网络,在深度学习领域贡献卓越。 Yoshua Bengio,蒙特利尔大学计算机科学与运筹学系(DIRO) 的教授,蒙特利尔学习算法研究所(MILA) 的负责人,CIFAR 项目的共同负责人,加拿大统计学习算法研究主席。Yoshua Bengio 的主要研究目标是了解产生智力的学习原则。他还教授“机器学习”研究生课程(IFT6266),并培养了一大批研究生和博士后。 Aaron Courville,蒙特利尔大学计算机科学与运筹学系的助理教授,也是LISA 实验室的成员。目前他的研究兴趣集中在发展深度学习模型和方法,特别是开发概率模型和新颖的推断方法。Aaron Courville 主要专注于计算机视觉应用,在其他领域,如自然语言处理、音频信号处理、语音理解和其他AI 相关任务方面也有所研究。 中文版审校者简介 张志华,北京大学数学科学学院统计学教授,北京大学大数据研究中心和北京大数据研究院数据科学教授,主要从事机器学习和应用统计学的教学与研究工作。 译者简介 赵申剑,上海交通大学计算机系硕士研究生,研究方向为数值优化和自然语言处理。 黎彧君,上海交通大学计算机系博士研究生,研究方向为数值优化和强化学习。 符天凡,上海交通大学计算机系硕士研究生,研究方向为贝叶斯推断。 李凯,上海交通大学计算机系博士研究生,研究方向为博弈论和强化学习。


  内容简介

《深度学习》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是深度学习未来的研究重点。 《深度学习》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

《深度学习》是一本旨在全面介绍深度学习理论与实践的权威著作。本书由人工智能领域的知名学者倾力打造,深入浅出地阐述了深度学习的核心概念、关键算法以及在实际应用中的挑战与解决方案。本书内容丰富,结构清晰,理论与实践并重,适合作为高等院校相关专业学生的教材,也可供从事人工智能、机器学习、数据科学等领域的研究人员和工程师作为参考书。 第一部分:基础概念与数学准备 在深入探讨深度学习的奥秘之前,本书首先为读者打下坚实的理论基础。本部分将详细回顾和介绍支撑深度学习的必要数学工具,包括: 线性代数: 向量、矩阵、张量等概念及其运算,协方差矩阵、特征值、特征向量等在模型表达和优化中的作用。理解线性代数对于理解神经网络的权重更新、数据表示至关重要。 概率论与统计学: 概率分布、期望、方差、贝叶斯定理、最大似然估计、最大后验估计等。这些概念是理解模型不确定性、损失函数设计以及模型评估的基石。 微积分: 导数、偏导数、链式法则、梯度下降等。微积分是优化算法的核心,掌握其原理能够帮助读者理解神经网络如何通过梯度下降算法进行学习。 在掌握了这些基础数学工具后,本书将引导读者进入深度学习的核心领域。 第二部分:核心机器学习模型回顾 在进入深度学习模型之前,本书将简要回顾和梳理传统的机器学习模型,这有助于读者理解深度学习是如何在这些基础上发展起来并取得突破的。这一部分将涵盖: 监督学习: 回顾线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林等经典模型,理解它们的工作原理、优缺点以及适用场景。 无监督学习: 介绍聚类算法(如K-Means)、降维技术(如主成分分析PCA)、密度估计等。 模型评估与选择: 重点介绍交叉验证、偏差-方差权衡、过拟合与欠拟合等关键概念,为后续的模型选择和调优奠定基础。 第三部分:神经网络基础 本部分将是深度学习的真正起点,详细介绍构成深度学习模型的基本单元——神经网络。 感知机: 作为最简单的神经网络模型,介绍其结构、激活函数以及如何进行二分类。 多层感知机(MLP): 介绍隐藏层、激活函数(如Sigmoid, Tanh, ReLU)、前向传播和反向传播算法。详细讲解反向传播算法如何利用链式法则计算梯度,指导网络参数的更新。 激活函数: 深入分析不同激活函数(Sigmoid, Tanh, ReLU及其变种Leaky ReLU, ELU等)的特性、优缺点以及在不同层级选择的考量。 损失函数: 介绍用于衡量模型预测误差的各种损失函数,如均方误差(MSE)、交叉熵损失(Cross-Entropy Loss)等,并讨论它们在不同任务中的适用性。 优化算法: 除了基础的梯度下降,还将介绍更高级的优化算法,如随机梯度下降(SGD)及其动量(Momentum)、Adam、RMSprop等,解释它们如何加速收敛并克服局部最优问题。 第四部分:深度神经网络(DNN)与正则化 随着层数的增加,神经网络的能力得到极大提升,但也带来了新的挑战。本部分将重点探讨深度神经网络的构建和训练技巧。 深度神经网络的构建: 讨论如何设计具有多个隐藏层的网络结构,以及层数、节点数选择的原则。 过拟合与欠拟合: 详细阐述过拟合和欠拟合的现象、成因,并提出多种有效的正则化技术来缓解这些问题。 正则化技术: L1与L2正则化: 解释如何通过在损失函数中添加L1或L2范数惩罚项来约束模型权重。 Dropout: 详细介绍Dropout的工作原理,即在训练过程中随机“丢弃”一部分神经元,以防止神经元之间的协同适应,从而提高模型的泛化能力。 Batch Normalization: 解释Batch Normalization如何对每一层的输入进行归一化,稳定训练过程,加速收敛,并起到一定的正则化作用。 Early Stopping: 介绍通过监控验证集上的性能来决定何时停止训练,以避免过拟合。 第五部分:卷积神经网络(CNN) 卷积神经网络是深度学习在图像处理领域取得巨大成功的关键。本部分将深入剖析CNN的原理和应用。 卷积层: 介绍卷积操作、卷积核(滤波器)、感受野、步长(stride)、填充(padding)等核心概念。讲解卷积层如何通过局部连接和权值共享提取图像的 spatial features。 池化层(Pooling Layer): 介绍最大池化(Max Pooling)和平均池化(Average Pooling),解释其作用在于降维、减少计算量以及提高模型的鲁棒性。 CNN的典型结构: 介绍LeNet、AlexNet、VGG、GoogLeNet、ResNet等经典的CNN架构,分析它们的创新之处和发展演进。 CNN的应用: 重点介绍CNN在图像分类、目标检测、图像分割、人脸识别等任务中的应用。 第六部分:循环神经网络(RNN)与序列模型 对于处理序列数据(如文本、语音、时间序列),循环神经网络及其变种扮演着至关重要的角色。 循环神经网络(RNN): 介绍RNN的基本结构,包括循环连接、隐藏状态,以及其处理序列信息的能力。 RNN的挑战: 讨论RNN在处理长序列时面临的梯度消失和梯度爆炸问题。 长短期记忆网络(LSTM): 详细讲解LSTM的门控机制(输入门、遗忘门、输出门)如何有效地缓解梯度问题,使其能够学习长距离依赖关系。 门控循环单元(GRU): 介绍GRU作为LSTM的简化版本,分析其结构和性能。 序列到序列模型(Seq2Seq): 介绍Seq2Seq模型框架,包括编码器(Encoder)和解码器(Decoder),以及在机器翻译、文本摘要等任务中的应用。 注意力机制(Attention Mechanism): 深入讲解注意力机制如何让模型在处理序列时更加关注输入序列中的重要部分,极大地提升了Seq2Seq模型的性能。 第七部分:生成模型 生成模型是深度学习在创造新数据方面的重要突破。本部分将介绍两大类重要的生成模型。 变分自编码器(VAE): 解释VAE的编码器-解码器结构,以及如何通过引入潜在空间和重参数化技巧来生成新的数据样本。 生成对抗网络(GAN): 详细阐述GAN的生成器(Generator)和判别器(Discriminator)之间的对抗训练过程,以及其在图像生成、风格迁移等领域的强大能力。 第八部分:高级主题与实践 在掌握了深度学习的核心模型后,本书还将探讨一些更高级的主题和实际应用中的关键考虑因素。 迁移学习(Transfer Learning): 介绍如何利用预训练模型来加速新任务的学习,以及在不同任务之间迁移知识的策略。 模型部署与推理: 讨论将训练好的深度学习模型部署到实际应用中的挑战,以及模型优化和推理加速的技术。 深度学习框架: 简要介绍主流的深度学习框架,如TensorFlow、PyTorch等,及其在模型开发和实验中的作用。 伦理与安全: 探讨深度学习技术在发展中可能带来的伦理问题和社会影响,以及如何保障AI系统的安全与公平。 本书特点: 理论严谨: 深入剖析各类算法背后的数学原理,确保读者真正理解其工作机制。 实践导向: 结合丰富的代码示例和实际应用案例,帮助读者将理论知识转化为实践能力。 循序渐进: 从基础概念到高级模型,逻辑清晰,难度逐步提升,适合不同层次的学习者。 前沿性: 涵盖了深度学习领域近年来涌现出的重要进展和热门技术。 权威性: 由领域内专家审校,确保内容的准确性和权威性。 《深度学习》一书将带领读者踏上一段探索人工智能核心技术的精彩旅程,为理解和应用深度学习提供坚实的基础和全面的指导。

用户评价

评分

我本来就对人工智能领域很感兴趣,但总觉得那些资料要么太理论化,要么就是一些浅尝辄止的介绍,缺乏系统性。这次看到这本《包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习》简直是惊喜!“AI圣经”这个名字虽然有点夸张,但确实能感受到它内容的深度和广度。我尤其看重的是“北大张志华教授审校”这几个字,这意味着书中的内容经过了严格的学术检验,准确性和权威性有了保障。收到书后,我立刻翻看了一下目录,发现涵盖了从基础的机器学习理论到各种深度学习模型,比如卷积神经网络、循环神经网络等等,应有尽有。而且,感觉它在讲解过程中,不仅仅是罗列公式,还会结合一些实际的案例和解释,这对于我这种理论实践都需要兼顾的学习者来说,非常重要。我希望能通过这本书,真正地掌握深度学习的原理,并且能够将其应用到实际项目中去。这本书的出版,无疑为我打开了通往AI世界的一条更清晰、更坚实的道路。

评分

天啊,拿到这本《包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习》真是太激动了!我一直对深度学习这个领域充满了好奇,感觉它就像是打开了人工智能世界的一扇大门,而张志华教授的名字更是如雷贯耳,知道他审校过,心里就更踏实了。这本书拿在手里沉甸甸的,厚实感满满,感觉内容一定非常扎实。封面设计也很简洁大气,没有太多花哨的东西,一看就是一本认真做学问的书。我刚翻了几页,就被那种严谨的学术氛围吸引住了。感觉作者在介绍一些基础概念的时候,循序渐进,一点一点地铺垫,不会上来就抛出复杂的公式让人望而却步。而且,它采用了中文版,这对我这种英语苦手来说简直是福音!之前看一些英文原版资料,总是感觉隔了一层纱,理解起来非常费力,现在能读到这样一本由国内顶尖教授审校的中文深度学习书籍,感觉学习的效率肯定会大大提高。我迫不及待地想开始我的深度学习之旅了,希望这本书能带我深入理解AI的核心奥秘。

评分

说实话,市面上关于深度学习的书籍琳琅满目,但真正能让我眼前一亮的并不多。这本《包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习》在我看来,绝对是其中的佼佼者。首先,它的定位就非常明确,既有“深度学习”的核心内容,也涵盖了更广泛的“机器学习”知识,并且有“AI圣经”这样响亮的称号,预示着其内容的权威性和全面性。最关键的是“北大张志华教授审校”这几个字,这对于想深入学习AI的学生和研究者来说,是极大的信心保证。我之前接触过一些国外的深度学习教程,虽然内容很好,但翻译过来的版本常常存在一些理解上的偏差,而这本中文版,由国内名师审校,自然能保证语言的流畅度和概念的准确性。拿到书后,我大概翻阅了一下,排版清晰,图文并茂,感觉阅读体验会很不错。我对这本书充满了期待,希望它能成为我学习深度学习的得力助手。

评分

作为一个对人工智能领域充满热情但又苦于没有合适入门材料的学习者,我一直在寻找一本能够系统、深入地讲解深度学习的中文书籍。这次《包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习》的出现,无疑让我眼前一亮。首先,“AI圣经”这个名字就极具吸引力,暗示了其内容的全面性和重要性。而“北大张志华教授审校”更是为这本书的权威性和准确性打下了坚实的基础。我曾接触过一些英文的深度学习资料,虽然内容很棒,但翻译质量参差不齐,有时还会因为语言障碍而影响理解。这本中文版,由国内名师把关,想必在语言的流畅度和专业术语的翻译上都会有很好的表现。我特别期待这本书能够将复杂的深度学习理论以一种通俗易懂的方式呈现出来,并且能够结合实际案例,帮助我更好地理解和应用所学知识,真正开启我在AI领域的探索之旅。

评分

我一直认为,要真正掌握一项技术,必须要有扎实的基础理论支撑,而不能仅仅停留在“会用”的层面。《包邮 深度学习 deep learning 中文版 AI圣经 北大张志华教授审校 机器学习》这本书,从书名就能看出其野心和价值。“AI圣经”的称号,加上国内顶尖学者张志华教授的审校,让我对其内容的高度专业性和前沿性充满信心。我曾尝试阅读一些零散的深度学习资料,但总感觉缺乏系统性,知识点之间衔接不够紧密。而这本书,从机器学习的基础概念入手,逐步深入到各种深度学习模型,我相信一定能构建起一个完整、清晰的学习脉络。对于我这样一个希望深入理解AI底层逻辑的学习者来说,这本中文版的书籍显得尤为珍贵。我希望通过这本书,不仅能学习到最新的AI技术,更能理解其背后的数学原理和算法思想,真正做到融会贯通。

评分

印刷质量不错,纸张也挺好!赞一个

评分

东西不错,已经开始用了,之后会继续支持

评分

,,,,,,,,xxxx

评分

很不错,内容很全。

评分

很不错,内容很全。

评分

物流慢

评分

物流很慢,客服回复很慢,态度一般。书籍是不是正版不知道,包装简陋,书籍容易受损。

评分

发货,物流,都很快。很好。好久没见过大小完全合适的泡泡袋子了哈哈哈。书完全没有损坏。谢谢卖家送的书签。

评分

包装完好。京东的物流就是给力,好评,下次还会光临。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有