发表于2024-12-17
【正版】精通数据科学 从线性回归到深度学习 pdf epub mobi txt 电子书 下载
书 名 精通数据科学 从线性回归到深度学习
ISBN 9787115479105
作 者 唐亘
开 本 16 开
印 张 27
字 数 549 千字
页 数 432 页
装 帧 平装
版 次 1版1次
初版时间 2018年6月
本 印 次 2018年6月
定 价 99.00 元
内容简介本书全面讲解了数据科学的相关知识,从统计分析学到机器学习、深度学习中用到的算法及模型,借鉴经济学视角给出模型的相关解释,深入探讨模型的可用性,并结合大量的实际案例和代码帮助读者学以致用,将具体的应用场景和现有的模型相结合,从而*好地发现模型的潜在应用场景。
本书可作为数据科学家和数据工程师的学习用书,也适合对数据科学有强烈兴趣的初学者使用,同时也可作为高等院校计算机、数学及相关的师生用书和培训学校的教材。
目录1章 数据科学概述 1
1.1 挑战 2
1.1.1 工程实现的挑战 2
1.1.2 模型搭建的挑战 3
1.2 机器学习 5
1.2.1 机器学习与传统编程 5
1.2.2 监督式学习和非监督式学习 8
1.3 统计模型 8
1.4 关于本书 10
2章 Python安装指南与简介:告别空谈 12
2.1 Python简介 13
2.1.1 什么是Python 15
2.1.2 Python在数据科学中的地位 16
2.1.3 不可能绕过的三方库 17
2.2 Python安装 17
2.2.1 Windows下的安装 18
2.2.2 Mac下的安装 21
2.2.3 Linux下的安装 24
2.3 Python上手实践 26
2.3.1 Python shell 26
2.3.2 一个Python程序:Word Count 28
2.3.3 Python编程基础 30
2.3.4 Python的工程结构 34
2.4 本章小结 35
3章 数学基础:恼人但又不可或缺的知识 36
3.1 矩阵和向量空间 37
3.1.1 标量、向量与矩阵 37
3.1.2 特殊矩阵 39
3.1.3 矩阵运算 39
3.1.4 代码实现 42
3.1.5 向量空间 44
3.2 概率:量化随机 46
3.2.1 定义概率:事件和概率空间 47
3.2.2 条件概率:信息的价值 48
3.2.3 随机变量:两种不同的随机 50
3.2.4 正态分布:殊途同归 52
3.2.5 P-value:自信的猜测 53
3.3 微积分 55
3.3.1 导数和积分:位置、速度 55
3.3.2 极限:变化的终点 57
3.3.3 复合函数:链式法则 58
3.3.4 多元函数:偏导数 59
3.3.5 极值与值:优选择 59
3.4 本章小结 61
4章 线性回归:模型之母 62
4.1 一个简单的例子 64
4.1.1 从机器学习的角度看这个问题 66
4.1.2 从统计学的角度看这个问题 69
4.2 上手实践:模型实现 73
4.2.1 机器学习代码实现 74
4.2.2 统计方法代码实现 77
4.3 模型陷阱 82
4.3.1 过度拟合:模型越复杂越好吗 84
4.3.2 模型幻觉之统计学方案:假设检验 87
4.3.3 模型幻觉之机器学习方案:惩罚项 89
4.3.4 比较两种方案 92
4.4 模型持久化 92
4.4.1 模型的生命周期 93
4.4.2 保存模型 93
4.5 本章小结 96
5章 逻辑回归:隐藏因子 97
5.1 二元分类问题:是与否 98
5.1.1 线性回归:为何失效 98
5.1.2 窗口效应:看不见的才是关键 100
5.1.3 逻辑分布:胜者生存 102
5.1.4 参数估计之似然函数:统计学角度 104
5.1.5 参数估计之损失函数:机器学习角度 104
5.1.6 参数估计之终预测:从概率到选择 106
5.1.7 空间变换:非线性到线性 106
5.2 上手实践:模型实现 108
5.2.1 初步分析数据:直观印象 108
5.2.2 搭建模型 113
5.2.3 理解模型结果 116
5.3 评估模型效果:孰优孰劣 118
5.3.1 查准率与查全率 119
5.3.2 ROC曲线与AUC 123
5.4 多元分类问题:越是与否 127
5.4.1 多元逻辑回归:逻辑分布的威力 128
5.4.2 One-vs.-all:从二元到多元 129
5.4.3 模型实现 130
5.5 非均衡数据集 132
5.5.1 准确度悖论 132
5.5.2 一个例子 133
5.5.3 解决方法 135
5.6 本章小结 136
6章 工程实现:计算机是怎么算的 138
6.1 算法思路:模拟滚动 139
6.2 数值求解:梯度下降法 141
6.3 上手实践:代码实现 142
6.3.1 TensorFlow基础 143
6.3.2 定义模型 148
6.3.3 梯度下降 149
6.3.4 分析运行细节 150
6.4 更优化的算法:随机梯度下降法 153
6.4.1 算法细节 153
6.4.2 代码实现 154
6.4.3 两种算法比较 156
6.5 本章小结 158
7章 计量经济学的启示:他山之石 159
7.1 定量与定性:变量的数学运算合理吗 161
7.2 定性变量的处理 162
7.2.1 虚拟变量 162
7.2.2 上手实践:代码实现 164
7.2.3 从定性变量到定量变量 168
7.3 定量变量的处理 170
7.3.1 定量变量转换为定性变量 171
7.3.2 上手实践:代码实现 171
7.3.3 基于卡方检验的方法 173
7.4 显著性 175
7.5 多重共线性:多变量的烦恼 176
7.5.1 多重共线性效应 176
7.5.2 检测多重共线性 180
7.5.3 解决方法 185
7.5.4 虚拟变量陷阱 188
7.6 内生性:变化来自何处 191
7.6.1 来源 192
7.6.2 内生性效应 193
7.6.3 工具变量 195
【正版】精通数据科学 从线性回归到深度学习 电子书 下载 mobi epub pdf txt
【正版】精通数据科学 从线性回归到深度学习 pdf epub mobi txt 电子书 下载