内容简介
回归分析是研究变量之间相互关系的一种统计推断方法,它在社会、经济、工程、医药卫生、工农业、气象水文等领域有着广泛的应用。《应用回归分析》是高等院校"应用回归分析"课程的教材,结合实际案例和统计软件较全面系统地介绍应用回归分析的基本理论、方法及其应用。《应用回归分析》以最小二乘估计、极大似然估计、一元线性模型、多元线性模型、变量选择以及缺失数据分析为主线,介绍数据建模过程及其预测。《应用回归分析》力求通俗易懂和实用性原则,注重理论与实际应用相结合、尽可能多地引入应用回归分析的最新进展和发展动态。每章均配有适量的习题和计算机作业,可供教师和学生选用。
内页插图
目录
前言
第1章 一些基本概念
1.1 数据和变量
1.2 变量之间的关系
1.2.1 定量变量间的关系
1.2.2 定性变量间的关系
1.2.3 定性和定量变量间的混合关系
1.3 回归分析与相关分析
1.3.1 回归分析
1.3.2 相关分析
1.3.3 相关分析的内容
1.3.4 相关关系的种类
1.4 建立回归模型的步骤
复习思考题
第2章 一元线性回归分析
2.1 一元线性回归模型
2.1.1 一元线性回归模型的数据例子
2.1.2 一元线性回归模型的数学形式
2.2 参数估计及其性质
2.2.1 最小二乘估计
2.2.2 极大似然估计
2.2.3 参数估计的性质
2.2.4 实例分析及R软件应用
2.3 显著性检验
2.3.1 回归方程的显著性检验
2.3.2 实例分析及R软件应用
2.4 预测与决策
2.4.1 点预测
2.4.2 区间预测
2.4。 3 控制问题
2.5 因变量缺失的一元线性回归模型
2.5.1 缺失数据机制
2.5.2 处理缺失数据的常用方法
2.5.3 填充最小二乘估计
复习思考题
第3章 多元线性回归分析
3.1 多元线性回归模型
3.2 参数估计及其性质
3.2.1 最小二乘估计
3.2.2 最大似然估计
3.2.3 估计量的性质
3.2.4 实例分析及R软件应用
3.3 多元线性回归模型的假设检验
3.3.1 回归方程的显著性检验
3.3.2 回归系数的显著性检验
3.3.3 实例分析及R软件应用
3.4 多元线性回归模型的广义最小二乘估计
3.5 相关阵及偏相关系数
3.6 预测与控制
3.7 因变量缺失的多元线性回归模型
复习思考题
第4章 自变量选择
4.1 自变量选择对模型参数估计及预测的影响
4。 1.1 关于全模型与选模型
4.1.2 自变量选择对回归模型的参数估计及预测的影响
4.2 自变量选择准则
4.2.1 所有子集的数目
4.2.2 自变量选择准则
4.3 自变量选择方法
4.3.1 向前法
4.3.2 向后法
4.3.3 逐步回归法
4.3.4 案例分析及R软件应用
4.4 缺失数据回归模型的自变量选择
复习思考题
第5章 多元线性回归模型的统计诊断
5。 1 异常点和影响点
5.2 残差及其性质
5.3 异常点的诊断
5.3.1 残差图
5.3.2 基于数据删除模型的异常点检验
5.3.3 基于均值漂移模型的异常点检验
5.4 强影响点的诊断
5.4.1 诊断统计量
5.4.2 实例分析及R软件应用
5.5 异方差性诊断
5.5.1 异方差产生的原因及背景
5.5.2 异方差性检验及其处理
5.5.3 实例分析
5.6 自相关性问题及其处理
5.7 多重共线性问题及其处理
5.7.1 多重共线性产生的背景及原因
5.7.2 多重共线性对回归分析的影响
5.7.3 多重共线性的诊断
5.7.4 消除多重共线性的方法
5.7.5 多重共线性实例分析
复习思考题
第6章 多元线性回归模型的有偏估计
6.1 引言
6.2 岭估计
6.2.1 岭估计的定义
6.2.2 岭估计的性质
6.2.3 岭参数的选取
6.2.4 实例分析
6.3 主成分估计
6.4 Stein压缩估计
复习思考题
第7章 非线性回归模型
7.1 引言
7.2 非线性回归模型的定义
7.3 非线性回归模型的参数估计及其算法
7.4 非线性回归模型的统计诊断
7.4.1 基于数据删除模型的影响分析
7.4.2 诊断模型分析
7.4.3 方差齐性检验
7.5 带有缺失数据的非线性回归模型
复习思考题
第8章 含定性变量的回归模型
8.1 引言
8.2 自变量含有定性变量的回归模型
8.3 因变量含有定性变量的回归模型
8.4 Logistic回归模型的参数估计及其算法
复习思考题
第9章 广义线性回归模型
9.1 引言
9.2 广义线性模型
9.2.1 单参数指数分布族及其性质
9.2.2 广义线性模型的参数估计
9.3 实例分析
复习思考题
参考文献
附表1 相关系数临界值ra表
附表2 t分布表
附表3 F分布表
附表4 DW检验上下界表
精彩书摘
1.4 建立回归模型的步骤
一般来说,对一个实际问题建立回归模型,需要考虑下面六个步骤。
第一步:根据研究目的,设置指标变量
回归模型主要是用来揭示事物间相关变量的数量关系。首先要根据所研究的问题设置因变量y,然后再选取与y有统计关系的一些变量作为自变量。
通常情况下,我们希望因变量与自变量之间具有因果关系。尤其是在研究具体实际问题时,我们必须根据实际问题的研究目的,确定实际问题中各因素之间的因果关系。
对于一个具体的问题,当研究目的确定后,被解释变量容易确定,被解释变量一般直接表达、刻画研究目的。另外,不要认为一个回归模型所涉及的解释变量越多越好。一个经济模型,如果把一些主要变量漏掉肯定会影响模型的应用效果,但如果引入的变量太多,可能会选择一些与问题无关的变量,还可能由于一些变量的相关性很强,它们所反映的信息有严重的重叠,这就有可能出现共线性问题。当变量太多时,计算工作量太大,计算误差就大,估计的模型参数精度自然不高。
总之,回归变量的确定是一个非常重要的问题,是建立回归模型最基本的工作。这个工作一般一次并不能完全确定,通常要反复比较,最终选出最适合的一些变量。
第二步:收集、整理统计数据
回归模型的建立是基于回归变量的样本统计数据。当确定好回归模型的变量之后,就要对这些变量进行收集、整理和统计数据。数据的收集是建立回归模型的重要环节,数据质量如何,对回归模型有至关重要的影响。
常用的样本数据分为时间序列数据和横截面数据。
时间序列数据,就是按时间顺序排列的统计数据。如最近10年的CPI、PPI统计数据。时间序列数据容易产生模型中随机误差项的序列相关,这是因为许多经济变量的前后期之间总是有关系的。如在建立需求模型时,人们的消费习惯、商品短缺程度等具有一定的延续性,它们对相当一段时间的需求量有影响,这样就产生随机误差项的序列相关。对于具有随机误差项序列相关的情况,最常用的处理方法是差分法,我们将在后面章节中详细介绍。
横截面数据,即为在同一时间截面上的统计数据。如同一年份全国35个大中城市的物价指数等都是横截面数据。当用截面数据作样本时、容易产生异方差性。这是因为一个回归模型往往涉及许多解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同影响,就产生异方差性。对于具有异方差性的建模问题,数据整理就要注意消除异方差性,这常与模型参数估计方法结合起来考虑,
不论是时间序列数据还是横截面数据的收集,样本容量的多少一般要与设置的解释变量数目相配套。通常为了使模型的参数估计更有效,要求样本容量n大于解释变量的个数p。样本容量的个数小于解释变量数目时:普通的最小二乘法失效。
……
前言/序言
随着计算机技术的快速发展与统计软件的开发使用,统计学在各行各业的应用越来越广泛。在这些应用中,如何用统计的理论和方法对给定的数据建立一个与之相符的回归模型呢?这是数据分析人员极为关心的一个重要问题。为了回答这个问题,本书首先从数据和变量的概念人手,深入浅出地介绍建立回归模型的一般步骤,一元线性回归模型与多元线性回归模型的参数估计理论和方法以及自变量选择,影响点和异常点的识别及处理,异方差性诊断和自相关性问题及处理、多重共线性问题及处理,多元线性回归模型的有偏估计,非线性回归模型和含定性变量的回归模型的参数估计理论、方法及算法,以及广义线性回归模型和缺失数据模型的统计分析等。这些内容为数据分析人员提供了一个完整的数据处理过程以及建立统计回归模型的技巧和方法。
尽管国内已有一些介绍回归分析的专著和教材,但他们大都用常见的统计软件,如SPSS、EXccl、Matlab等来介绍其回归分析的理论和方法。由于R软件不仅免费使用,而且它还拥有世界各地统计学家贡献的大量最新软件包且这些软件包的代码都是公开的,因此,R软件备受各国统计学家的广泛关注。目前国内也有一些基于R软件来介绍数据分析的教材,但没有系统地介绍回归分析的理论和方法。而本书所有的分析都是通过R软件来实现的,这就大大地增加了本书的实用性,这也是本书的一大特色。
为使学生了解回归分析的最新发展和适应新时期下社会对统计学发展的新需要,本书增加了一些国内其他回归分析教材中没有的,但是新近发展的且学生不难理解并富有实用价值的内容,如缺失数据模型的自变量选择、参数估计及其应用、广义线性回归模型及其参数估计和应用等。这些内容在社会学、经济学、教育学、心理学和抽样调查等领域有着广泛的应用。
本书收集、编写大量的实际例子,所用的数据例子都可以在《中国统计年鉴》网站上找到,并且包括最新的数据,如20u年的数据等,每一数据例子都配有相应的R程序。这些例子还反映了回归分析方法应用的很多方面的问题。同时,本书各章还附有习题。这对培养学生的动手能力和应用所学知识解决实际问题的能力都是非常有益的。
本书力求理论结合实际例子讲授回归分析方法的直观意义、来龙去脉、什么问题用什么方法解决以及证明的思路。有的证明放在本书习题中,请学生参阅有关书目或自行完成。
本书除了作为统计学专业本科生的教学用书,还可作为应用统计硕士的教学用书,也可作为从事统计理论研究和实际应用的统计工作者、教师和学生的教学参考书。此外,本书还可作为从事社会学、教育学、心理学、经济学、金融学、人口学、生物医学以及临床研究等领域的理论研究者和实际应用者的参考书。
感谢科学出版社成都有限责任公司郝玉龙编辑。
由于编写时间紧且编者水平有限,书中难免有不足之处,敬请读者和同行批评指正。
唐年胜 李会琼
2013年9月17日于昆明
应用回归分析 电子书 下载 mobi epub pdf txt