内容简介
在社会科学研究中,许多数据都会以时间序列的形式出现,并随时间变化而变化。对时间序列的分析会遇到一些问题,其中*重要的便是时间序列数据往往违反经典回归的误差项不存在自相关的假设条件,因此在分析此类数据时,必须对自相关进行诊断。《时间序列分析:回归技术(第二版)》的核心便是对这些数据进行处理,以设计出合理的模型,指导实际工作。
主要特点
·《时间序列分析:回归技术(第二版)》是关于时间序列回归分析方法的新发展
·讨论了常用的几种广义*小二乘法分析时间序列模型的例子
·提供了利用SPSS、TSP和SAS等统计软件进行分析的方法
内页插图
目录
序
第1章 导言
第2章 时间序列回归分析:无滞后项实例
第1节 比率目标假设
第2节 误差项
第3节 时间序列回归模型
第4节 无自相关假设
第5节 违反无自相关假设的后果
第6节 自相关的常规检验
第7节 一种替代性的估计方法
第8节 EGLS估计(以一阶自相关过程为例)
第9节 小样本特性
第10节 比率目标假设再回顾
第11节 向多元回归扩展
第12节 结论
第3章 替代性时间依赖过程
第1节 替代性过程
第2节 检验高阶过程
第3节 过程识别
第4节 估计
第5节 结论
第4章 时间序列回归分析:滞后项实例
第1节 分布式的滞后模型
第2节 滞后内生变量
第3节 用滞后内生变量来检验模型中的自相关
第4节 估计
第5节 EGLS估计
第6节 改良型比率目标模型
第7节 对分布式滞后模型的解释
第8节 结论
第5章 预测
第1节 预测误差
第2节 预测生成
第3节 修正预测方程
第4节 预测评估
第5节 案例:预测美国国防开支
第6节 结论
第6章 总结
附录
注释
参考文献
精彩书摘
《时间序列分析:回归技术(第二版)》:
那我们如何才能够找到一个正确的过程呢?尽管没有任何办法确定究竟是哪一种过程产生了误差,我们却有可能通过所估计的残差以及基本的Box—Jenkins法(1976:46—84)来确定产生这些残差的过程的种类。
自相关函数的方程以及相关图已经向我们展示了一阶自相关过程会如何影响残差的相关情况。图2.7和图2.8更向我们说明自相关函数在正向或负向一阶自相关过程中分别的形态。希布斯(Hibbs,1974)举出了一个非常令人信服的例子,从而说明相关图是如何帮助我们辨别一个具体回归模型的扰动的产生过程。他的想法是首先使用OLS估计原有模型并得到残差,然后再使用这些残差来估计自相关函数并画出相关图。最后再拿这个实证相关图与各种扰动产生过程下的理论相关图进行比较。需要注意的是,一阶自相关过程仅仅是其中一种可能产生序列相关残差的模型。在下面部分,我们会分析几种其他时间依赖过程的相关图。因为它们在说明众多自相关函数及其扰动项方面有很大的灵活性,这些过程构成了扰动项模型的一个重要分类。
……
前言/序言
2003年,我赴港工作,在香港科技大学社会科学部教授研究生的两门核心定量方法课程。香港科技大学社会科学部自创建以来,非常重视社会科学研究方法论的训练。我开设的第一门课“社会科学里的统计学”为所有研究型硕士生和博士生的必修课,而第二门课“社会科学中的定量分析”为博士生的必修课(事实上,大部分硕士生在修完第一门课后都会继续选修第二门课)。我在讲授这两门课的时候,根据社会科学研究生的数理基础比较薄弱的特点,尽量避免复杂的数学公式推导,而用具体的例子,结合语言和图形,帮助学生理解统计的基本概念和模型。课程的重点放在如何应用定量分析模型研究社会实际问题上,即社会研究者主要为定量统计方法的“消费者”而非“生产者”。作为“消费者”,学完这些课程后,我们一方面能够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研究的文章;另一方面,也能在自己的研究中运用这些成熟的方法论技术。
上述两门课的内容,尽管在线性回归模型的内容上有少量重复,但各有侧重。“社会科学里的统计学”从介绍最基本的社会研究方法论和统计学原理开始,到多元线性回归模型结束,内容涵盖了描述性统计的基本方法、统计推论的原理、假设检验、列联表分析、方差和协方差分析、简单线性回归模型、多元线性回归模型,以及线性回归模型的假设和模型诊断。“社会科学中的定量分析”则介绍在经典线性回归模型的假设不成立的情况下的一些模型和方法,将重点放在因变量为定类数据的分析模型上,包括两分类的logistic回归模型、多分类logistic回归模型、定序logistic回归模型、条件logistic回归模型、多维列联表的对数线性和对数乘积模型、有关删节数据的模型、纵贯数据的分析模型,包括追踪研究和事件史的分析方法。这些模型在社会科学研究中有着更加广泛的应用。
修读过这些课程的香港科技大学的研究生,一直鼓励和支持我将两门课的讲稿结集出版,并帮助我将原来的英文课程讲稿译成了中文。但是,由于种种原因,这两本书拖了多年还没有完成。世界著名的出版社SAGE的“定量社会科学研究”丛书闻名遐迩,每本书都写得通俗易懂,与我的教学理念是相通的。当格致出版社向我提出从这套丛书中精选一批翻译,以飧中文读者时,我非常支持这个想法,因为这从某种程度上弥补了我的教科书未能出版的遗憾。
时间序列分析:回归技术(第二版) 简介 本书《时间序列分析:回归技术(第二版)》深入探讨了在时间序列数据分析领域中,回归分析作为一种强大的建模工具所扮演的核心角色。本书旨在为统计学、计量经济学、数据科学、金融学、工程学以及其他需要处理时间相关数据的学科领域的学生、研究人员和从业者提供一个全面而深入的学习平台。第二版在保留第一版核心内容的基础上,进一步更新了相关理论、模型和计算方法,并增加了更多贴近实际应用的案例,以反映该领域近年来飞速发展的技术和研究前沿。 内容概述 本书的写作逻辑清晰,从基础概念的引入,逐步深入到复杂模型的构建与应用,并最终拓展至模型诊断、预测以及更高级的主题。全书围绕“回归技术”这一核心,将回归分析的强大能力在时间序列分析的各种场景下予以充分展现。 第一部分:时间序列数据的基础与准备 在正式进入回归技术之前,本书首先为读者构建了一个坚实的基础。 时间序列数据的基本概念: 详细介绍了什么是时间序列数据,其与横截面数据的区别,以及时间序列数据中固有的特点,如趋势性(Trend)、季节性(Seasonality)、周期性(Cyclicity)和随机波动(Irregular Fluctuations)。通过清晰的定义和生动的例子,帮助读者理解这些基本组成部分。 数据可视化与初步探索: 强调了可视化在理解时间序列数据特性方面的重要性。介绍了几种常用的时间序列绘图技术,包括折线图、季节性子序列图、自相关图(ACF)和偏自相关图(PACF)等。这些工具能够直观地揭示数据的模式、周期性以及潜在的自相关结构,为后续建模提供重要线索。 平稳性检验与处理: 平稳性是许多时间序列模型(包括许多回归模型)的基本假设。本书详细介绍了什么是平稳性(严平稳和弱平稳),以及如何检验时间序列的平稳性,如单位根检验(Unit Root Tests),包括DF检验、ADF检验和KPSS检验等。当数据不平稳时,本书会详细讲解如何通过差分(Differencing)、对数变换(Log Transformation)等技术将其转化为平稳序列,为后续的回归建模做好数据准备。 第二部分:经典回归模型在时间序列中的应用 此部分是本书的核心,将经典回归模型巧妙地应用于时间序列分析的各种情境。 线性回归模型: 首先回顾了基本的线性回归模型,并在此基础上探讨其在时间序列中的应用。重点介绍了如何将时间作为解释变量来捕捉趋势,以及如何引入虚拟变量(Dummy Variables)来处理季节性效应和突发事件(如政策变动、节假日等)。 引入滞后变量的回归模型: 强调了时间序列数据中普遍存在的自相关性,即当前观测值可能与其自身过去的观测值相关。本书详细介绍了如何将过去值作为解释变量引入回归模型,即滞后回归模型(Lagged Regression Models)。这包括自回归(AR)和移动平均(MA)思想在回归模型中的体现。 包含趋势和季节性的回归模型: 结合前面介绍的趋势和季节性概念,本书展示了如何构建包含这些成分的完整回归模型。例如,可以构建一个模型,其中因变量是目标时间序列,解释变量包括时间趋势项、季节性虚拟变量以及可能存在的滞后因变量或滞后解释变量。 广义最小二乘法(GLS)与异方差(Heteroskedasticity): 讨论了在时间序列回归中,误差项可能存在自相关和异方差的问题。本书详细介绍了广义最小二乘法(GLS)及其变种(如Cochrane-Orcutt过程、Prais-Winsten估计等),用于处理误差项的自相关性。同时,也探讨了如何检测和处理异方差问题。 滞后因变量模型(Autoregressive Distributed Lag - ADL Models): 详细介绍了ADL模型,这是将当前因变量与过去因变量以及过去解释变量联系起来的强大框架。特别地,本书深入讲解了ARIMA(自回归积分滑动平均)模型的回归视角,解释了ARIMA模型如何看作是一种特殊的线性回归模型,其中加入了对过去观测值和过去误差项的依赖。 第三部分:时间序列回归模型的诊断与评估 一个良好的模型不仅需要构建,更需要严格的诊断和评估。 残差分析: 强调了残差分析在模型诊断中的关键作用。通过绘制残差图、检验残差的自相关性(ACF/PACF图)、进行异方差检验(如Breusch-Pagan检验、White检验)以及正态性检验(如Jarque-Bera检验),来判断模型是否充分捕捉了数据的模式,以及是否存在模型设定错误或其他问题。 模型选择标准: 介绍了多种用于模型选择的准则,如赤池信息准则(AIC)、贝叶斯信息准则(BIC)等。这些准则能够在模型拟合优度和模型复杂性之间取得平衡,帮助选择最优的模型。 多重共线性问题: 探讨了在时间序列回归中可能出现的多重共线性问题,并介绍了识别和处理多重共线性的方法,如计算方差膨胀因子(VIF)等。 第四部分:时间序列预测与应用 本书的最终目标是将建立的模型应用于实际预测。 基于回归的模型预测: 详细讲解如何利用已经估计出的回归模型进行未来值的预测。包括点预测(Point Forecast)和区间预测(Interval Forecast)。 外生变量的预测: 当回归模型中包含外生变量(Exogenous Variables)时,预测未来的因变量需要对这些外生变量的未来值进行预测或已知。本书会讨论如何处理这种情况。 不同类型时间序列的回归建模案例: 提供了丰富多样的实际应用案例,涵盖金融市场的股票价格预测、宏观经济指标的趋势分析、销售数据的季节性预测、工程领域的故障预测等。这些案例通过具体的代码实现和结果解读,帮助读者将理论知识转化为实践能力。 第五部分:高级主题与拓展 在掌握了经典回归技术后,本书进一步拓展到一些更高级的主题,以应对更复杂的时间序列问题。 包含解释变量的时间序列模型: 深入探讨了如何构建包含多个解释变量的时间序列回归模型,这些解释变量本身也可能是时间序列,或者需要考虑它们与因变量之间的动态关系。 结构性断点(Structural Breaks)的回归处理: 结构性断点是指时间序列的统计性质在某个时间点发生显著变化的现象。本书会介绍如何通过引入虚拟变量或使用专门的断点检验方法来处理结构性断点对回归模型的影响。 季节性自回归积分滑动平均(SARIMA)模型的回归视角: 进一步扩展到季节性时间序列的建模,并从回归的角度来解释SARIMA模型。 协整(Cointegration)与向量自回归(VAR)模型初步: 简要介绍协整的概念,即两个或多个非平稳时间序列可能存在长期稳定的均衡关系。并初步引入向量自回归(VAR)模型,用于同时建模多个相互关联的时间序列。 机器学习与时间序列回归的结合(简述): 简要介绍一些将回归思想与机器学习技术相结合的思路,例如使用岭回归(Ridge Regression)、Lasso回归(Lasso Regression)等来处理高维解释变量或进行变量选择。 本书的特色 理论与实践并重: 本书不仅深入阐述了时间序列回归分析的理论基础,更通过大量的实例和代码(例如,会提及R、Python等常用统计软件的实现思路),帮助读者将理论付诸实践。 循序渐进的教学方法: 从最基础的概念开始,逐步引导读者理解更复杂的模型和技术,适合不同程度的学习者。 紧跟学术前沿: 第二版更新了近年来在时间序列分析领域取得的重要进展,力求内容的时效性。 注重模型诊断与解释: 强调了模型诊断的重要性,以及如何解释模型结果,帮助读者建立对模型可靠性的信心。 总而言之,《时间序列分析:回归技术(第二版)》是一本全面、深入、实用且与时俱进的著作,它将为读者在时间序列数据分析领域的研究和应用提供宝贵的指导和支持,帮助读者掌握利用回归技术解决复杂时间序列问题的能力。