具体描述
内容简介
时间序列分析是应用统计学的核心基础课之一,也是计量经济学和统计预测学的核心内容。作为数理统计学的一个专业分支,时间序列分析有它非常特殊的、自成体系的一套分析方法。
作者简介
王燕,女,1973年生,江西南昌人。华东师范大学数理统计学学士,硕士,中国人民大学统计学博士。现就职于中国人民大学统计学院风险管理与保险精算教研室,已出版教材《应用时间序列分析》、《寿险精算学》。主要教授统计学、应用时间序列分析、统计预测、保险原理和寿险精算学等课程。 目录
第1章时间序列分析简介1
1.1 引言1
1.2 时间序列的定义1
1.3 时间序列分析方法2
1.3.1 描述性时序分析2
1.3.2 统计时序分析4
1.4 R 简介6
1.4.1 R 的特点6
1.4.2 R 的安装7
1.4.3 R 语言基本规则8
1.4.4 生成时间序列数据11
1.4.5 时间序列数据的处理14
1.4.6 时间序列数据导出16
1.5 习题16
第2 章时间序列的预处理17
2.1 平稳时间序列17
2.1.1 特征统计量17
2.1.2 平稳时间序列的定义19
2.1.3 平稳时间序列的统计性质20
2.1.4 平稳时间序列的意义21
2.2 时序图与自相关图23
2.2.1 时序图23
ii 时间序列分析|| 基于R
2.2.2 绘制序列自相关图29
2.3 平稳性的检验30
2.3.1 时序图检验30
2.3.2 自相关图检验32
2.4 纯随机性检验33
2.4.1 纯随机序列的定义34
2.4.2 白噪声序列的性质35
2.4.3 纯随机性检验36
2.5 习题41
第3 章平稳时间序列分析44
3.1 方法性工具44
3.1.1 差分运算44
3.1.2 延迟算子45
3.1.3 线性差分方程45
3.2 ARMA 模型的性质47
3.2.1 AR 模型47
3.2.2 MA 模型62
3.2.3 ARMA 模型69
3.3 平稳序列建模72
3.3.1 建模步骤72
3.3.2 样本自相关系数与偏自相关系数73
3.3.3 模型识别73
3.3.4 参数估计81
3.3.5 模型检验87
3.3.6 模型优化91
3.4 序列预测96
3.4.1 线性预测函数96
3.4.2 预测方差最小原则97
3.4.3 线性最小方差预测的性质98
3.5 习题105
第4 章非平稳序列的确定性分析109
4.1 时间序列的分解109
4.1.1 Wold 分解定理109
4.1.2 Cramer 分解定理110
目录iii ¢
4.2 确定性因素分解111
4.3 趋势分析112
4.3.1 趋势拟合法112
4.3.2 平滑法117
4.4 季节效应分析125
4.5 综合分析127
4.6 习题133
第5 章非平稳序列的随机分析136
5.1 差分运算136
5.1.1 差分运算的实质136
5.1.2 差分方式的选择137
5.1.3 过差分141
5.2 ARIMA 模型142
5.2.1 ARIMA 模型的结构142
5.2.2 ARIMA 模型的性质143
5.2.3 ARIMA 模型建模145
5.2.4 ARIMA 模型预测147
5.2.5 疏系数模型150
5.2.6 季节模型154
5.3 残差自回归模型161
5.3.1 模型结构162
5.3.2 残差自相关检验165
5.3.3 残差自相关模型拟合168
5.4 异方差的性质170
5.4.1 异方差的影响170
5.4.2 异方差的直观诊断171
5.5 方差齐性变换173
5.6 条件异方差模型175
5.6.1 ARCH 模型176
5.6.2 GARCH 模型184
5.6.3 GARCH 的衍生模型191
5.7 习题193
第6 章多元时间序列分析198
6.1 平稳多元序列建模198
6.2 虚假回归203
6.3 单位根检验205
6.3.1 DF 检验205
6.3.2 ADF 检验214
6.4 协整219
6.4.1 单整与协整219
6.4.2 协整检验220
6.5 误差修正模型223
6.6 习题
附录
参考文献
精彩书摘
时间序列分析是统计学科的一个重要分支. 它主要研究随着时间的变化事物发生、发展的过程, 寻找事物发展变化的规律, 并预测未来的走势. 在日常生产、生活中,时间序列比比皆是, 所以目前时间序列分析方法广泛应用于经济、金融、天文、气象、海洋、物理、化学、医学、质量控制等诸多领域, 成为众多行业经常使用的统计方法.
目前, 国内有关时间序列分析的著作和教材有很多, 但主要是基于SAS 软件或EViews 软件编写的. 近几年来, R 语言开始崛起, 它是一个可进行交互式数据分析的强大平台. R 语言的以下几个特征让它在学界和业界都受到很大的重视.
首先, R 语言是自由的开源软件, 也就是说, 它是全球免费的. 正版的专业统计软件通常要收取高额的版权使用费, 这使很多高校的教师和学生无法获得正版的专业统计软件, 而R语言没有版权使用费这个障碍, 人们可以光明正大、放心大胆地使用.
其次, R 语言不仅是一款统计软件, 还是一个可以进行交互式数据分析和探索的强大平台, 金融、经济、医疗、数据挖掘等诸多领域都基于R 在研发它们的分析方法.
在这个平台上, 时间序列分析方法可以非常便捷地嵌入其他领域的研究中, 成为各行各业实务分析的基本方法.
最重要的一点是, 由于R 语言的开放性和资源共享性, 使得它可以汇集全球R 用户的智慧和创造力, 以惊人的速度发展. 新方法的更新速度是以周来计算的. 这是传统统计软件所无法比拟的. R 具有自由广阔的发展前景. 可以预期, 它很有可能会打破专业统计软件的功能边界, 与时俱进, 不断拓宽应用领域, 不断创造出更多的功能和解法. 所以, 我们需要学习并共同发展R 语言.
基于R 语言的这些特点, 我们推出教材《时间序列分析—— 基于R》.
需要说明的是, 本书直接使用了笔者编著的21 世纪统计学系列教材《应用时间序列分析》的结构和内容. 这样安排主要是为了便于部分教师和读者在原有SAS软件的基础上, 迅速掌握R语言的应用.
最后, 感谢所有使用这本教材的朋友们. 尽管笔者本着认真的态度编写, 但是水平有限, 书中谬误之处在所难免, 欢迎大家批评指正.00 前言/序言
洞察时流,预见未来:时间序列分析的理论与实践 在瞬息万变的现代世界,数据如同潮水般涌来,其中蕴藏着揭示事物发展规律、预测未来趋势的宝贵信息。而在众多数据类型中,时间序列数据因其固有的时间顺序性和内在的依赖性,对理解和把握动态变化至关重要。无论是宏观经济的波动、金融市场的起伏、气候环境的变化,还是社会人口的迁徙、疾病传播的轨迹,抑或是工业生产的效率、消费者行为的演变,都离不开对时间序列的深入分析。 本书旨在为读者构建一个全面、系统、深入的时间序列分析知识体系。我们不满足于浅尝辄止的理论介绍,更注重将理论与实践紧密结合,带领读者掌握在真实世界中应用时间序列分析工具解决实际问题的能力。本书不仅会系统梳理时间序列分析的核心理论,还会提供大量基于R语言的应用实例,让读者能够亲手操作,感受数据分析的魅力,并最终能够独立完成复杂的时间序列建模与预测任务。 第一部分:时间序列数据的基石 在踏上时间序列分析的探索之旅前,首先需要对时间序列数据本身有一个清晰的认识。本部分将从最基础的概念入手,为读者打下坚实的理论基础。 什么是时间序列? 我们将严谨地定义时间序列,并阐述其区别于一般横截面数据的核心特征——时间依赖性。通过丰富的案例,让读者直观理解时间序列数据在不同领域的普遍存在性,如股票价格随时间的变动、每日气温的记录、每月的销售额统计等。 时间序列数据的基本构成要素: 任何可观测的时间序列数据都可以被分解为几个基本组成部分:趋势(Trend)、季节性(Seasonality)、周期性(Cyclicity)以及随机扰动(Irregular/Residual)。我们将详细解析这几个组成部分的含义、识别方法及其对整体序列行为的影响。例如,经济增长的长期趋势、一年四季的消费模式、经济周期带来的波动,以及无法解释的随机变化。 平稳性:时间序列分析的“定海神针”: 平稳性是许多经典时间序列模型成立的关键假设。我们将深入探讨严平稳与弱平稳的概念,并通过统计检验方法(如ADF检验、KPSS检验)指导读者如何判断一个时间序列是否平稳。理解并处理非平稳性是进行后续建模的必要前提,我们将简要介绍差分等预处理手段。 自相关与偏自相关:揭示序列内部的关联: 时间序列的“记忆性”体现在其过去值与当前值之间的相关性。本部分将详细介绍自相关函数(ACF)和偏自相关函数(PACF)的概念、计算方法以及其在识别序列结构、判断模型阶数上的关键作用。通过直观的图示和实例,读者将学会解读ACF和PACF图,理解它们如何指示序列的短期和长期依赖性。 第二部分:经典时间序列建模框架 在掌握了时间序列的基本概念和特性后,我们将进入经典的时间序列建模领域。本部分将聚焦于最常用、最基础的建模方法,为读者建立起一套完整的建模思路。 ARIMA模型家族:预测的基石: 自回归积分滑动平均(ARIMA)模型是时间序列建模中最具代表性的模型之一。我们将循序渐进地讲解AR(自回归)、MA(滑动平均)和ARMA(自回归滑动平均)模型的原理、数学表达式及其适用场景。随后,我们将重点阐述ARIMA模型的概念,包括差分(I)的作用,以及如何通过ACF/PACF图和信息准则(如AIC、BIC)来确定模型的阶数(p, d, q)。 模型识别、估计与诊断: 一个完整的建模过程离不开模型识别、参数估计和模型诊断。本部分将详细介绍如何根据ACF/PACF图初步识别ARIMA模型的潜在阶数,并讲解常用的参数估计方法(如最大似然估计)。更重要的是,我们将强调模型诊断的重要性,通过残差分析(如残差的白噪声检验)来评估模型的拟合优度,确保模型能够有效地捕捉序列的动态信息,避免模型设定错误。 SARIMA模型:应对季节性: 许多实际应用中的时间序列都表现出明显的季节性特征。本部分将在此基础上,引入季节性自回归积分滑动平均(SARIMA)模型。我们将详细讲解SARIMA模型的扩展形式,如何处理季节性AR、MA和I分量,以及如何确定SARIMA模型的季节性阶数。通过实例,读者将学会构建能够有效预测具有季节性变动数据(如旅游人数、服装销售量)的模型。 其他重要模型简述: 除了ARIMA系列模型,我们还将简要介绍一些其他重要的经典模型,例如指数平滑(Exponential Smoothing)方法,以及其在简单场景下的应用。这部分旨在为读者提供更广阔的视野,了解更多时间序列分析工具。 第三部分:基于R的应用实践 理论的深度最终要通过实践来检验和升华。本部分将是本书的实践核心,我们将利用强大的R语言统计软件,带领读者将所学的理论知识转化为解决实际问题的能力。 R语言环境搭建与数据导入: 我们将首先介绍如何在R中安装和加载必要的包(如`forecast`, `tsibble`, `feasts`等),并讲解如何导入各种格式的时间序列数据。 可视化探索: 在建模之前,对时间序列数据进行可视化探索是必不可少的步骤。我们将展示如何利用R绘制时间序列图、ACF/PACF图、季节性子序列图等,帮助读者直观地理解数据的特征。 ARIMA模型在R中的实现: 我们将通过详细的代码示例,演示如何在R中进行ARIMA模型的识别、估计、诊断和预测。读者将学习使用`auto.arima()`函数自动选择最优模型,并了解如何手动指定模型阶数。 SARIMA模型在R中的构建: 针对具有季节性的数据,我们将展示如何使用R构建和应用SARIMA模型,并进行预测。 模型评估与比较: 在生成多个模型后,如何选择最优模型是关键。我们将介绍R中常用的模型评估指标(如RMSE, MAE, MAPE)和模型比较方法,帮助读者做出明智的选择。 实际案例分析: 本部分将穿插多个真实的案例分析,涵盖经济、金融、气象、销售等多个领域。通过这些案例,读者将学习如何将时间序列分析方法应用于实际业务场景,并获得可指导行动的洞察。例如,使用R预测未来股票价格走势、分析全球气温变化趋势、预测商品销售量并制定库存策略等。 第四部分:进阶话题与现代方法 随着数据科学的飞速发展,时间序列分析领域也在不断涌现新的方法和技术。本部分将带领读者触及更前沿的领域,为解决更复杂的问题打下基础。 外部回归量与ARIMAX模型: 实际问题往往受到多种因素的影响。我们将介绍如何将外部回归量(Exogenous Variables)纳入ARIMA模型,形成ARIMAX模型,从而更全面地解释时间序列的变化。 多元时间序列分析: 许多现象是由多个相互关联的时间序列共同决定的。我们将简要介绍多元时间序列分析的基本概念,如向量自回归(VAR)模型,以及在R中处理多元时间序列数据的基本方法。 非线性时间序列模型(简述): 传统线性模型在某些情况下可能失效。我们将简要介绍一些非线性时间序列模型的思想,如GARCH模型在金融波动性预测中的应用。 机器学习在时间序列分析中的应用(预览): 随着深度学习的兴起,RNN、LSTM等模型在序列数据处理上表现出色。本部分将作为对这些先进方法的预览,为读者后续深入学习提供方向。 本书特色: 理论与实践的完美融合: 每一章节都将理论知识与R语言实现紧密结合,确保读者不仅理解“是什么”,更能掌握“怎么做”。 丰富的R语言代码示例: 提供可以直接运行、易于理解和修改的代码,降低学习门槛,提升实践效率。 贴近实际的应用案例: 精选多个跨领域、真实世界的时间序列分析案例,帮助读者建立解决实际问题的信心。 循序渐进的学习路径: 从基础概念到经典模型,再到进阶话题,层层递进,适合不同基础的读者。 系统性的知识体系: 覆盖时间序列分析的核心理论、常用模型及其R语言实现,帮助读者构建扎实、全面的知识框架。 掌握时间序列分析,就是掌握了理解过去、把握现在、预见未来的关键能力。本书将是您在这条探索之路上的得力助手,助您洞察数据背后的时流涌动,发现隐藏的规律,并最终做出更明智的决策。无论您是统计学、经济学、金融学、工程学、计算机科学等领域的学生、研究者,还是希望提升数据分析技能的从业者,本书都将为您提供宝贵的知识和实用的工具。让我们一起,用R语言的力量,解码时间序列的奥秘!