内容简介
时间序列分析是概率统计学科中应用性较强的一个分支,在金融经济、气象水文、信号处理、机械振动等众多领域有着广泛的应用。本书定位是高等院校“应用时间序列分析”课程的教材,系统讲授应用时间序列分析的基本理论、方法及其应用。不仅强调基础的一元时间序列,还介绍在实际数据分析中应用最广泛的多元时间序列,并结合免费的R软件来实际分析时间序列数据。
作者简介
吴喜之,北京大学数学力学系学士,美国北卡罗来纳大学统计系博士。中国人民大学统计学院教授、博士生导师。
内页插图
目录
第1章 引言1.1 时间序列的特点 1.2 时间序列例子1.3 R软件入门 1.3.1 简介 1.3.2 动手 1.4 本书的内容 1.5 习题
第2章 一元时间序列的基本概念和模型2.1 时间序列的平稳性及相关性度量2.1.1 平稳、自协方差函数和自相关函数2.1.2 差分算子和后移算子 2.2 白噪声2.3 随机游走 2.4 趋势平稳过程2.5 一般线性模型2.6 MA模型 2.7 AR模型 2.8 ARMA模型 2.9 ARIMA模型2.10 季节模型 2.11 习题
第3章 一元时间序列数据的拟合及预测3.1 一些估计和预测方法的基本数学原理 3.1.1 ARMA模型的最大似然估计3.1.2 ARMA模型的矩估计方法 3.1.3 预测的基本目的3.1.4 简单指数平滑 3.1.5 Holt-Winters滤波预测方法 3.1.6 ARMA模型预测的基本数学原理 3.2 一元时间序列数据实例分析 3.2.1 差分、平滑和时间序列的分解 3.2.2 ARMA模型和ARIMA模型 3.2.3 例1.2中Auckland降水序列的综合分析3.3 习题
第4章 状态空间模型和Kalman滤波简介*4.1 动机 4.2 结构时间序列模型 4.2.1 局部水平模型 4.2.2 局部线性趋势模型4.2.3 季节效应4.3 一般状态空间模型 4.3.1 随时间变化系数的回归 4.3.2 ARMA模型的状态空间模型形式 4.3.3 结构时间序列的一般状态空间模型表示 4.4 Kalman滤波 4.5 状态空间数据例子 4.5.1 一元局部水平模型例子 4.5.2 二元局部水平模型Kalman滤波例子 4.5.3 包含季节因素的局部水平多元模型Kalman滤波例子
第5章 单位根检验 5.1 单整和单位根5.2 单位根检验 5.2.1 DF检验、ADF检验以及PP检验 5.2.2 KPSS检验
第6章 长期记忆过程:ARFIMA模型6.1 介于(0)及(1)之间的长期记忆序列 6.2 ARFIMA过程 6.3 ARFIMA模型拟合例3.4尼罗河流量数据
第7章 GARCH模型7.1 时间序列的波动 7.2 模型的描述 7.3 数据的拟合7.3.1 例7.1数据的拟合7.3.2 例7.2数据的拟合7.4 GARCH模型的延伸 7.4.1 一组GARCH模型7.4.2 FGARCH模型族 7.4.3 ARFIMA-GARCH模型族拟合例7.2数据
第8章 多元时间序列的基本概念和模型8.1 平稳性8.2 交叉协方差矩阵和相关矩阵8.3 一般线性模型8.4 VARMA模型8.5 协整模型和Granger因果检验8.5.1 VECM和协整 8.5.2 协整检验8.5.3 Granger因果检验
第9章 多元时间序列数据的拟合及预测9.1 例9.1数据的协整检验和Granger因果检验9.1.1 Johansen协整检验.9.1.2 Engle-Granger协整检验9.1.3 Pillips-Ouliaris协整检验9.1.4 例9.1数据的Granger因果检验 9.2 用VAR、VARX及状态空间模型拟合例9.1数据 9.2.1 用VAR拟合及预测例9.1数据 9.2.2 用VARX模型拟合及预测例9.1数据 9.2.3 用状态空间模型拟合及预测例9.1数据 9.3 习题
第10章 非线性时间序列10.1 非线性例子10.2 线性AR模型10.3 自门限自回归模型 10.3.1 一个门限参数的模型 10.3.2 两个门限参数的模型 10.3.3 Hansen检验10.4 Logistic平滑过渡自回归模型10.5 神经网络模型10.6 可加AR模型10.7 模型的比较10.8 门限协整 10.8.1 向量误差修正模型10.8.2 向量误差修正模型的估计10.8.3 向量误差修正模型的检验
第11章 谱分析简介11.1 周期性时间序列11.2 谱密度11.3 谱分布函数11.4 自相关母函数和谱密度11.5 时不变线性滤波器11.6 谱估计11.6.1 通过样本自协方差函数估计谱密度.11.6.2 通过周期图估计谱密度 11.6.3 非参数谱密度估计.11.6.4 参数谱密度估计附录使用R软件练习参考文献
前言/序言
同类教材的特点 首先,一些教材偏重于数学理论和推导。作者多为数学出身,他们习惯于数学的严格性和导出精确而又漂亮的数学结论。这些书适用于那些愿意为时间序列的数学理论研究做出贡献的读者。 其次,国内教材中一元时间序列往往占绝大部分篇幅,而且包含在各种数学假定下的各种定理和结果。这是因为一元时间序列的数学描述确实很漂亮,很多结果都能够以比较简洁的数学语言表达出来。而多元时间序列则很不一样,在一元情况下很漂亮的结果,在多元情况下就完全不同了。在数学上,复杂的表达是不被人们所喜爱的,因此,多元时间序列很难在数学味道很浓的教科书中展开。 很多教材对于真实时间序列的数据分析强调得不够。那些数学味道强的书,由于其主要目的不是分析实际数据,而且实际数据往往很难满足书中的数学假定,过多地讨论实际应用并不是这些书的重点。 另外有一些教材的确强调应用,而且作者很多也不是数学出身,书中也列举了一些数学假定和结论,但是往往没有花篇幅去完善和系统化,更没有用简明扼要的语言去做解释,使得无论是数学还是非数学出身的读者都不能很好地理解所用模型背后的机理。 在涉及统计软件使用方面,数学味道强的书完全不用任何软件是可以理解的,但很多偏重于应用的教科书只介绍昂贵的“傻瓜式”商业软件就不值得提倡了,因为介绍昂贵商业软件的教材客观上鼓励了使用盗版软件。商业软件不透明,代码保密,而且没有体现最新的成果,完全不能满足实际工作者的需要。本书的特点 本书的目标读者是非数学专业出身的各类人员,可以是本科生或者研究生,也可以是在校教师或者实际工作者。我们力图用简单通俗的语言阐述有关的基本概念和计算,并尽量通过案例来讲述各种时间序列方法,使得非数学背景的读者可以较容易地理解。同时,我们也把有关的数学结构用简单完整的方式阐述,以供读者参考。
好的,这是一份基于您提供的书名信息,但内容完全不涉及“华章应用统计系列·应用时间序列分析:R软件陪同”一书具体内容的图书简介。这份简介将聚焦于一个虚构的、但听起来合理且专业的统计学或数据分析领域的其他主题,旨在提供详实、自然、不含AI痕迹的文本。 --- 统计思维与数据叙事:现代统计建模的实践与伦理 导言:从原始数据到洞察力的桥梁 在当今这个信息爆炸的时代,数据已不再仅仅是记录历史的工具,而是驱动决策、预见未来的核心资产。然而,原始数据的洪流充斥着噪音、偏见和复杂性。如何有效地从这些海量信息中提炼出可靠的、可操作的真知灼见,已成为各个领域专业人士面临的共同挑战。本书——《统计思维与数据叙事:现代统计建模的实践与伦理》——旨在提供一套完整且深入的框架,帮助读者建立起坚实的统计学基础,掌握前沿的建模技术,并将这些技术转化为清晰、有说服力的“数据故事”。 本书的核心目标是将统计学从一门纯粹的数学学科,转化为一门关于“如何做出更明智决策”的实践科学。我们相信,优秀的分析师不仅需要掌握复杂的公式,更需要理解数据背后的世界,并在报告中优雅地呈现其发现。 第一部分:统计思维的重塑——超越 P 值的藩篱 传统的统计教育往往过度强调假设检验的机械执行,而忽略了其背后的哲学基础和实际应用中的局限性。本书首先致力于重塑读者的统计思维模式。 第一章:概率论的直觉回归 本章将重新审视核心概率概念,如贝叶斯定理的实际意义,以及如何利用马尔可夫链等工具来模拟动态过程。我们着重于培养对随机性和不确定性的直觉理解,而非仅仅记住公式。例如,我们将通过实际的商业案例,讨论在信息不完全的情况下,如何迭代更新我们的信念,这是实际决策制定中普遍存在的情境。 第二章:数据收集与设计:偏见的源头 统计推断的可靠性,始于数据的质量。本章深入探讨实验设计(Design of Experiments, DOE)的原理,包括随机化、对照和重复在控制系统误差中的作用。我们将详细分析常见的数据收集陷阱,例如幸存者偏差、确认性偏差在问卷设计中的体现,以及如何利用分层抽样和聚类抽样等复杂抽样技术来提高代表性。对于非实验性研究,我们将重点讨论倾向得分匹配(Propensity Score Matching, PSM)等工具,以近似于随机对照试验(RCT)的严谨性。 第三章:探索性数据分析(EDA)的艺术与科学 在正式建模之前,深入的探索至关重要。本章详述了多维度数据可视化技术,超越简单的直方图和散点图。我们将介绍使用热力图、平行坐标图以及网络图来揭示高维数据中的潜在结构和异常值。重点讨论如何通过数据清洗和预处理步骤,为后续的建模打下坚实的基础,例如缺失值插补的合理选择(均值、中位数、多重插补的比较)。 第二部分:现代建模技术与工具箱 本部分是本书的核心技术引擎,聚焦于当前数据科学领域最常用且强大的统计建模方法,强调模型选择的原则和实际应用中的参数解释。 第四章:广义线性模型(GLM)的深度应用 我们不仅会复习逻辑回归和泊松回归,还将深入探讨其背后的指数族分布理论。本章将重点放在模型的诊断和残差分析上,讨论如何识别异方差性、过度离散性(overdispersion)以及非线性关系。实际案例将涵盖从风险评估到事件发生频率预测等多种场景。 第五章:非参数与半参数方法的实用指南 现实世界的数据很少严格服从正态分布。本章系统介绍了无需强加分布假设的强大工具,包括广义加性模型(GAMs),它允许我们在保持模型解释力的同时,灵活地捕捉数据中的非线性趋势。此外,还将介绍核密度估计和非参数回归技术,适用于探索性分析和复杂函数形式的拟合。 第六章:高维数据与正则化技术 随着特征数量的激增,模型过拟合的风险急剧上升。本章详尽阐述了正则化方法的原理与实践,重点对比了岭回归(Ridge)、Lasso 和 Elastic Net 的差异及其在特征选择和系数收缩上的效果。我们将分析在模型维度远大于样本量(p > n)的情况下,如何利用这些技术来稳定估计和提高预测精度。 第七章:混合效应模型:处理层次化数据 许多真实世界的数据结构是层次化的(例如,学生嵌套在班级中,班级嵌套在学校中)。本章专门讲解混合效应模型(Mixed-Effects Models),包括随机截距和随机斜率模型。我们将详细探讨如何正确设置随机效应结构,以及如何解释固定效应和随机效应的输出结果,这对于纵向数据分析至关重要。 第三部分:数据叙事、评估与伦理考量 统计分析的最终价值在于其传播和应用。本部分关注如何有效地传达分析结果,并确保分析过程的透明度和公正性。 第八章:模型选择、验证与交叉验证策略 本章探讨了模型评估的量化指标,例如 AIC、BIC 以及信息准则的局限性。我们将详细介绍各种交叉验证技术(如 k-折、留一法 LOOCV)在评估模型泛化能力中的作用。更重要的是,我们将讨论模型预测能力的度量,如 ROC 曲线下面积(AUC)和校准(Calibration)的重要性,这些是评估模型在实际部署中性能的关键。 第九章:构建令人信服的数据叙事 一个优秀的统计模型如果不能被利益相关者理解,其价值就无法实现。本章着重于统计沟通的艺术。我们将教授如何将复杂的统计量转化为业务语言,如何设计有效的报告结构,并如何批判性地使用图表来增强而不是扭曲信息。重点讨论如何清晰地传达不确定性(Confidence Intervals vs. Prediction Intervals)。 第十章:统计实践的伦理与可重复性 在“大数据”的背景下,统计伦理问题日益突出。本章讨论了数据隐私保护、算法公平性(Fairness in ML/Stats)的初步概念,以及如何识别和避免在数据分析和报告中无意中引入的偏见。此外,我们强调可重复性(Reproducibility)在现代科学中的核心地位,指导读者如何组织项目文件和代码,以确保分析过程的完全透明和可追溯。 结语 《统计思维与数据叙事:现代统计建模的实践与伦理》旨在成为一本面向应用统计学、商业分析、公共卫生及社会科学领域研究人员和实践者的实用指南。它不追求数学上的绝对严谨,而是追求方法论上的实用性和解释力上的清晰性。通过本书的学习,读者将不仅能熟练运用统计工具,更能以批判性的眼光审视数据,并以负责任的态度驱动决策。