内容简介
《现代数学基础丛书·典藏版138:现代非参数统计》阐述现代非参数统计的方法和理论。
《现代数学基础丛书·典藏版138:现代非参数统计》在取材上侧重内容的科学性和应用性,体现学术思想;在写作上注重阐述方法论,个别章节安排模拟计算和实例分析;在结构上每章内容自成体系,方便读者阅读。
《现代数学基础丛书·典藏版138:现代非参数统计》的内容不仅为从事该领域的科研人员提供了尽可能多的资料,也为实际应用者提供了一些数据分析的方法,同时也为想全面了解现代非参数统计的读者提供参考读物。
《现代数学基础丛书·典藏版138:现代非参数统计》可以作为高等院校统计学及其相关专业的学生的教学用书,对高等院校和科研机构的研究人员、工程技术人员和研究生有参考价值。
内页插图
目录
《现代数学基础丛书》序
前言
符号表
第1章 预备知识
1.1 概率不等式
1.1.1 概率的指数型不等式
1.1.2 随机变量的概率不等式
1.1.3 用随机变量的矩估计概率的界
1.1.4 随机变量之和(积)的矩不等式
1.1.5 独立和的分布函数的正态逼近
1.1.6 关于相依随机变量的概率不等式
1.2 概率论中的若干极限定理
1.2.1 随机变量序列的收敛性
1.2.2 关于几乎处处收敛的若干结果
1.2.3 关于中心极限定理的若干结果
1.2.4 关于相依随机变量的极限定理
1.3 几个相关结果
参考文献
第2章 非参数密度估计
2.1 直方图
2.2 Rosenblatt估计
2.3 核密度估计
2.3.1 核密度估计的定义
2.3.2 核密度估计的精度
2.3.3 交叉验证法
2.3.4 核密度估计的大样本性质
2.3.5 相依样本下核密度估计
2.3.6 删失数据下核密度估计
2.3.7 测量误差数据下核密度估计
2.3.8 缺失数据下核密度估计
2.3.9 相关文献及成果注记
2.4 最近邻密度估计
2.4.1 最近邻密度估计的定义
2.4.2 最近邻密度估计的均方误差
2.4.3 最近邻密度估计的渐近性质
2.4.4 相依样本下最近邻密度估计
2.4.5 相关文献及成果注记
2.5 最近邻-核密度估计
2.5.1 最近邻-核密度估计的定义
2.5.2 最近邻-核密度估计的逐点强收敛速度
2.5.3 相依样本下最近邻核密度估计
2.5.4 删失数据下最近邻-核密度估计
2.6 基于次序统计量的近邻密度估计
2.6.1 近邻密度估计的定义
2.6.2 近邻密度估计的相合性
2.6.3 近邻密度估计的收敛速度
2.7 正交级数密度估计
2.7.1 正交级数密度估计的定义
2.7.2 渐近性质
2.8 小波密度估计
2.8.1 多分辨率分析与小波
2.8.2 线性小波密度估计
2.8.3 非线性小波密度估计
2.8.4 小波逆卷积密度估计
2.8.5 删失数据下小波密度估计
2.8.6 相关文献及成果注记
2.9 密度估计的自助法和随机加权法
2.9.1 密度估计的自助法
2.9.2 密度估计的随机加权法
2.9.3 相关文献及成果注记
2.10 密度函数的经验似然置信区间
2. 10.1 朴素的经验似然置信区间
2. 10.2 纠偏的经验似然置信区间
2. 10.3 模拟研究
2.11 密度函数的置信带
2.12 密度估计的应用
参考文献
第3章 条件密度估计
3.1 条件密度的双重核估计
3.1.1 双重核估计的定义
3.1.2 双重核估计的精度
3.1.3 双重核估计的带宽选择
3.1.4 双重核估计的渐近性质
3.1.5 相依样本下条件密度的双重核估计
3.1.6 相关文献及成果注记
3.2 条件密度的近邻-核估计
3.2.1 近邻-核估计的定义
3.2.2 近邻-核估计的渐近性质
3.3 条件密度的局部线性估计
3.3.1 局部线性估计的定义
3.3.2 带宽选择
3.3.3 主要结果及其证明
3.3.4 相关文献及成果注记
参考文献
第4章 非参数回归
4.1 回归函数的核估计
4.1.1 核估计的定义
4.1.2 带宽的选取
4.1.3 核函数的选择
4.1.4 :核估计的性质
4.1.5 相依数据分析
4.1.6 删失数据分析
4.1.7 测量误差数据分析
4.1.8 缺失数据分析
4.1.9 纵向数据分析
4.1.10 模拟计算
4.1.11 相关文献及成果注记
4.2 回归函数的局部多项式估计
4.2.1 局部多项式估计的定义
4.2.2 局部多项式估计的偏差和方差
4.2.3 等价核
4. 2.4.带宽选择
4.2.5 置信区间
4.2.6 局部线性回归估计及其性质
4.2.7 模拟计算
4.2.8 相关文献及成果注记
4.3 回归函数的最近邻估计
4.3.1 最近邻估计的定义
4.3.2 最近邻估计的性质
4.3.3 模拟研究
4.3.4 相关文献及成果注记
4.4 回归函数的最近邻-核估计
4.4.1 最近邻-核估计的定义
4.4.2 最近邻-核估计的性质
4.5 回归函数的样条估计
4.5.1 光滑样条估计
4.5.2 多项式样条估计
4.5.3 惩罚样条估计
4.5.4 局部自适应回归样条估计
4.5.5 模拟计算一
4.5.6 相关文献及成果注记
4.6 回归函数的正交级数估计
4.6.1 正交级数估计的定义
4.6.2 正交级数估计的渐近性质
4.6.3 依靠数据选择门限
4.6.4 相关文献及成果注记
4.7 回归函数的小波估计
4.7.1 线性小波估计
4.7.2 非线性小波估计
4.7.3 相关文献及成果注记
4.8 回归函数的分段多项式估计
4.8.1 分段多项式估计的定义
4.8.2 通过趋势滤波的自适应分段多项式估计
4.8.3 相关文献及成果注记-
4.9 非参数回归中的自助法和随机加权法
4.9.1 自助法
4.9.2 随机加权法
4.9.3 相关文献及成果注记
4.10 纵向数据的经验似然局部多项式回归
4.10.1 朴素的经验似然
4.10.2 残差调整的经验似然
4.10.3 近似置信域和置信区间
4.10.4 带宽选择
4.10.5 模拟研究
4.11 回归函数的置信带
4.11.1 Bonferroni型置信带
4.11.2 基于极值分布逼近的置信带
4.11.3 bootstrap置信带
4.11.4 模拟研究
4.11.5 相关文献及成果注记
4.12 非参数回归的异方差检验
4.12.1 检验统计量及其渐近性质
4.12.2 Monte-Carlo逼近
4.12.3 相关文献及成果注记
4.13 实际数据分析
参考文献
第5章 密度比模型
5.1 经验似然方法
5.2 分布和分位数估计及其Balhadur表示
5.3 有效性比较
5.4 拟合优度检验
5.5 bootstrap方法
5.5.1 用于检验的bootstrap分位数
5.5.2 分布函数的bootstrap置信带
5.5.3 分位数函数的bootstrap置信带
5.6 模拟研究
5.6.1 正确指定模型的情况
5.6.2 错误指定模型的情况
5.6.3 模型的拟合优度检验
5.7 实际数据分析
5.8 相关文献及成果注记
参考文献
第6章 条件分位数估计
6.1.条件分位数的核估计
6.1.1 核估计的定义
6.1.2 核估计的强相合性及收敛速度
6.1.3 核估计的渐近正态性及正态逼近速度
6.1.4 核估计的bootstrap逼近速度
6.2 条件分位数的最近邻估计
6.2.1 最近邻估计的定义
6.2.2 最近邻估计的强相合性及收敛速度
6.2.3 最近邻估计的渐近正态性及正态逼近速度
6.2.4 最近邻估计的bootstrap逼近速度
6.3 相关文献及成果注记
参考文献
索引
《现代数学基础丛书》已出版书目
前言/序言
非参数统计的一个显著特点是它的使用面广,因为它讨论的模型中分布族没有通过有限个实参数去刻画,模型使用的范围更大。因此,它作为统计学的一个重要分支,在经济、金融、生物、医学等领域有着广泛的应用。非参数统计的另一个特点是大样本方法占重要位置。可以说,绝大多数常用的非参数统计方法都是基于有关统计量的某种渐近性质,因此,某些定理的论证很烦琐,读起来往往感到困难,目前,非参数统计的方法和理论已渗透到许多学科,在实际中有越来越多的应用,深受人们重视。人们需要有一本系统介绍现代非参数统计的专著,这就萌发了作者撰写本书的想法。本书阐述了现代非参数统计的方法和理论,并对一些重要定理给出了证明。书中丰富的内容一方面为从事该领域的研究人员提供了完善的参考资料,另一方面为实际应用工作者提供了现代统计方法,此外,本书也为想全面了解现代非参数统计的读者提供了有价值的参考,为进一步进行非参数统计方面的研究奠定基础。
本书取材是根据作者三十多年来对该领域的研究成果及所积累的资料撰写而成,其中相当一部分内容是最新成果,反映了本学科的现代面貌。同时,考虑到尽可能扩大读者面,本书在取材上作了精心安排,内容由浅入深,既有广度。又有深度。考虑到非参数统计的特点,本书在写作上就如下三个方面做了努力:一是侧重介绍现代非参数统计的方法和理论,定理的证明尽可能简化;二是注重介绍现代非参数统计的最新成果;三是有选择地安排了一些模拟计算的内容,并安排了若干应用案例,本书在语言叙述上尽量通俗易懂,便于读者阅读,本书包含了现代非参数统计模型的一些内容,这样可以使读者读完本书就能够了解到非参数统计的研究前沿,为他们进入理论和应用研究打下良好基础:同时使他们掌握现代非参数统计的处理技术,并将这些技术应用到解决实际问题之中。
本书的出版得到了科学出版社陈玉琢编辑的鼓励和帮助;得到了国家自然科学基金(11171012,11331011)、高等学校博士学科点专项科研基金(20121103110004)、北京市自然科学基金(1142003)、北京市自然科学基金与北京市科学技术研究院联合资助项目(L140003)的资助;同时也得到了冯三营、田瑞琴、李万斌等同志的帮助,作者谨在此一并表示感谢。
现代数学基础丛书·典藏版138:现代非参数统计 图书简介 《现代数学基础丛书·典藏版138:现代非参数统计》深入剖析了现代统计学中非参数方法的核心理论、方法论及其广泛应用。本书旨在为统计学、数学、工程学以及相关交叉学科的研究人员、高级学生和实践工作者提供一个系统、严谨且前沿的知识体系。 本书的核心关注点在于统计推断的模型无关性。在经典参数统计中,我们往往需要预先假设数据服从特定的分布(如正态分布、泊松分布等)。然而,在许多实际应用场景中,这种分布假设难以成立,或过于严格。非参数统计正是在这种背景下应运而生,它提供了一套更加灵活、稳健的工具,用于处理数据分布未知或复杂的情况。 全书内容结构严谨,从基础概念的澄清开始,逐步深入到高级主题,确保读者能够构建起扎实的理论基础。 第一部分:非参数统计学的基石与起源 本部分首先确立了非参数统计学的基本框架。它详细讨论了为何需要非参数方法,以及其与参数方法在理论和应用上的根本区别。 1.1 概率论与统计推断的回顾: 简要回顾了概率论的基础概念,特别是统计量的定义、大数定律和中心极限定理的非参数视角下的解读。重点讨论了在不依赖特定分布假设下,如何定义和理解统计显著性。 1.2 秩(Ranks)与经验分布函数(Empirical Distribution Function, EDF): 秩是构建许多非参数检验的核心工具。本书详尽阐述了如何将观测值转化为秩,以及秩统计量在大样本下的渐近性质。EDF作为样本数据的非参数估计,被深入剖析其收敛性质,特别是Kolmogorov-Smirnov统计量和Cramér-von Mises统计量的构建及其在拟合优度检验中的应用。 1.3 经验过程(Empirical Processes): 这是现代非参数统计理论的精髓之一。本书用严谨的数学语言介绍了布朗桥(Brownian Bridge)和高斯过程(Gaussian Process)在描述经验过程极限行为中的作用。通过Dudley积分和Vapnik-Chervonenkis (VC) 维等概念,揭示了经验过程在函数空间上的收敛速度和性质,为后续的泛函中心极限定理奠定基础。 第二部分:非参数估计与回归 本部分将焦点从检验转移到估计,特别是参数模型假设下的函数估计问题。 2.1 核密度估计(Kernel Density Estimation, KDE): KDE是估计概率密度函数(PDF)最常用的非参数方法。本书不仅介绍了高斯核、Epanechnikov核等常见核函数的选择,更关键的是深入探讨了带宽(Bandwidth)选择的艺术与科学。从最小均方误差(UMSE)准则出发,详细推导了交叉验证法(Cross-Validation)和预白化(Pre-whitening)技术在最优带宽确定中的应用。同时,分析了边界效应(Boundary Effects)及其校正方法。 2.2 非参数回归: 在回归分析中,我们不再假设误差项服从正态分布或响应变量与预测变量之间存在线性关系。 局部多项式回归(Local Polynomial Regression): 详细介绍了Nadaraya-Watson估计器(局部常数)和局部线性估计器的构造、偏差-方差权衡。重点分析了局部线性估计器在边界点上优于Nadaraya-Watson估计器的性能优势。 平滑样条(Smoothing Splines): 阐述了通过正则化惩罚项来平衡拟合平滑度与残差平方和的优化问题。求解平滑样条的解析解,并探讨了正则化参数($lambda$)的选择标准。 广义加性模型(Generalized Additive Models, GAMs): 虽然GAMs具有一定的半参数特性,但其非参数函数项的估计方法(如基于样条的估计)被置于本章进行讨论,展示了如何通过可加结构来降低非参数估计的维度灾难。 第三部分:非参数检验的进阶应用 本部分扩展了第一部分介绍的基础检验,涵盖了更复杂的比较场景和统计检验的效率分析。 3.1 基于秩的检验深化: 秩和检验的效率: 详细比较了Wilcoxon秩和检验、Mann-Whitney U检验与经典的两样本t检验在不同分布下的相对有效性(Relative Efficiency)。 Kruskal-Wallis H 检验与秩方差分析: 扩展到三组或多组中位数的比较,以及其非参数方差分析的解释。 Friedman 检验: 针对重复测量设计的非参数分析。 3.2 连贯性与效率: 本书严格区分了统计检验的“一致性”(Consistency)和“效率”(Efficiency)。一致性保证了在大样本下检验能够以高概率拒绝错误的原假设;而效率则衡量了在特定分布下,检验达到特定功效所需的样本量与最优检验(如参数检验)相比的比例。 3.3 检验的渐近理论: 引入了带符号检验统计量的渐近正态性证明,这通常依赖于经验过程的泛函中心极限定理,为构造和评估复杂非参数检验的渐近功效提供了严谨的数学工具。 第四部分:现代非参数方法的拓展与前沿 本部分关注近年来发展迅速的、在处理高维数据和复杂依赖结构方面表现出色的方法。 4.1 独立性检验: 重点讨论了基于距离和核方法的独立性检验。 距离相关性(Distance Correlation, dCor): 阐述了dCor如何衡量变量之间任意形式的依赖关系(包括非线性),以及其计算方法和统计性质。 核独立性检验(Kernel Independence Test): 基于再生核希尔伯特空间(RKHS)的特征表示,构建了衡量分布之间差异的度量,在特征空间中检测依赖性,具有强大的非线性捕获能力。 4.2 非参数分类与判别: 讨论了K近邻(k-NN)分类器的理论基础,包括其误差率的渐近界限,以及如何通过选择合适的$k$值来平衡偏差与方差。 4.3 稳健性统计的交集: 简要探讨了非参数方法如何天然地提供稳健性,特别是在面对异常值(Outliers)时,秩统计量相比均值和方差的优越性。 总结与展望 《现代数学基础丛书·典藏版138:现代非参数统计》不仅是一本关于方法的汇编,更是一本关于统计哲学和严谨数学推导的专著。它强调了从大样本理论到实际应用的桥梁,使读者能够理解为何这些方法有效,以及它们在何种条件下表现最佳。全书的数学推导详尽而精确,是深入研究现代数据科学和统计学前沿问题的必备参考书。掌握本书内容,意味着掌握了在数据分布未知或模型不确定的复杂世界中进行可靠推断的强大能力。