内容简介
《概率论与数理统计(第3版)/普通高等教育“十一五”国家级规划教材》是普通高等教育“十一五”国家级规划教材。全书内容包括概率论的基本概念、随机变量的分布、多维随机变量、随机变量的数字特征、大数定律和中心极限定理、数理统计的基本概念、参数估计、假设检验、回归分析、方差分析及试验设计。
各章习题中设有练习题和思考题,书末附有习题答案。
《概率论与数理统计(第3版)/普通高等教育“十一五”国家级规划教材》实现将学习过程向课外延续的数字化及网络化功能,充分强调基本理论和基本运算,着重概率统计数学方法的阐述,并予以加深拓展。
《概率论与数理统计(第3版)/普通高等教育“十一五”国家级规划教材》概念准确、条理清晰、简明易读,可作为高等学校工科、理科(非数学专业)、管理等各类专业的教材,也可供工程技术人员和自学者参考。
内页插图
目录
第1章 概率论的基本概念
§1.1 随机事件与随机变量
§1.2 概率
§1.3 条件概率
§1.4 事件的独立性
§1.5 应用实例
习题一
第2章 随机变量的分布
§2.1 随机变量的分布函数
§2.2 离散型随机变量
§2.3 连续型随机变量
§2.4 应用实例
习题二
第3章 多维随机变量
§3.1 二维随机变量及其分布
§3.2 随机变量的独立性
§3.3 条件分布
§3.4 随机变量的函数及其分布
§3.5 应用实例
习题三
第4章 随机变量的数字特征
§4.1 数学期望
§4.2 随机变量的方差
§4.3 几种常见分布的数学期望和方差
§4.4 协方差、相关系数与矩
§4.5 多维正态随机变量
§4.6 应用实例
习题四
第5章 大数定律和中心极限定理
§5.1 随机变量序列的收敛性
§5.2 大数定律
§5.3 中心极限定理
§5.4 应用
习题五
第6章 数理统计的基本概念
§6.1 总体、样本与统计量
§6.2 抽样分布
§6.3 应用
习题六
第7章 参数估计
§7.1 参数的点估计
§7.2 估计量的优良性准则
§7.3 区间估计
§7.4 应用
习题七
第8章 假设检验
§8.1 假设检验的基本概念
§8.2 参数的假设检验
§8.3 分布的假设检验
§8.4 应用
习题八
第9章 回归分析
§9.1 回归分析的模型
§9.2 一元线性回归
§9.3 多元线性回归
§9.4 非线性回归问题的线性化处理
§9.5 应用
习题九
第10章 方差分析及试验设计
§10.1 方差分析概述
§10.2 单因素方差分析
§10.3 两因素方差分析
§10.4 正交试验设计
§10.5 应用实例
习题十
习题答案
附表
附表1 泊松分布表
附表2 标准正态分布表
附表3 X2分布表
附表4 t分布表
附表5 F分布表
附表6 相关关系显著性检验相关系数临界值表
附表7 正交表
前言/序言
本次修订教材,主要内容和框架未作大的改动,仍保持原有特色:力求做到概率论部分及数理统计部分两者并重和有机结合;在作为工科教材的前提下,尽量使概念准确、系统、完整;强调基本理论和基本运算,着重对概率统计思想方法进行阐述;强调概率论与数理统计的客观背景和实际应用(每章最后一节均是对应知识的应用和实例);例题、习题与教材内容紧密结合,每章习题分为练习题和思考题两部分;书后附有习题答案和有关图表。
现有国内教材注重数学理论体系的完整性,内容取舍和组织编排上偏重理论陈述。在我校近几年的教学与教学改革实践中,我们深感纯纸质教材相对本课程的学科特点和学生培养目标,确有一定的局限性。在高等教育出版社提供技术平台的支持下,本次修订我们编入了我校近年来教学改革成果中的数字化部分,希望能引导学生深刻理解基本概念、全面掌握理论知识,并能训练学生的科学创新思维及应用数学能力等。我们将逐年补充、更新数字化内容。
本版教材希望应用现代科技手段,突破纯纸质教材、教师、课堂的局限性,为学生主动外延学习创造条件。力求营造一个实践学习环境,训练学生观测实验与理性思维相结合的思维模式,实践概率统计中观察、分析、描述和处理问题的思想及方法,更好掌握基本概念及解决相关实际问题的能力,为后续课程的学习以及从事工程技术工作和科研工作打下必要的概率统计理论基础。
本教材全部讲授需68学时,根据不同学时和不同层次的要求,讲授内容可酌情取舍。
本教材由徐全智主编并负责统稿、编写第1章至第5章,吕恕编写第6章至第10章,另有覃思义、王志勇、高晴、龚丽莎参与数字化部分的编写工作。
由于编者水平所限,缺点和不当之处在所难免,恳请同行专家和读者批评指正。
深入理解随机现象的本质:一本前沿的统计学著作 书名: 现代概率统计方法及其应用前沿 作者: 张伟 教授,李明 博士 出版社: 科学技术文献出版社 出版年份: 2023年 --- 内容简介 本书旨在为读者提供一套全面、深入且与时俱进的概率论与数理统计知识体系,重点聚焦于现代统计学的前沿方法论及其在复杂数据科学领域的实际应用。我们深知,传统的概率论与数理统计教材往往侧重于理论的严谨性推导,而在面对大数据、高维数据和非线性模型时,现有的工具箱可能显得力不从心。因此,本书的核心目标在于架起理论基础与现代应用之间的桥梁,培养读者利用先进统计工具解决实际问题的能力。 全书共分为四大部分,二十章,逻辑清晰,循序渐进。 --- 第一部分:概率论的现代基础与测度论的视角(第1章 - 第5章) 本部分是全书的理论基石,它超越了初级概率论的频率学派范畴,引入了更具数学严谨性的测度论视角,为后续的高级统计推断打下坚实的基础。 第1章:随机事件与概率的测度定义 我们首先回顾了集合论的基本概念,然后正式引入 $sigma$-代数和可测空间。概率被定义为定义在 $sigma$-代数上的一个归一化(Measure)测度。详细讨论了概率的公理化体系,并深入分析了极限操作与概率运算的顺序问题(如Borel-Cantelli引理的深度剖析)。 第2章:随机变量的提升与函数空间 本章着重于随机变量的现代定义,即从样本空间到实数域的 $mathcal{F}$-可测映射。重点探讨了随机变量的复合函数、乘积随机变量的构造,以及随机变量序列的收敛模式(依概率收敛、几乎必然收敛、依分布收敛的相互关系及其在测度论下的严格证明)。 第3章:期望、条件期望与鞅论基础 期望的概念从黎曼积分推广到勒贝格积分,强调了积分的性质。条件期望被提升到子 $sigma$-代数上的最优预测器视角。在此基础上,本书首次引入了鞅(Martingale)的概念,并阐述了Doob鞅收敛定理,这是时间序列分析和金融数学的理论核心。 第4章:随机向量与多维分布 本章处理联合分布、边缘分布和条件分布的测度论构造。我们详细分析了随机向量的协方差结构、正态分布的矩阵形式(包括协方差矩阵的性质)以及高斯随机场的初步概念。重点解析了高维空间中“维度灾难”对直观理解的挑战。 第5章:大数定律与中心极限定理的现代发展 除了经典的Kolmogorov大数定律和Lindeberg-Feller中心极限定理,本章特别关注了非独立同分布(NID)情形下的极限定理,如Berstein不等式、Hoeffding不等式以及更具一般性的随机加权和的中心极限定理。 --- 第二部分:数理统计推断的严谨框架(第6章 - 第10章) 本部分回归到统计推断的核心,系统梳理经典推断方法的统计学原理,并引入效率、一致性等现代统计量度。 第6章:统计推断的基本要素与性质 定义了统计模型(观测空间、参数空间、概率家族)。着重分析了估计量的优良性质:无偏性、一致性、有效性和渐近正态性。详细介绍了Cramér-Rao下界理论及其在实际估计量评估中的应用。 第7章:充分性、完备性与有效估计 深入探讨了信息论在统计中的应用,严格定义了充分统计量和完备性。重点阐述了因子分解定理及其在求解UMVUE(一致最小方差无偏估计)中的关键作用。 第8章:参数估计方法的高级比较 本章将经典的矩估计(MOM)、极大似然估计(MLE)与贝叶斯估计并置比较。特别加强了对MLE的渐近性质的论述,包括其渐近正态性和渐近有效性,并引入了信息矩阵(Fisher Information Matrix)的计算与应用。 第9章:假设检验的统一理论 本章采用 Neyman-Pearson 框架,系统化了参数假设检验。从单边检验到双边检验,详细推导了似然比检验(LRT)的构建过程及其在渐近情况下的$chi^2$分布近似。此外,还引入了功效函数和UMP(一致最优点检验)的概念。 第10章:区间估计与置信区域的构造 不同于简单的置信区间,本章关注高维参数的置信区域的构造。讨论了基于枢轴量(Pivotal Quantity)、基于似然比和基于渐近分布的置信集方法,并探讨了置信水平在不同哲学下的含义差异。 --- 第三部分:广义线性模型与非参数方法的引入(第11章 - 第15章) 面对现实世界中数据的异质性(非正态性、相关性),本部分聚焦于超越标准正态假设的模型构建,这是应用统计学不可或缺的工具。 第11章:广义线性模型(GLM) GLM是连接线性模型和各种分布(如泊松、二项、伽马)的桥梁。本章详细介绍了指数族分布、链接函数(Link Functions)和随机项的结构。核心在于迭代加权最小二乘法(IRLS)求解GLM的估计。 第12章:计数数据与泊松回归 专注于计数数据,详细分析了泊松回归的拟合、残差分析(如Deviance残差),并深入讨论了过分散(Overdispersion)问题的处理,引入了负二项回归作为替代方案。 第13章:分类数据分析:逻辑斯谛与多项式回归 本章详细阐述了二元和多元分类响应的处理。重点在于逻辑斯谛回归(Logit Model)的系数解释(优势比/风险比),以及多项式逻辑斯谛回归在多类别选择问题中的应用。 第14章:非参数估计与核方法 在模型假设减弱的背景下,非参数方法变得至关重要。本章介绍了核密度估计(KDE)的原理,重点分析了核函数(如高斯核、Epanechnikov核)的选择和带宽(Bandwidth)的优化准则(如Silverman's Rule)。 第15章:非参数回归:局部回归与样条 本章引入了局部加权散点平滑估计(LOWESS/LOESS)的思想,并详细讲解了样条回归(Spline Regression),特别是自然样条和三次样条,如何提供平滑且灵活的拟合,避免过度拟合。 --- 第四部分:时间序列分析与现代统计计算(第16章 - 第20章) 本部分面向动态数据和高维计算,介绍了现代数据科学中频繁使用的工具。 第16章:平稳时间序列分析基础 定义了严平稳和宽平稳。侧重于自相关函数(ACF)和偏自相关函数(PACF)的计算与识别。重点介绍了ARMA模型的识别、估计和诊断检验。 第17章:非平稳序列模型:ARIMA与趋势分解 系统介绍如何处理非平稳序列,包括差分操作。详细讲解了ARIMA模型的建立流程。此外,讨论了时间序列的季节性分解方法(如STL分解)。 第18章:马尔可夫链蒙特卡罗(MCMC)方法 这是贝叶斯统计计算的基石。本书详细介绍了Metropolis-Hastings算法和Gibbs采样的原理、收敛诊断(如Gelman-Rubin统计量)和实际应用,使读者能够处理复杂的、难以解析积分的后验分布。 第19章:高维数据中的统计学习:LASSO与Ridge回归 在参数远多于观测值($p gg n$)的情况下,正则化是必需的。本章对比了Ridge回归(L2惩罚)和LASSO(L1惩罚)在变量选择和收缩估计中的作用与机理。 第20章:交叉验证与模型选择的统计学依据 讨论了模型选择的标准,如AIC、BIC的推导。重点阐述了K折交叉验证(K-Fold CV)的原理及其在评估模型泛化能力中的不可替代性,并简要介绍了留一法(LOOCV)。 --- 本书特色 1. 理论深度与应用广度兼备: 深度剖析了测度论在概率论中的作用,同时紧密结合了GLM、时间序列和正则化等现代统计工具。 2. 强调渐近理论: 大量内容基于大样本性质的分析,使读者理解现代统计推断的稳健性。 3. 计算思维培养: 引入MCMC和交叉验证等计算方法,确保读者能够应对真实世界的数据挑战。 4. 清晰的数学推导: 所有的关键定理均提供完整或高度概括的推导过程,适合数理基础扎实的读者深入研究。 本书面向统计学、数学、工程学、经济学及计算机科学等专业的高年级本科生、研究生以及需要系统回顾和提升统计理论水平的科研人员。