具体描述
内容简介
概率统计与数学模型内容包括概率论和数理统计两大部分,第1至第5章介绍概率论的基本知识,包括随机事件与概率、随机变量及分布、随机变量的数字特征、大数定律与中心极限定理等;第6至第9章介绍数理统计的基本知识,包括数理统计、参数估计、假设检验、回归分析等.概率统计与数学模型在概率统计的基础上加入了数学模型,重点强调基础知识如何应用于工程实际,选取了大量的理工类、经管类数学模型实例. 目录
目 录
前言
第1章随机事件与概率 1
1.1 随机现象与随机试验 1
1.1.1随机现象 1
1.1.2随机试验 1
1.2 随机事件 2
1.2.1 样本空间 2
1.2.2随机事件 2
1.2.3事件的关系及运算 3
1.3 概率及其性质 6
1.3.1 概率 6
1.3. 2 频率 6
1.3.3 古典概率 7
1.3.4概率的公理化定义与性质 8
1.4 条件概率与乘法公式 10
1.4.1条件概率 10
1.4.2 乘法公式 11
1.5全概率公式与贝叶斯公式 13
1.5.1 全概率公式 13
1.5.2贝叶斯公式 15
1. 6事件的独立性 16
1.7随机事件应用实例 18
习题1 20
第2章随机变量及其分布 23
2. 1随机变量及其分布函数 23
2.1.1随机变量 23
2.1.2分布函数 24
2.2离散型随机变量 26
2.2.1离散型随机变量及其分布律 26
2.2.2常见的离散型分布 29
2.2.3离散型随机变量的应用实例 32
2. 3连续型随机变量 33
2. 3. 1连续型随机变量及其概率密度 33
2.3.2常见的连续型分布 37
2.3.3连续型随机变量的应用实例 43
2.4随机变量函数的分布 44
2.4.1离散型随机变量函数的分布 44
2.4.2连续型随机变量函数的分布 45
习题2 47
第3章多维随机变量及其分布 50
3. 1多维随机变量及其分布函数 50
3.1.1 多维随机变量 50
3. 1. 2联合分布函数 50
3. 2 二维离散型随机变量 53
3.2.1 联合分布律与边缘分布律 53
3.2.2 二维离散型随机变量的应用实例 55
3. 3 二维连续型随机变量 56
3.3.1联合概率密度函数 56
3.3.2 常见的二维连续型分布 58
3.3.3 二维连续性随机变量的应用实例 60
3.4 随机变量的独立性 61
3. 4. 1独立性的定义 61
3. 4. 2 独立性的性质 64
3. 4. 3 独立性的应用实例 64
3.5 二维随机变量的函数的分布 65
3.5.1 二维离散型随机变量函数的分布 65
3.5.2 二维连续型随机变量函数的分布 67
3. 5. 3 二维随机变量函数的应用实例 71
习题3 72
第4章随机变量的数字特征 75
4. 1数学期望 75
4.1.1数学期望的概念 75
4.1.2随机变量的函数的数学期望 77
4.1.3数学期望的性质 79
4.2方差 80
4.2. 1 方差的概念 80
4.2.2方差的性质 81
4.2.3几种常见分布的数学期望与方差 82
4.2.4 矩 85
4. 3协方差与相关系数 85
4.4应用实例 88
习题4 90
第5章大数定律及中心极限定理 93
5.1切比雪夫不等式 93
5. 2大数定律 94
5.3 中心极限定理 97
习题5 101
第6章数理统计 102
6.1数理统计基本概念 102
6.1.1总体和样本 102
6.1.2 统计量 104
6.2几种常见的统计量分布 106
6.2.1常见抽样分布 106
6.2.2 抽样分布定理 110
6.2.3抽样分布的应用实例 111
习题6 112
第7章参数估计 114
7. 1 参数的点估计 114
7.1.1矩估计 114
7.1.2极大似然估计 116
7.2估计量的优良准则 119
7.2.1 无偏性 119
7.2.2有效性 121
7.2.3相合性 121
7.3参数的区间估计 122
7.2.2 基本概念 122
7.3.2单侧置信区间 126
7.4参数估计应用实例 128
习题7 130
第8章假设检验 133
8.1假设检验的基本概念 133
8.1.1引例 133
8.1.2假设检验的基本概念 133
8.1.3假设检验的基本步骤 135
8.2参数的假设检验 135
8.2.1 均值的检验 135
8.2.2 方差的检验 140
8.3分布的假设检验 143
8.3.1 X2检验法 144
8.3.2总体分布为连续型的分布拟合检验 145
习题8 148
第9章回归分析 150
9.1回归分析的基本概念 151
9.1.1 一元线性回归模型 151
9.1.2多元线性回归模型 151
9.1.3散点图 152
9.1.4参数估计:最小二乘法 153
9.1.5 显著性检验 153
9.2 —元线性回归分析实例 155
9.3多元线性回归分析实例 157
9.4非线性回归问题的线性化处理 159
9.4.1几种常见的可线性化的曲线类型 159
9.4.2非线性回归分析实例 161
习题9 163
部分习题参考答案 166
参考文献 175
附表 176 精彩书摘
第1章随机事件与概率
1.1随机现象与随机试验
1.1.1 随机现象
在自然界和人类社会生活中,存在各种各样的现象.有一些是在一定条件下必然会 发生的现象.例如,标准大气压下,水加热到10(TC时必然会沸腾,在OK时必然会结冰; 同性的电荷必然互相排斥,异性的电荷必然互相吸引;在没有外力作用的条件下,做匀 速直线运动的物体必然继续做匀速直线运动等,这些现象称为确定性现象.
另一些是事前不能预测其结果的现象.例如,抛一枚均匀硬币,可能出现正面, 也可能出现反面;某厂生产的同一类灯泡的寿命会有所差异;某地区每年的降雨量 不尽相同,等等.这些现象称为非确定性现象,又称为随机现象.
随机现象的结果事前不能预测,但在相同条件下,大量重复试验和观测时,会 发现它们呈现某种规律性.例如,抛一枚均匀硬币,大量重复试验后会发现出现正 面和出现反面的次数大约是1: 1,某厂生产的同一类灯泡的寿命总是分布在某个 数值附近.大量同类随机现象的这种规律性称为随机现象的统计规律性.概率论与 数理统计正是研究随机现象及其统计规律性的一门数学学科.
1.1. 2随机试验
在概率论中,为叙述方便,对随机现象进行的观察或科学试验统称为试验.用 字母E表示.
例1.1.1观察下列几个试验.
E1:投掷一枚均匀骰子,观察出现的点数(即朝上那一面的点数).
E2 :在^'批产品中,任取^'件,检测它是正品,还是次品.
E3:投掷一枚质地均匀的硬币两次,观察它出现正面和反面的次数.
E4:记录某网站一天的点击量.
E5 :从一批灯泡中,任取一只,测试其寿命.
以上试验的结果都是可以观测的,并且具有下列三个共同特点.
(1) 试验可以在相同的条件下重复进行,即可重复性.
(2) 试验的结果不唯一,但在试验前就知道所有可能出现的结果,即结果的明 确性.
(3)在一次试验中,某种结果出现与否是不确定的,在试验之前不能准确地预 测该次试验将会出现哪一种结果,即结果的随机性.
所有具有以上三个特点的试验称为随机试验,简称为试验,并通过随机试验来 研究随机现象.
1.2随机事件
1 .2.1样本空间
对随机试验,人们感兴趣的是试验的结果,将试验犈的每一种可能结果称为 基本事件,或称为样本点,记为他所有样本点组成的集合称为试验犈的样本空 间,记为
例如,在抛掷一枚均匀硬币的试验中,有两个可能结果,即出现正面或出现 反面,分别用“正面”和“反面”表示,因此这个随机试验有两个样本点,样本空间 0 = {正面,反面}.
例1. 2 . 1写出以下随机试验的样本空间.
E1:投掷一枚均匀骰子,出现的点数可能是1,2,3,4,5,6中的任何一种,因此 样本空间记为:00 = {1,2,3,4,5,6}.
E2 :在一批产品中,任取一件,其结果可能是正品,也可能是次品,因此样本空 间记为:i0 = {正品,次品}.
E3:投掷一枚均匀硬币两次,它可能出现的结果为:两次都为正面;第一次出 现正面且第二次出现反面;第一次出现反面且第二次出现正面;两次都为反面.因 此样本空间记为:
0 ={(正面、正面),(正面,反面),(反面,正面),(反面,反面)},
以上三个样本空间中的样本点为有限个.
E4:网站一天的点击量一定是非负整数,因此,样本空间0 = {0,1,2,一}.
这个样本空间有无穷多个样本点,但这些样本点可以与整数集一一对应,称其 样本点数为可列无穷多个.
E5:从一批灯泡中,任取一只,灯泡的寿命狋为非负实数,样本空间记为:00 =
{t|t≥0}.
这个样本空间包含有无穷多个样本点,它们充满一个区间,称其样本点数是不 可列的.
1.2.2 随机事件
随机试验中,有可能发生也可能不发生的结果称为随机事件,简称为事件,常
用大写字母A,B,C,…表示.若A表示投掷一枚均匀硬币出现正面这一事件,则 记A ={正面},单个样本点组成的集合&}称为基本事件,多个样本点组成的集合 {coi,叱,…,W?}称为复合事件.
随机事件是样本空间的子集.其中,在每次试验中,一定出现的事件称为必 然事件,记为仏一定不可能出现的事件称为不可能事件,记为0.如测量某地 区6岁男童身高的试验,身高小于0是不可能事件,身高大于0是必然事件.
例1. 2. 2投掷一枚质地均匀的骰子,若记事件A = {出现的点数为偶数}, B={出现的点数小于5},C = {出现的点数为小于5的奇数},D = {出现的点数 大于6},则A,B,C,D 都是随机事件,也可表示为:A = {2,4,6},B={1,2,3,4}, C= {1,3},D为不可能事件,即D = 0.记事件A? ={出现w点},1,2,3,4, 5,6.显然,Ai,A2,…,A6都是基本事件,A,B,C是复合事件.
1.2.3事件的关系及运算
在一个样本空间中可以定义多个随机事件,事件与事件之间往往有一定的关 系.事件是样本点的集合,因此事件间的关系与运算可以按照集合与集合之间的关 系与运算来处理.
下面假设试验E的样本空间为仏A,B,C,Ai ,A2,…,A?分别是E的事件.
1.事件的包含关系
如果事件A发生必然导致事件B的发生,则称事件犅包含事件A,事件A是 事件B的子事件,记为A CB .
如例1.2. 2中{1,3} [ {1,2,3,4},即事件CCB,所以C是B的子事件,事 件B包含事件C.
如果事件A包含事件B,同时事件B也包含事件A,即BCA且A CB,则 称事件A与事件B相等,或称A与B等价,记为A = B .
对任一事件A,总有0 C A (Z0.
2 .和事件
事件A与事件B中至少有一个发生的事件,称为事件A与事件B的和事件, 记作A U B.即
A U B ={ A发生或B发生} = {A, B中至少有一个发生}
事件A,B的和事件是由A与B的样本点合并而成的事件.
如例1.2.2 中 A= {2,4,6},B= {1,2,3,4},则 A U B = {1,2,3,4,6}.
类似地,n个事件的和事件为A1 U A2 U…U An,或记作
k = 1
事件A与事件B同时发生的事件,称为事件A与事件B的积事件,记作A门B 或AB .即
A门B = {A发生且B发生} = {A,B同时发生}.
事件A,B的积事件是由A与B的公共样本点所构成的事件.
如例1.2.2 中 A= {2,4,6},B= {1,2,3,4},则 AB = {2,4}.
类似地,《个事件的积事件为AiAz-A^,或记为.
犽=1
4 .差事件
事件A发生而事件B不发生的事件,称为事件A关于事件B的差事件,记作 A 一 B,表示A发生而B不发生,即A — B = AB.
事件A关于B的差事件是由属于A且不属于B的样本点所构成的事件.
如例 1. 2.2 中A = {2,4,6},B= {1,2,3,4},则 A—B = {6},B—A= {1,3 }.
5. 互不相容事件
如果事件A与事件B不能同时发生,即AB = 0,则称事件A与事件B互不 相容,或称事件A与事件B互斥.
如例1.2. 2中A = {2,4,6}B={1,3},则AB是互不相容的.
同一随机试验的基本事件都是互不相容的.
6. 对立事件
试验中“ A不发生”这一事件称为A的对立事件或A的逆事件,记为A .
一次试验中,A发生则A必不发生,而A发生则A必不发生,因此A与A满 足关系
A U A = 0, AA = 0.
如例 1.2. 2 中A = {2,4,6} ,B= {1,2,3,4},则A = {1,3,5},B = {5,6}. 事件间的关系与运算可用维恩(Venn)图(图1. 1)直观地加以表示.图中方框 表示样本空间0,圆A和圆B分别表示事件A和事件B .
事件的运算满足如下运算律:
(1) 交换律
A UB = B U a;
(2) 结合律
(A U B) U 犆=A U (B U 犆),
(A门B)门C =犃门(B门C);
0 m B Q
m
AOB AUB ADB
B ^ Q
CO mm oCD
A-B
I 图1.1
j,方互不相容
(3) 分配律
(AuB)Nc=(AnC)u犆
(4) 对偶律(De Morgan定理)
二犃 nB,
二犃u犅,
』般地,对狀个事件犃1犃2,?
=犃1 n犃2 n…n犃狀,
二犃1 u犃2 u…u ^—狀;
A1 nA2 n…nAn
对偶律表明,“至少有一个事件发生”的对立事件是“所有事件都不发生”,“所 有事件都发生”的对立事件是“至少有一个事件不发生”
(5)吸收律
若A匚B,则Au B = B,AB = A.
例1.2. 3某人连续三次购买体育彩票,每次一张.令A,B,C分别表示其第 、二、三次所买的彩票中奖的事件,试用A,B,C及其运算表示下列事件:
(1) 第三次未中奖;
(2) 只有第三次中了奖;
(3) 恰有一次中奖;
(4) 至少有一次中奖;
(5) 至少有两次中奖;
(6) 至多中奖两次.
解⑴C;?
(2) ABC;
(3) A^C U ,AB(— U ABC;
(4) A U B U C 或 ABC;
(5) AB U AC U BC 或ABC U ABC U ABC U ABC;
(6) ABC .
事件的关系及运算与集合的关系及运算是一致的,但在概率论中有特定的语 言表示.事件关系与集合关系比较见表1.1.
表1.1
记号 概率论 集合论
n 样本空间、必然事件 全集
0 不可能事件 空集
o 样本点 点(元素)
A 随机事件 D的子集
ACB A发生导致B发生 八为B的子集
A = B 两事件相等 两集合相等
AUB 两事件A,B至少发生一个 两集合A,B的并集
AB 两事件A,B同时发生 两集合A,B的交集
A-B 事件A发生而B不发生 集合A,B的差集
A 事件A的对立事件 A对n的补集
AB = 0 两事件A、B互不相容 两集合A,B不相交
1.3概率及其性质
1.3.1概率
随机事件在一次试验中可能发生也可能不发生,但发生的可能性大小是客观存 在的.这个客观存在的量就是事件A的概率,记为P(A).因此概率度量了随机事件 发生的可能性大小.在N次重复试验中,若概率P(A)较大,则事件A发生的频率也 较大,反之,若事件A在N次重复试验中出现的频率较大,则意味着事件A的概 率P(A)也较大.概率与频率有许多相似的性质,为此,先考察频率的有关性质.
1.3.2频率
定义1. 1设在相同的条件下,重复进行了 n次试验,若随机事件A在这w次 试验中发生了 m次,则比值
fn(A) = m (1. 1)
n
称为事件A在w次试验中发生的频率. 前言/序言
图书简介:现代密码学与信息安全基础 导言:数字时代的隐秘守护者 在信息爆炸的今天,数据不再仅仅是知识的载体,更是驱动社会运转的核心资产。从个人通信到国家安全,从金融交易到物联网 (IoT) 设备,每一个数字操作都依赖于背后看不见的加密和认证机制。然而,随着计算能力的飞速提升和量子计算的潜在威胁日益逼近,传统的安全屏障正面临前所未有的挑战。《现代密码学与信息安全基础》旨在为读者揭示保护这些数字资产的深层原理、前沿技术和工程实践。本书超越了简单的算法介绍,深入探讨了密码学理论的数学根基,并将其应用于构建健壮、可信赖的信息系统。 第一部分:密码学的数学基石与基本构造 本部分聚焦于构建现代密码系统的核心数学工具和概念,为理解更复杂的协议奠定坚实的基础。 第一章:数论与有限域的复习与应用 密码学的安全性往往建立在某些数学难题的计算复杂性之上。本章首先回顾了在大整数分解(RSA 的基础)、离散对数问题(DLP)以及椭圆曲线离散对数问题(ECDLP)中起关键作用的数论知识,包括欧拉定理、费马小定理、扩展欧几里得算法以及模逆运算。 重点讨论有限域(Galois Fields)的构造与运算,特别是伽罗瓦域 $mathbb{F}_p$ 和 $mathbb{F}_{2^m}$。我们将详细分析多项式运算在有限域上的应用,这对于理解分组密码(如 AES)和有限域上的椭圆曲线运算至关重要。我们将展示如何利用这些结构来定义安全的原语,并分析在不同代数结构下安全假设的差异。 第二章:信息论安全与熵的概念 信息安全的核心在于量化“秘密”的程度。本章引入香农(Shannon)的信息论基础,特别是熵(Entropy)的概念,用以衡量信息源的不确定性。我们将讨论互信息(Mutual Information)和条件熵,并将其应用于分析密码系统的随机性要求。 关键内容包括:完美保密性(One-Time Pad 的理论实现与实践限制)、伪随机性(Pseudorandomness)的严格定义,以及如何从信息论角度评估密钥的强度。本章还将探讨侧信道攻击(Side-Channel Attacks)的理论基础,解释功耗分析和电磁辐射分析如何通过测量物理泄露来获取密钥信息,从而强调了系统实现层面的安全性需求。 第二部分:对称密码体制与分组密码设计 对称密码由于其高效性,在大量数据加密中占据核心地位。本部分深入解析当前主流的对称密码算法的设计原理和安全分析。 第三章:分组密码的结构与高级加密标准(AES) 本章详细剖析了现代分组密码的设计范式,特别是 Feistel 结构和替换-置换网络(SP-N 结构)的异同与适用场景。 核心内容聚焦于分组密码标准 AES(Rijndael)。我们将分层解析 AES 的四个核心步骤:字节替代(SubBytes,基于 S 盒)、行移位(ShiftRows)、列混淆(MixColumns)以及轮密钥加(AddRoundKey)。我们将深入探讨 S 盒的设计原则,特别是其如何确保扩散性(Diffusion)和混淆性(Confusion),并从有限域乘法逆的角度解析其抗线性攻击的能力。 第四章:流密码与同步性分析 流密码(Stream Ciphers)以其低延迟和高吞吐量适用于实时通信。本章探讨了基于线性反馈移位寄存器(LFSR)的序列生成器,分析其周期长度和线性复杂度。 更侧重于现代的、基于复杂的非线性函数的流密码,如 ChaCha20。我们将分析 Salsa20 家族的迭代结构、状态的更新机制,以及如何通过高阶非线性函数来抵御差分和线性攻击。本章还将讨论同步性问题、密钥流重用(Key Stream Reuse)的严重后果,以及如何通过计数器模式(CTR Mode)将分组密码转化为高效的流密码,并分析其安全优势。 第三部分:非对称密码体制与公钥基础设施 非对称密码(公钥密码)是实现身份认证和安全通信的基石。本部分着重于其数学挑战、算法实现和生态系统构建。 第五章:RSA 与基于模幂运算的加密 本章详细阐述 RSA 算法的数学基础,包括欧拉定理在密钥生成中的应用,以及大数模幂运算的效率优化(如 Montgomery 乘法)。我们将分析 RSA 的安全威胁,特别是定时攻击和广播攻击(Hastad’s Broadcast Attack)。 同时,本章会详述填充方案的重要性。我们将对比 PKCS1 v1.5 标准和更安全的 OAEP(Optimal Asymmetric Encryption Padding),解释这些填充如何将选择明文攻击(CPA)转化为难以解决的数学难题,从而保证实际使用的安全性。 第六章:椭圆曲线密码学(ECC)及其前沿应用 ECC 凭借其更短的密钥长度提供同等级别的安全性,已成为移动和高安全要求的标准。本章从代数几何角度介绍椭圆曲线的群结构——点的加法运算。 我们将详细推导 ECDH(Diffie-Hellman)和 ECDSA(数字签名算法)的完整流程。本章的重点在于分析 ECDLP 的难度,并讨论不同曲线(如 NIST 曲线、Curve25519)的参数选择标准和安全性考量,特别是对后量子密码学(PQC)预备知识的介绍。 第四部分:消息认证码、哈希函数与数字签名 安全通信不仅需要保密性,还需要完整性和真实性保证。本部分专注于数据完整性校验和身份验证技术。 第七章:加密哈希函数的设计与安全性分析 哈希函数是数据指纹和密码学原语的基石。本章深入研究哈希函数的结构,如 Merkle-Damgård 结构,并分析 MD5 和 SHA-1 为什么被淘汰。 重点分析 SHA-2 和 SHA-3(Keccak)的设计差异。我们将探讨原像攻击(Preimage Attack)、第二原像攻击和碰撞攻击(Collision Attack)的理论框架,并展示如何利用差分分析来寻找哈希函数的弱点。 第八章:消息认证码(MAC)与数字签名方案 本章讨论如何利用哈希函数构造消息认证码(MAC),特别是 HMAC 的精确结构和其基于“内部/外部密钥”设计的安全性。 在数字签名方面,我们将对比基于公钥系统的签名(如 RSA 签名、ECDSA)和基于散列函数的签名(如 Lamport 签名)。重点在于陷门单向函数(Trapdoor One-Way Functions)在签名方案中的作用,以及如何确保签名的不可否认性(Non-Repudiation)。 第五部分:协议安全与前沿安全挑战 本部分将理论知识应用于构建实际安全协议,并展望未来的安全挑战。 第九章:安全协议的构造与实例分析 本章通过分析实际的互联网安全协议来检验前述的密码学原语如何协同工作。我们将详细解析 TLS/SSL 协议的握手过程(包括密钥交换、证书验证和数据加密),分析其版本迭代(从 SSL 3.0 到 TLS 1.3)中为解决POODLE、BEAST 等漏洞而做出的结构性改进。 此外,本章还将探讨 Kerberos 协议的认证流程,并分析零知识证明(Zero-Knowledge Proofs)的基本原理,展示如何在不泄露敏感信息的前提下验证声明的真实性。 第十章:后量子密码学的展望与挑战 随着量子计算机理论的成熟,基于大数分解和离散对数的公钥密码体系面临被 Shor 算法破解的风险。本章将引入后量子密码学(PQC)的几个主要研究方向: 1. 基于格的密码学(Lattice-based Cryptography):介绍 LWE/SIS 问题的困难性,以及 Regev 方案和 Kyber 等算法的结构。 2. 基于编码的密码学:如 McEliece 方案。 3. 基于多元多项式的密码学:如 Rainbow 方案的原理。 本章旨在帮助读者理解当前标准正在经历的迁移过程,以及在新计算范式下,如何重新设计和评估密码系统的安全性。 结语 《现代密码学与信息安全基础》不仅仅是一本算法手册,它更是一份对数字世界安全哲学和数学逻辑的探索指南。通过对理论深度的挖掘和对实践应用的考察,读者将能够从根本上理解信息是如何被保护的,并在面对不断变化的技术环境时,具备设计和评估下一代安全系统的能力。