重点
矩估计, MLE (2道大题)
Discuss 有效性 无偏性 相合性 渐进性
UMVUE (1道大题)
假设检验 (1-3道大题)
Pearson 列联表之后不考
大数定律
四种收敛形式
Tips
这里的收敛形式都是对一串随机变量. 我们讨论的是时候的性质.
分布收敛
对应概率函数, 则存在一个使得
概率收敛
存在一个使得对任意,
几乎处处收敛
满足
-阶矩收敛
满足
四种收敛形式的转化
- 收敛形式的强弱
- (连续映射定理) For continuous function and ,
Tips
连续映射定理对按-阶矩收敛不成立
- (Slustky定理) If is a constant and , then
Tips
对于收敛到一个常数的要求比收敛到一个随机变量的要求更高.
弱大数定律
对于
- i.i.d
- 有限均值 的样本, 我们有
强大数定律
对于
- i.i.d
- 有限均值
- 有限方差 的样本, 我们有
切比雪夫不等式
如果
- 的均值存在
- 的方差存在 则
中心极限定理
如果样本满足
- i.i.d.
- 的均值存在, 且为
- 的方差存在, 且为 那么当的时候就有
或者可以写成
这里的是标准误差(Standard Error).
Tips
对于二项分布而言, 形式上虽然只有一个样本, 不能使用中心极限定理, 但是我们可以把它拆解成多个伯努利试验的结果的和, 从而我们有. 又注意到, 于是我们就有 也就是
次序统计量
最大最小值
注意这两个特殊次序量的CDF可以写成
和
密度函数
假设 i.i.d. 来自于同一个CDF为, PDF为的分布.
考虑第个次序统计量的分布, 我们想推导. 我们要在个观测值中选出个小于的, 个在附近, 以及剩下个大于. 这里
- 恰好有个观测值小于的概率是
- 恰好有一个观测值落在内的概率是
- 恰好有个观测值大于的概率是
- 对应的多项式系数就是
于是对应的概率密度就是
特别地, 对于最大, 最小值有
以最大值为例, 前一节的推导告诉我们对于CDF有
两边求导和上面PDF的结果就是一样的.
三大分布
Chi-Squared分布
构造
个独立标准正态分布的平方和就服从分布.
均值和方差
- 均值为
- 方差为 倒数分布的的均值为, 也就是
这可以用来帮助得到F分布的均值.
Cochran定理
我们还可以通过构造样本方差的方式来构造统计量, 对于个标准正态分布随机变量, 就有
这里的是样本方差.
Tips
从的第一种平方和构造也可以知道, 这里左边不需要除以.
Cochran常用于样本符合正态分布, (或者根据中心极限定理在较大时近似符合正态分布).
可加性
如果, , 且相互独立, 那么我们就有.
和其他分布的关系
自由度为的分布就是一个的指数分布.
- 它们的均值: 为, 而指数分布为.
- 它们的方差: 为, 而指数分布为
同样自由度为的分布也可以通过均匀分布构造得到
分布是Gamma分布的一个特例, 也就是说
或者我们写得更加简单点, 利用Gamma分布和指数分布之间的联系
Tips
可以记住一个结论,
t分布
构造
我们有一个标准正态分布随机变量, 和一个, 且它们相互独立, 那么就有
Tips
注意不要忘记分母根号里要除以
性质
均值为, 因为t分布是一个对称分布
当时, 我们有
F分布
构造
我们有两个独立的, 那么我们就有
性质
的均值只和有关, 因为分子的均值是一个常量. 具体来说, 其均值为
如果, 那么.
如果, 那么
当时, .
矩估计
样本的各阶矩(均值, 方差)等是参数的函数, 先计算出这些函数的形式, 再给出由样本估计的这些矩的值(样本均值, 样本方差), 令它们相等, 就可以解出参数的值.
要估计多少个参数, 就最少需要多少个矩方程.
MLE
先根据样本计算出似然函数, 再计算对数似然函数, 对其进行求导(或者Lagrange乘子法), 得到使得似然函数最大的参数值.
离散分布的似然函数
伯努利分布, 似然函数为
一次二项分布采样可以处理成多个伯努利分布的和
或者利用二项分布的PMF.
对于多项分布, 就是
UMVUE
如果一个对参数的估计是UMVUE, 那么
- 是无偏估计, 也就是说.
- 在的所有无偏估计中具有最小的方差.
C-R下界
C-R不等式告诉我们任何一个对某个分布的参数的估计的方差都不会小于一个下界, 也就是
其中是Fisher信息量. 其定义为
Tips
注意Fisher信息量直接由待估计的分布和完全决定, 和样本无关 (但是MLE中的似然函数就和样本有关了). 具体而言, 这里的似然函数是, 而MLE中的似然函数为.
充分性
充分统计量是指在给定样本数据时, 它包含所有与未知参数相关的信息. 换句话说, 如果我们知道了一个充分统计量的值, 那么我们就可以忽略原始样本数据, 因为它不会提供关于参数的额外信息.
如果样本数据是, 统计量是的一个充分统计量, 那么我们就有
比如说如果我们要估计一个抛一枚硬币向上的概率
- 原始数据: 正, 反, 反, 正, 反 ...
- : 正面朝上的次数 这里的就是硬币朝上概率的一个充分统计量.
Rao-Blackwell 定理
如果我们有一个无偏估计和一个充分统计量, 那么我们就可以构造一个不比原来差的无偏估计. 即如果我们本来有一个无偏估计, 和一个充分统计量, 由此我们可以构造一个新的估计, 且
- 它也是无偏的: ;
- 它不比原来的差.
寻找充分完备统计量
分布 | 参数 | 充分统计量 | 样本均值是否为充分统计量 |
---|---|---|---|
正态分布 | (已知 ) | 或 | 是 |
正态分布 | (已知 ) | 否 | |
正态分布 | 和 都未知 | 或者 | 否 |
指数分布 | 或 | 是 | |
二项分布 | 或者 (注意二项分布样本均值的定义) | 是 | |
Poisson分布 | 或 | 是 |
完备性
不考
相合和渐进正态
相合估计
一个相合估计是指当样本量趋于无穷大时, 依概率收敛于被估计的总体参数的估计量. 换句话说, 随着我们使用越来越多的数据, 相合估计变得越来越接近我们试图估计的真实值.
一个MLE是相合的当且仅当:
- 对数似然函数可微
- 似然函数是可识别的, 也就是说
- 不同的参数对应不同的分布, 且参数空间是紧集
- 或者说, 不同参数对应的分布之间的KL散度恒为正
渐进正态性
如果一个估计量 , 是基于大小为 的样本得出的参数 的估计, 并且当 时, 它满足以下性质:
那么我们称 具有渐近正态性, 它的渐近均值为 , 渐近方差为 .
Delta方法
如果我们有 , 并且 存在且不为零, 那么
区间估计
置信区间 选填 也有大题: 算置信区间
Note
多做题就行
假设检验
基本概念熟悉
Note
本质上和区间估计一样 多做题.
两类错误
假设大概率得是对的, 所以第一类错误就是假设对了但是拒绝了, 这种错误就比较常见. 而假设错了但还是接受了它, 这种错误比较少见, 所以称之为第二类错误.
控制的是犯第一类错误的概率
Fact \ Decision | Accept | Reject |
---|---|---|
is true | Good | Type I Error |
is true | Type II Error | Good |
功效函数
功效函数 定义为
也可以表示为
也就是样本落入拒绝域的概率.
- 当 为真时, 表示发生第一类错误的概率
- 当 为真时, 表示发生第二类错误的概率
几个轴枢量对应的符号
也就是对应CDF的反函数
- 正态分布
- 分布:
- 分布:
一些常见情况下的检验
方差已知 检验均值
方差未知 检验均值
均值已知 检验方差
均值未知 检验方差
两样本方差已知时均值差异的检验
两样本方差未知且相等时均值差异的检验
两样本均值已知时方差差异的检验
这里
两样本均值未知时方差差异的检验
一致最优检验(NP引理) 不考
构造假设检验, 确定拒绝域(一个大题+3-4个选填)
大样本检验
就是使用中心极限定理
Warning
注意中心极限定理是对一系列样本在时的结论
拟合优度检验不考(列联表不考)
大题
中心极限定理 , 大数定律
矩估计 MLE
假设检验
小题
三大分布
假设检验
一点点的矩估计和MLE
例题
T1
记 i.i.d , 其中已知.
- 求常数, 使得是的相合估计.
- 求的矩估计和最大似然估计;
- 求的渐进方差.
- 相合估计刻画的是当样本量时的行为, 我们需要找出一个, 使得对任意
这里的关键是计算
我们先求出的分布:
其中
这里都是有限的, 考虑强大数定律
a.s.隐含按照p收敛, 于是有.
- 对于矩估计, 可以直接用样本方差估计
对于MLE, 先写出似然函数
对数似然函数
抛弃和无关的项, 就有
设, 对求导就有
令其为零就有
- 我们直接求的方差, 也就是. 我们将其展开来算
前面我们已经算出来, 现在我们根据方差的定义,
于是有
从而
由于是MLE, 所以我们可以计算Fisher信息量
所以的渐近方差为.