具有有限均值和方差的任何分布,样本均值的分布都会接近正态分布。即中心极限定理(Central Limit Theorem)。
因此,宇宙中,由许多微小独立随机因素影响的量,可以被认为具有正态分布。
样本均值 #
对任何一个有期望
因为首先,样本均值
每个样本
大数法则 (Law of Large Numbers): 样本均值随着样本数量的增加,会逐渐接近总体均值。
样本方差 #
样本方差的期望值为:
因为:
此处用到了方差的数乘性质:
正态分布 #
正态分布是自然界中最常见的分布之一,是最“自然”的分布。它描述大量独立事件叠加后的结果,是随机变量加和的极限分布。原因是这种分布的熵最大,也就是说,它携带的信息最少,具有最少的假设和最简单的形状。
许多自然和社会现象都是大量独立因素叠加的结果,比如气温、人的身高、成绩等。
概率密度函数 (Probability Density Function) 为:
正态分布拥有所谓的 68-95-99.7 规则,即在均值
为何趋于正态分布? #
随着样本数量