其中:
正态分布是最重要的一种连续型随机变量的概率分布,其概率密度曲线呈“钟形”,对称且两端无限趋近于横轴(以横轴为渐近线),记作
三大特征:
单峰性:曲线在
对称性:曲线关于直线
渐近性:曲线向左右两侧无限延伸,逐渐接近横轴但永不相交。
由于正态分布曲线是单峰对称的,因此它的众值、中位值和均值都是重叠的。



将概率密度函数代入数学期望和方差公式,可推导得:
数学期望(均值):
方差:
标准差:
密度函数
参数
正态分布曲线下任意两点间的面积可由积分公式求出,它表示取值落在

根据正态分布图形的对称性,如果用

变量取值在区间

变量取值在区间

变量取值在区间

问题:不同
解决方案:标准化转换,将一般正态分布
标准分(Z分)公式:
标准分以“均值为基准,标准差为单位”,可用于不同总体的取值比较:
例1:甲班学生A成绩80分(
例2:两考生高考成绩(政治
利用标准分公式
标准正态分布的均值
当

对称性:概率密度曲线关于
峰值位置:在
单调性:在
渐近性:曲线在横轴上方且横轴为其水平渐近线,即曲线向左右两侧无限趋近于横轴,永不相交。
若
即随机变量


若
两者面积对应关系(对称性):
| 一般正态区间 | 标准正态区间 | 概率值 |
|---|---|---|
| 0.6827 | ||
| 0.9545 | ||
| 0.9973 |





性质:
计算
标准化转换:
查表示:
概率:
计算
标准化转换:
查表示:
概率:
标准化转换:
查表示:
百分比:
合格品率(
至少1件合格的概率(设
其中
图形特征:
偏右分布,随自由度
核心性质(可加性):
若

t分布与标准正态正态分布十分相似:两者都是关于y轴对称的曲线,均值、中位数和众数都重合于一点。但t分布的峰更低、尾更厚。
正态分布是一条与自由度无关的曲线,而t分布的形状由自由度
自由度


其中
图形特征:
核心性质:
若

要研究随机现象的规律性必须作大量的观察或试验。对于随机现象而言,个体的表现是纯属偶然的,但大量随机现象中,个体的偶然性会相互抵消,总体呈现稳定性:
阐明在大量观察或实验中,随机现象稳定性的一系列定理称为大数定理。
大数定理是研究随机现象规律性的理论基础。
或等价形式:
意义:
为用样本成数估计总体成数奠定理论基础:在相同条件下进行多次观察时,随机事件的频率
例如:某大学有学生20000人,其中女同学有6000人(总体中女性的频率为0.3)。做容量不同的抽样,统计样本中女性的频率后发现,随着样本容量的增大样本中女性的频率越来越接近总体中女性的频率。
其中
意义:
为用样本均值估计总体均值奠定理论基础:当
例如:某居民社区有883户居民。户均住房面积为40.86平方米。现从中做了容量不同的抽样。随着样本容量的增大,样本户均住房面积越来越接近总体的40.86平方米。
贝努里大数定理与切贝谢夫大数定理都说明了在大量观察的情况下,随机变量特征值的稳定性。即频率稳定于概率,平均值稳定于数学期望。
中心极限定理则说明了在大量观察的情况下,随机变量的特征值在分布上所表现的稳定性。
中心极限定理是用随机抽样结果推论总体的理论基础。它告诉我们,尽管被研究现象的总体分布是未知的,但只要样本容量足够大,样本均值的分布将都是已知的,即服从正态分布。
标准化后:
中心极限定理还有以下几种表现形式:
其中,
总体分布特征
某大学根据研究生的入学成绩将学生分为均等的4部分,以此来分配奖学金。
前25%的学生可得一等奖学金,每月800元。
前25%-50%的学生可得二等奖学金,每月600元。
前50%-75%的学生可得三等奖学金,每月400元。
最后25%的学生可得四等奖学金,每月200元。
这是一个均匀分布的总体,分布特征如图所示。

总体分布特征
随机抽一人,计算随机变量的数学期望、方差与标准差
容量为2的样本均值分布特征
从上述总体中随机抽取两人,观察其平均每人获得奖学金的数量。
这是两个同分布随机变量的平均值
这种抽样可以构成的样本组合数为
每个样本组合出现的概率均为

容量为2的样本均值分布特征
随机抽2人,计算随机变量的数学期望、方差与标准差
更多抽样实验
依此类推,可抽样3、4、30和300人,并计算随机变量的分布。

更多抽样实验
依此类推,可抽样3、4、30和300人,并计算随机变量的分布。

总体:奖学金分布(800元、600元、400元、200元,各占0.25)
| 样本量 |
样本均值 |
均值 | 方差 | 标准差 |
|---|---|---|---|---|
| 1 | 均匀分布 | 500 | 50000 | 223.6 |
| 2 | 对称分布 | 500 | 25000 | 158.1 |
| 3 | 对称分布 | 500 | 16666 | 129.1 |
| 4 | 对称分布 | 500 | 12500 | 110 |
| 30 | 近似正态分布 | 500 | 1666.7 | 40.8 |
| 300 | 接近正态分布 | 500 | 166.7 | 12.9 |
作为随机变量的样本均值,其数学期望就是总体均值,其方差随样本容量的增加而逐渐减小。
总体分布特征
总体中的奖学金不是均匀分布,而是5%成绩最好的学生得800元,其后10%成绩较好的学生得600元,再后面25%的学生得400元,其他60%的学生得200元。
这是一个偏态分布的总体,分布特征如图所示。
随机抽一人,计算随机变量的数学期望、方差与标准差。

容量为2的样本均值分布特征
从上述总体中随机抽取两人,观察其平均每人获得奖学金的数量。
这是两个同分布随机变量的平均值
这种抽样可以构成的样本组合数为
概率分布见右图。

从总体中随机抽取2人,构成的样本组合
| 奖学金 | 200 | 400 | 600 | 800 |
|---|---|---|---|---|
| 200 | 200 | 300 | 400 | 500 |
| 400 | 300 | 400 | 500 | 600 |
| 600 | 400 | 500 | 600 | 700 |
| 800 | 500 | 600 | 700 | 800 |
| 奖学金 | 200 | 300 | 400 | 500 | 600 | 700 | 800 |
|---|---|---|---|---|---|---|---|
| 概率 | 0.36 | 0.3 | 0.1825 | 0.11 | 0.035 | 0.01 | 0.0025 |
更多抽样实验
依此类推,可抽样3、4、30和300人,并计算随机变量的分布。

更多抽样实验
依此类推,可抽样3、4、30和300人,并计算随机变量的分布。

总体:奖学金分布(800元0.05、600元0.1、400元0.25、200元0.6)
| 样本量 |
样本均值 |
均值 | 方差 | 标准差 |
|---|---|---|---|---|
| 1 | 偏态分布 | 320 | 29600 | 172 |
| 2 | 偏态减弱 | 320 | 14800 | 121.7 |
| 3 | 偏态减弱 | 320 | 9866.7 | 99.3 |
| 4 | 偏态减弱 | 320 | 7400 | 86 |
| 30 | 近似正态分布 | 320 | 986.7 | 31.4 |
| 300 | 接近正态分布 | 320 | 98.0 | 9.9 |
不论总体服从什么样的分布,只要总体的均值和方差存在,随机抽样的样本量足够大时,样本均值均服从正态分布,其均值为总体均值,标准差为
理论意义:
解释了自然界、社会经济中大量随机变量服从正态分布的原因(多独立偶然因素叠加);
应用意义:
为大样本(
未知总体分布时,可通过大样本近似正态分布进行计算,降低应用难度。
