核心概念:
频率的性质:
概率的频率定义:
当试验次数
频率与概率的区别:
| 维度 | 频率 | 概率 |
|---|---|---|
| 性质 | 实验值,具有随机性 | 理论值,唯一且精确 |
| 用途 | 近似反映事件发生可能性(样本数据常用) | 精确反映事件发生可能性(总体规律) |
| 特殊场景 | 普查中现象出现的频率 = 概率 | - |
古典法概率计算公式:
随机事件A的概率等于A中包含的样本点个数(m)与样本点总数(n)的比值,即:
示例:
掷一枚均匀骰子,求“出现偶数点”(事件A)的概率:
1. 事件的包含与相等:
包含:若事件A发生必然导致事件B发生,则称B包含A,记作
相等:若
2. 事件和(并集):
3. 事件积(交集):
4. 互不相容事件(互斥事件):
5. 对立事件(逆事件):
6. 相互独立事件:
| 维度 | 互不相容事件(A∩B=Ø) | 对立事件(A∩B=Ø且A∪B=S) |
|---|---|---|
| 核心条件 | 仅“不同时发生” | “不同时发生”+“必有一个发生” |
| 包含关系 | 对立事件一定是互不相容事件 互不相容事件未必是对立事件 |
- |
| 示例 | A=“点数2”,B=“点数3” (互不相容,但非对立,因还可能出现1、4、5、6) |
A=“偶数点”, (既互不相容又对立) |
| 概率关系 |
集合视角理解:
核心区别:
| 维度 | 互不相容事件 | 相互独立事件 |
|---|---|---|
| 定义本质 | 事件发生的“结果排斥”(不能同时发生) | 事件发生的“概率无关”(一个发生不影响另一个的概率) |
| 前提假设 | 以“不能同时发生”为核心 | 以“可以同时发生”为前提(除非包含不可能事件) |
| 概率关系 | 若A、B互不相容,则 |
若A、B相互独立,则 |
| 示例 | A=“点数2”,B=“点数3” (不能同时发生,故不独立) |
A=“第一次掷出2”,B=“第二次掷出3” (可同时发生,且概率无关) |
重要结论:
一般情况下,两个事件不可能既互不相容又相互独立(除非其中一个是不可能事件)。因为相互独立要求事件可同时发生(

2. 一般式(任意事件适用):
若事件A与B不互不相容(可能同时发生),则需扣除“同时发生”的重复计算部分,公式为:
推论1(3个任意事件):
推论2(n个任意事件):
示例:
掷骰子,A=“偶数点”(


2. 一般式(任意事件适用,含条件概率):
若事件A与B不独立,需引入条件概率(某事件发生前提下另一事件的概率),公式为:
条件概率定义:
推论1(3个事件):
推论2(n个事件):
示例: 袋中有2红1白共3球,不放回摸球,A=“第一次摸红球”(
生活中,我们会发现一些事件的发生会往往伴随另一件事件的更高或更低概率的发生,这种情况叫做事件的“相关性”
适用场景:当事件B的发生受多个互斥“原因”(
前提条件(完备事件组):
事件
全概公式:
对任意事件B,其概率为各“原因”概率与对应条件概率的乘积之和:

推导逻辑:
示例场景:
某病患病率

适用场景:已知事件B已发生(结果),反推其由某个“原因”
前提条件:同全概公式,
贝叶斯公式:

核心概念辨析:
| 类型 | 定义 | 示例(疾病检测) |
|---|---|---|
| 先验概率 | 事件发生前已知的“原因”概率 |
患病概率 (人群固有患病率) |
| 后验概率 | 事件B发生后,更新的“原因”概率 |
检测阳性后患病的概率 (更新后的风险) |
示例(延续全概公式场景):
已知
(即检测阳性者中,实际患病概率仅约8.7%,需结合其他指标进一步判断)。
——谁是“假阴性”新冠肺炎患者
南方周末曾发了一篇文章,题目是《谁是“假阴性”新冠肺炎病人》,指出了一个问题,就是病人实际上被新冠病毒感染了,但是核酸检测结果为阴性。实际被感染,但是检测不到病毒,这就叫“假阴性”。
文章讨论了一些可能导致假阴性的原因,如样本采集方式、取样技术、实验操作规范、试剂盒灵敏度等。我们从贝叶斯概率的视角来分析一下 “假阴性”的影响。
医生诊断的逻辑,与人体发病,恰好是相反的。人体发病,是先有病因,再有各种症状。而医生只能根据检测结果,来推测可能的病因。这种由果推因的思想,就是贝叶斯统计。
定义:概率分布是对随机现象所有可能结果(随机变量取值)及其对应概率的完整描述,回答“随机现象有多少种结果”及“每种结果的概率是多少”。
核心要素:
设随机变量为
其中
与频率分布的区别:
| 类型 | 性质 | 来源 | 唯一性 |
|---|---|---|---|
| 频率分布 | 经验分布(样本数据) | 实际观测与整理(如抽样调查) | 不唯一(不同样本频率可能不同) |
| 概率分布 | 理论分布(总体规律) | 基于概率理论推导(如古典概型) | 唯一(总体规律固定) |
离散型随机变量定义:可能取值为有限个或可数个离散值的随机变量(如“掷骰子的点数”“抽取的白球个数”)。
概率分布表示:列举离散型随机变量的全部可能取值及对应概率,形式为:
概率分布的两个核心性质:
非负性:每个取值的概率非负,即
规范性:所有取值的概率之和为1,即
| 1 | 2 | 3 | 4 | 5 | 6 | |
|---|---|---|---|---|---|---|
| 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
满足性质:
| 1(正面) | 0(负面) | |
|---|---|---|
| 1/2 | 1/2 |
满足性质:
| 0 | 1 | 2 | 3 | |
|---|---|---|---|---|
| 5/8(35/56) | 15/56 | 5/56 | 1/56 |
验证:
连续型随机变量定义:可能取值为连续充满某个区间的随机变量(如“人的身高”“时间长度”),可取区间内任意实数值。
关键特点:
单个点的概率为0,即
因此,讨论某一点取值的概率将是没有意义的,需研究“区间内的概率”(如
我们取
当
但如果我们研究概率和区间的比值,由于分子、分母同时趋向于零,则其比例一般不为零
定义“概率与区间长度的比值极限”为概率密度,公式为:
几何意义:概率密度曲线
100个同龄儿童身高频率分布(组距0.03米):
| 身高分组(米) | 频次 | 频率 |
|---|---|---|
| 1.265-1.295 | 1 | 0.01 |
| 1.295-1.325 | 4 | 0.04 |
| 1.325-1.355 | 7 | 0.07 |
| 1.355-1.385 | 22 | 0.22 |
| 1.385-1.415 | 24 | 0.24 |
| 1.415-1.445 | 24 | 0.24 |
| 1.445-1.475 | 10 | 0.10 |
| 1.475-1.505 | 6 | 0.06 |
| 1.505-1.535 | 1 | 0.01 |
| 1.535-1.565 | 1 | 0.01 |


频率密度直方图的特点:
概率密度曲线的形成:
当组距趋近于0(


概率密度函数的性质:
非负性:
规范性:
区间概率的计算:
随机变量


定义:为统一描述离散型与连续型随机变量的概率,引入分布函数
几何意义:离散型变量中,
分布函数的核心作用:
| 1=未上过学 | 0.1 | 0.1 |
| 2=小学 | 0.2 | 0.3 |
| 3=初中 | 0.4 | 0.7 |
| 4=高中 | 0.2 | 0.9 |
| 5=大学及以上 | 0.1 | 1 |
则
分布函数与概率函数/密度函数的关系:
| 变量类型 | 与分布函数的关系 | 公式 |
|---|---|---|
| 离散型 | 分布函数是概率函数的累计和 | |
| 连续型 | 分布函数是概率密度函数的积分 |
和 (离散变量)或 (连续变量)的关系就像向上累计频率和频率的关系一样。不同之处在于 累计的是概率。
使用分布函数的好处是很明显的,它不仅在数学上统一了对离散型随机变量和连续型随机变量概率的研究,而且由于它计算概率的起点都固定为
,因而可以把概率值换算成表,以易于求得任何区间的概率,从而达到计算快捷和应用广泛之目的。 一
在前面单变量统计描述的讨论中,我们得到频数(或频率)分布后,为了对变量有系统概括的认识,分别研究了集中趋势和离散趋势。
而对集中趋势和离散趋势量度,我们分别得到了集中值和离散值,其中最有代表性的是均值和标准差。很显然,现在当我们面对随机变量的理论分布时,也要对随机变量的集中趋势和离中趋势作概括性的描述,这就引出数学期望和方差(标准差)这两个概念。
核心意义:数学期望(记为
1. 离散型随机变量的数学期望:
设离散型变量
数学期望
示例:掷骰子的点数X,
2. 连续型随机变量的数学期望:
设连续型变量
示例:均匀分布
关键说明:
数学期望是“期望出现的均值”,并非实际观测值,但出现该均值的可能性最大;它是总体均值的理论值,区别于样本均值(经验值)。
性质1:常数的数学期望等于该常数:
若C为常数,则
示例:
性质2:随机变量与常数之和的期望:
示例:若
性质3:常数与随机变量乘积的期望:
示例:若
性质4:线性组合的期望(性质2+3):
示例:若
性质5:两个随机变量之和的期望:
示例:
性质6:两个独立随机变量乘积的期望:
若
示例:X(掷骰子)与Y(掷硬币,1=正,0=反)独立,
核心意义:方差(记为
定义:
方差是“随机变量与期望差的平方的期望”,即:
标准差是方差的平方根(与原变量单位一致):
重要计算公式(简化计算):
利用期望性质推导得:
(避免直接计算偏差平方,简化运算)。
1. 离散型随机变量的方差计算:
设
示例:掷骰子X,
2. 连续型随机变量的方差计算:
设概率密度为
示例:均匀分布
方差和标准差都反映了随机变量的可能值密集在数学期望周围的程度。方差值越小,密集的程度越高,反之则密集程度越低。
方差的几何意义(正态分布示例):
正态分布的概率密度曲线呈“钟形”,方差
常数的方差为0:
随机变量与常数之和的方差:
示例:
常数与随机变量乘积的方差:
示例:
两个独立随机变量之和(差)的方差:若
示例:X与Y独立,
若 X与Y不独立,
题目:设随机变量
| 1 | 2 | 3 | 4 | |
|---|---|---|---|---|
| 0.1 | 0.4 | 0.3 | 0.2 |
步骤1:计算
根据离散型期望公式:
步骤2:计算
步骤3:验证等式
步骤1:确定
步骤2:计算各取值的概率(不放回抽样):
步骤3:整理概率分布表: 最后可以验证规范性。
| 0 | 1 | 2 | 3 | |
|---|---|---|---|---|
| 9/12(165/220) | 27/132(45/220) | 9/220 | 1/220 |
背景:小李收到甲、乙、丙三家公司面试邀请,面试顺序为甲→乙→丙,每家公司的面试结果的通知时间,都在下一家公司面试时间之前。假设经过职业水平测验后,小李发现自己每一次面试中,拿到高级别工资的概率是0.2,拿到中级别工资的概率是0.3,拿到低级别工资的概率则是0.4,还有0.1的概率不能通过公司面试。在求职过程中,小李只能接受一家公司提供的职位,并且,小李的这种决定只能作一次;也就是说,一旦小李在一家公司面试结果出来后,接受了这家公司提供的职位,那么小李这段时间内就不能毁约并且寻求其他公司的职位了。
小李应该如何安排面试并进行怎样的选择呢?
甲、乙、丙三家公司提供的工资等级表 单位:元:
| 公司 | 高级别工资(元) | 中级别工资(元) | 低级别工资(元) | 不通过概率 |
|---|---|---|---|---|
| 甲 | 7000( |
6000( |
4400( |
|
| 乙 | 7800( |
5900( |
5000( |
|
| 丙 | 8000( |
6000( |
5000( |
(括号内为对应概率,工资概率+不通过概率=1)。