假设检验的本质:先提出对总体的假设,再通过样本数据判断“假设成立的可能性是否足够大”,若可能性过小则否定假设。
起源:
休谟问题(归纳问题):从个别经验事实或单称陈述推出全称命题不具有因果必然性。
波普尔证伪主义:全称命题(如“所有天鹅都是白的”)无法被证实,但可被单个反例证伪;假设检验即通过样本“证伪”原假设。
小概率思想:小概率事件(
大家有没有过这样的经历?
比如你每天早上 7 点去食堂,连续 10 天、20 天,都看到卖包子的阿姨在窗口,于是你心里默认:‘明天早上 7 点去,阿姨肯定还在’。
我们平时就是这么想的 ——看到一件事重复发生很多次,就觉得它以后一定会继续发生,甚至对所有类似情况都成立。
“所有天鹅都是白色的”。
归纳法无法保证结论的普遍必然性。
我说:‘我们班所有同学都喜欢喝奶茶’(这是一个‘全称命题’,说的是‘所有’情况)。
如果我想‘证明自己是对的’,需要做什么?得问遍全班所有同学,确认每个人都喜欢喝奶茶才行 —— 只要有 1 个人没问到,就不能 100% 确定‘所有同学都喜欢’。
你想反驳我,需要做什么?
波普尔说,科学理论的本质就是:没有任何一个科学理论能被‘永远证实’,所有科学理论都是‘我们暂时没找到反例的猜想’。

把“不大可能”当“不可能”
我们经常都会从新闻媒体上看到交通事故的报道,但绝不会因此放弃交通工具的使用
不(大)可能发生的事情,居然发生了!
据说某市社会治安很好,可某人刚踏进这个城市,就遇到了小偷!
水果摊老板说新鲜的皇帝柑,包甜!
一出门就看到小区门口发生交通事故!

注意:并非“小概率事件绝对不发生”,而是“发生的可能性过低,故怀疑原假设”,仍有犯错误的可能(见第三节“两类错误”)。

假设检验的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。
如果偏遇上小概率事件发生了应该如何面对?
根据小概率原理的要求,对某一假设而言,在检验真伪的过程中一旦出现小概率事件,那么,合理的想法是否定原有事件具有小概率的说法,即可以认为原假设是不成立的。

1毫米,不过是指甲盖厚度的五分之一,却让一艘载人飞船的返回计划按下紧急暂停键。2025年11月,神舟二十号舷窗上的这道微小裂纹,像一记警钟,敲响了中国航天在“毫米级安全红线”上的攻防战。当神舟二十二号带着处置装置呼啸升空,当“无人返回获取试验数据”的方案公布,当“神舟二十二号航天员乘组”在序列中永远空缺——这场看似“故障应对”的事件,实则是中国载人航天工程向“100分目标”发起的深度实践。这不是简单的“问题解决”,而是一场关于风险控制、技术进化与工程伦理的系统性突破:从“被动止损”到“主动进化”,从“单一故障排除”到“全链条能力升级”,从“追求成功”到“敬畏风险”,中国航天正用一次“有计划的暂停”,书写着航天事业的“容错进化论”。
空间碎片撞击飞船舷窗是概率极低的事件(工程团队称 “打中飞船已属低概率,打中舷窗更是极低概率”),但中国航天没有因 “概率小” 而心存侥幸,而是以 “只要不放心,就推迟返回” 的决策,践行 “航天员安全是不可逾越的红线” 的理念。
经过抽样获得一组数据(即样本),根据样本计算统计量。
如果在原假设成立的条件下,该统计量几乎不可能发生的,就拒绝或否定原假设;
如果在原假设成立的条件下,根据样本计算的统计量发生的可能性不是很小,则暂时接受。
性质:已有的、具有稳定性的经验看法,受保护,无充分证据不被否定。
来源:
核心特征:含“等号”(
性质:原假设的逻辑对立面,是研究者希望验证的新猜想(如“初婚年龄推迟”“新方法效果更好”)。
触发条件:当样本数据有充分证据否定
核心特征:不含“等号”(
以“检验总体均值
| 检验类型 | 原假设 |
备择假设 |
适用场景 |
|---|---|---|---|
| 双边检验 | 仅判断“是否有差异”,不关心方向 | ||
| 右单边检验 | 判断“是否大于原假设值”(如收入增长) | ||
| 左单边检验 | 判断“是否小于原假设值”(如成本下降) |
注意:
- 双边检验中,
可略写,仅需写 ; - 右单边检验的
也可写为 ,左单边检验可写为 ,本质与上述形式等效(因检验时仍以 计算分布)。
原假设和备择假设是一个完备事件组,而且相互对立;
在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立。
等号“=”总是放在原假设上;
因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)。
原假设
备择假设
原假设
备择假设
关键原则:等号永远在原假设
中,备择假设 反映研究目的(如“质疑声明”“验证增长”)。
题目:某农贸市场有100名摊贩,以往统计非本地居民占10%(10人)。现随机抽10名,发现全是非本地居民,判断原有统计是否成立。
步骤1:提出假设:
步骤2:计算
样本中10人全是非本地居民的概率:
步骤3:判断:
小概率事件发生,否定
假定是检验的“前置要求”,若不满足,检验结果无效,主要包括:
抽样假定:样本必须是随机抽样(核心假定),确保样本与总体同分布,具有代表性;
分布假定:部分检验要求总体服从特定分布(如t检验要求总体正态分布);
方差假定:部分检验要求总体方差相等(如两独立样本t检验的“方差齐性”);
独立性假定:样本观测值之间相互独立(如重复测量数据需考虑相关性)。
社会调查中,“随机抽样”是最易被忽视的假定——偶遇调查、滚雪球调查等非随机方式,无法满足统计推论的要求,其检验结果不可信。
定义:根据样本观测结果计算的、用于判断
核心要求:
统计量的分布已知(如正态分布、t分布),可查表获取临界值。
示例:
检验
若选
定义:
核心意义:
常用标准:
示例:
表示“ 成立时,误判其不成立的概率不超过5%”。
当统计量确定后,根据原假设
我们假设被确定的统计量满足正态分布,来研究如何确定临界值、接受域和拒绝域。
如果根据实际问题的需要,把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率就是显著性水平。
查附表 4:
概率公式:

显著性水平或显著度(α)就是检验统计量落入拒绝域的概率之和。
显著性水平越小,则临界值越大,
越难被拒绝。
临界值:区分“接受
接受域:统计量取值中,“不拒绝
拒绝域:统计量取值中,“拒绝

显著性水平或显著度(α)就是检验统计量落入拒绝域的概率之和。
显著性水平越小,则临界值越大,
越难被拒绝。
拒绝域分布在两侧,每侧拒绝域的概率均为
假设:
大样本统计量为:
相关公式:
临界值:
拒绝域:
接受域:

拒绝域选择在统计量分布的右侧。
假设:
另一种写法:
大样本统计量为:
相关公式:
临界值:
拒绝域:
接受域:

拒绝域选择在统计量分布的左侧。
假设:
另一种写法:
大样本统计量为:
相关公式:
临界值:
拒绝域:
接受域:

| 检验类型 | 假设形式 | 显著性水平 | 临界值 | 拒绝域 | 接受域 |
|---|---|---|---|---|---|
| 双边检验 | |||||
| 右单边检验 | |||||
| 左单边检验 |
关键:拒绝域的面积等于
——双边检验分拆为 在两侧,单边检验集中在一侧。

一般情况下,我们首先要明确检验的方向和显著性水平,再求出检验统计量的临界值,才能最终确定拒绝域。
标准正态分布下,不同置信水平对应的单、双边临界值:
| 置信水平 |
显著性水平 |
双边检验临界值 |
单边检验临界值 |
|---|---|---|---|
| 90% | 0.10 | (右1.28,左-1.28) | |
| 95% | 0.05 | (右1.65,左-1.65) | |
| 99% | 0.01 | (右2.33,左-2.33) |
判断检验类型:
确定样本大小(大/小样本)、检验方向(双边/单边);
提出假设:明确原假设
选择统计量与分布:根据
确定临界值与拒绝域:根据
计算样本统计量:代入样本数据计算统计量的实际取值(如
作出决策:




常用的总体信息及检验统计量的设定
| 样本容量 | 总体方差是否已知 | 总体服从的分布 | 需要用到的检验统计量 |
|---|---|---|---|
| 大 | 是 | 正态 | |
| 大 | 是 | 非正态 | |
| 大 | 否 | 正态 | |
| 大 | 否 | 非正态 | |
| 小 | 是 | 正态 | |
| 小 | 否 | 正态 |
题目:大样本情况下,检验
大样本下,由中心极限定理,选Z统计量:
可以写作几种假设检验形式,详见后页。







判断检验类型:大样本(
提出假设:
选择统计量:大样本,选Z统计量:
确定临界值:
计算统计量:
决策:
否定了未知真实状态,把真的当成了假的。即拒绝原假设时出现的错误。
概率:等于显著性水平
接受了未知的不真实状态,把假的当成了真的。即在接受原假设时出现的错误。
概率:记为

当
| 实际情况 \ 决策结果 | 接受 |
拒绝 |
|---|---|---|
| 正确决策(概率 |
弃真错误(概率 |
|
| 纳伪错误(概率 |
正确决策(概率 |
样本容量固定时,
减小
增大
同时降低
| 审判场景 \ 实际情况 | 被告无罪(对应 |
被告有罪(对应 |
|---|---|---|
| 判决无罪(对应接受 |
正确判决 | 错判无罪(纳伪错误, |
| 判决有罪(对应拒绝 |
错判有罪(弃真错误, |
正确判决 |
启示:假设检验中,
是“受保护的假设”——弃真错误的概率 可预先控制(通常较小),而纳伪错误的概率 难以直接控制。因此,“接受 ”更严谨的表述是“没有充分证据拒绝 ”,而非“证明 为真”。
