本帖最后由 tti_owen 于 2025-10-15 08:02 编辑
什么是非参数方法
非参数检验是不要求总体的分布以特定参数为特征的假设检验。例如,许多假设检验都依赖于总体服从参数为 μ 和 σ 的正态分布的假定。非参数检验没有这一假设,因此当您的数据显著呈非正态分布并且不能进行变换时,这类检验就非常有用。
在参数统计量中,我们假定样本是从完全指定的分布提取的,这些分布以一个或多个要根据其做出推断的未知参数为特征。在非参数方法中,我们假定未指定样本的父分布,而且通常会对分布的中心做出推断。例如,参数统计量中的许多检验(如单样本 t 检验)是在数据来自具有未知均值的正态总体的假设下推导的。在非参数研究中,去除了正态假设。
当正态假设不成立且样本数量很小时,非参数方法非常有用。但是,非参数检验并不是完全不对数据做任何假定。例如,假定样本中的观测值是独立的且来自同一个分布至关重要。同时,在双样本设计中,需要假定分布形状和散步相同。
例如,薪金数据呈极度右偏斜,众多的人拿有限的薪金,而只有极少数人享受高薪待遇。您可以对这些数据进行非参数检验以回答以下问题:
- 公司薪金中位数是否等于某个特定值?使用单样本符号检验。
- 某银行城市支行的薪金中位数是否大于该银行农村支行的薪金中位数?使用 Mann-Whitney 或 Kruskal-Wallis 检验。
- 农村、城市和郊区的银行支行之间的薪金中位数是否不一样?使用 Mood 中位数检验。
- 在城市和农村支行中,受教育程度对薪金有何影响?使用 Friedman 检验。
非参数检验的限制
非参数检验具有以下限制:
- 当正态假设成立时,非参数检验通常不如相应的参数检验强大。因此,如果数据来自正态分布,则否定原本不成立的原假设的可能性不大。
- 非参数检验往往要求您修改假设。例如,大多数有关总体中心的非参数检验都是关于中位数的检验,而不是关于均值的检验。如果总体不对称,该检验不能回答相应的参数过程可以回答的相同问题。
备择参数检验 如果可以在使用参数过程或非参数过程之间选择,并且您相对确定满足参数过程的假设,则可以使用参数过程。如果样本数量足够大,则当总体不是正态分布时,也可以使用参数过程。 下面是非参数检验及其参数选择方案的列表。 [td] | 分析目标 | | | | | | 1. 单样本 Wilcoxon 检验
检验中位数是否等于目标值。(数据应当来自对称分布)
2. 单样本符号检验
同样检验中位数,但效能通常更低。(数据不来自对称分布) | 统计 > 非参数检验 > 单样本 Wilcoxon
统计 > 非参数检验 > 单样本符号 | | | Mann-Whitney 检验
检验两个独立组的中位数或分布形状是否相同。 | 统计 > 非参数检验 > Mann-Whitney | | 配对 t 检验
检验成对观测值之差的均值是否为零。 | Wilcoxon 符号秩检验
检验成对观测值之差的中位数是否为零。 | | | 单因子 ANOVA
检验多个独立组的均值是否全部相等。 | Kruskal-Wallis 检验
检验多个独立组的中位数或分布是否全部相同。 | 统计 > 非参数检验 > Kruskal-Wallis | | | Friedman 检验
在考虑区组影响后,检验处理间的差异。 | |
实战建议:在 Minitab 中如何操作?
- 先检查前提假设:
- 进行正态性检验:统计 > 基本统计量 > 正态性检验。如果 p 值 < 0.05,通常认为数据非正态。
- 检查方差齐性:在运行 ANOVA 或双样本 t 检验时,Minitab 会附带提供等方差检验结果。
- 根据检查结果做决策:
- 如果数据满足正态性和方差齐性 -> 毫不犹豫地使用对应的参数检验。结论更有力。
- 如果数据严重偏离正态分布,或存在异常值,或样本量非常小 -> 转向对应的非参数检验。你的结论将更可靠。
一个简单的例子:
你想比较两种不同教学方法下学生的考试成绩。
- 参数检验路径:收集成绩(连续数据) -> 检查每组成绩是否正态分布 -> 检查方差是否相等 -> 如果都通过,使用 双样本 t 检验 比较平均分。
- 非参数检验路径:如果成绩分布明显偏态,或者有极端离群值 -> 使用 Mann-Whitney 检验 比较成绩分布的中位数位置。
总之,参数检验是“主力”,非参数检验是“保险”。了解两者的对应关系,能确保你在任何数据情况下都能做出正确的统计分析。
|