假设检验的概念及作用 假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。是由英国统计学家卡尔.皮尔逊提出的。 假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。 假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法,也是是统计学中非常重要的种统计方法。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。因此假设检验是进行数据分析必须的“必杀技”。
假设检验的相关术语 了解假设检验你不可不知的相关术语: 1. 零假设 (H0) -不存在变化或差异的命题。如没有充分的证据拒绝它,就假设这一命题是真的。 2. 备择假设(Ha) - 存在变化或差异的命题。如果拒绝H0,则认为这一命题是真 的。 3. 一类错误 -当H0实际上为真时而被拒绝所产生的错误,或是接受存在差异、 但事实上却没有差异时所犯的错误。 4. α风险 - 出现第一类错误的最大风险或机率。这个机率总是大于零,通常为 5%。研究人员决定拒绝H0 所可以接受的最大风险。 5. 显著水平-同α风险。 6. 二类错误 - 当H0实际上为伪而没有被拒绝所产生的错误,或是接受没有差异 、但事实上存在差异时所犯的错误。 7. β风险 - 二类错误出现的风险或机率,或者是说,忽略了问题的有效处理或 解决方案。 8. 显著性差异 - 用于描述统计假设检验结果的术语,即:差异大得不能合理地 归因于偶然因素。 9. 功效-统计检验能力(Minitab路径:统计---幂样本量),以检查出差异,或正确地拒绝H0 的机率。通常用来确定样本大小是否足以检查出数据之间的差异。 10. 检验统计值--标准化数值(z、t、F、X2等),代表H0的可行性,它以已知的方式分布,因此可以确定这种观察值出现的机率。通常 H0 的可行性越高,则检 验统计值的绝对值就越小,在这种分布范围内观察到这个值的机率也就越大。 11.P值-P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小。而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。
假设检验的一般步骤 假设检验有助于确定差异是确实存在,还是偶然发生。在实际的应用中,假设检验可以参考以下步骤进行:
1. 定义问题/陈述检验的目的。 2. 建立假设 -- H0和 Ha。 – 陈述原假设(H0):总体的参数相同;H0也叫零假设。 – 陈述备择假设(Ha ):总体的参数不同 。 3. 确定适当的统计检验 (假设的概率分布:Z、t、F、或X2等)。 4. 陈述可接受的α风险和β风险水平: •α风险:通常为 5% ; •β风险:通常为 10-20%。 5. 使用检验灵敏度(δ/σ)确定样本大小 。 6. 制定抽样计划和收集样本。 7. 根据数据计算检验统计值(如Z、t、F或X2等) 。 8. 确定所计算的检验统计值由于偶然因素引发的概率(p值): • 如果概率(p) < α,则拒绝H0并接受 Ha ; • 如果(p) ≥ α,则不能拒绝H0(概率无法得出结论) 。 9. 通过手工或电脑计算或MINITAB输出结果进行解析,将统计结论转换为实际解决方案
|