均值的多重比较
主题
    
 

通过均值的多重比较可以检查哪些均值不同,并估计它们的差异有多大。在拟合线性模型后,如果您使用统计 > 方差分析表 > 一般线性模型 > 比较,则可以获得均值的多重比较。

在使用多重比较时,必须进行以下选择: 

·    配对比较或与对照组进行比较

·    要比较的均值

·    比较方法

·    如何显示结果

配对比较或与对照组进行比较

在您没有对照水平,并且想要比较所有均值组合时,请选择配对

选择对照组以将水平均值与对照组均值进行比较。此方法合适后,使用配对比较会缺乏效率,因为配对置信区间更宽,并且假设检验对于给定置信水平而言功效更低。

要比较的均值

使用多重比较时,选择要比较的均值是很重要的考虑事项;如果选择不合适,会导致置信水平偏离您的预期。您可能需要考虑以下问题:

·    是应该只对具有显著 F 检验的项比较均值还是应该对差异看似很大的均值集比较均值?

·    比较均值应达到设计中的多深程度:仅限于每个因子内,或第一级交互作用项的每个组合内,还是要跨更高级别交互作用项的多个组合?

最好是在收集数据之前先确定要比较的均值。如果只比较差异看似很大的均值(这称为数据探测法),则会增大看似不存在任何差异但结果却表明确实存在差异的可能性 [15][28]。同样,如果将应用多重比较的条件确定为获得显著 F 检验,则多重比较的误差率会比无条件应用多重比较的误差率更高 [15][23]

但在实际应用中,许多人通常还是将 F 检验作为选择要比较的均值的依据。方差分析 F 检验和多重比较并不是完全独立的评估。例如,如果 F 检验的 p 值为 0.9,则通过多重比较可能无法发现均值之间在统计上有显著的差异。

应将均值比较进行到设计内的多深程度?这需要进行权衡:如果在所有两因子组合水平上比较均值,并且高阶表现得更显著,则比较的均值可能是各种效应混合的结果;如果在太深的水平比较均值,则会由于样本数量太小且比较次数太多而使比较变得无效。实际上,您可能会决定在您认为有意义的交互作用项的因子水平组合上比较均值。

Minitab 会将可以比较均值的项限定于固定项或固定项之间的交互作用项。嵌套被视为是一种交互作用。

如果有两个因子分别为 A 和 B,并指定 A B,则 Minitab 将在每个因子内进行多重比较。如果您指定交互作用 (A * B),Minitab 将显示因子 A 和 B 的所有水平组合的多重比较。

多重比较方法

根据以下条件选择比较过程:您要比较的组均值、您要指定的置信水平类型和您要让结果的保守程度。此上下文中的“保守”指示真正的置信水平可能大于显示的置信水平。

除了 Fisher 方法,多重比较方法也内置了防误报功能。通过多重比较的防误报功能,置信区间的宽度比没有设置保护时的置信区间更宽。

现将各种多重比较方法的一些特性总结如下:

比较方法

属性

您指定的置信水平

Tukey

所有配对比较,不保守

同时

Fisher

由于多重比较,没有防误判功能

单个

Dunnett

与对照组进行比较,不保守

同时

Bonferroni

最保守的方法

同时

Sidak

保守,但保守性略低于 Bonferroni

同时

如何显示结果

Minitab 以分组信息表、置信区间假设检验形式显示多重比较的结果。

分组信息表包含用于分组因子水平的字母列。共享一个字母的水平不存在显著差异。相反,如果它们不共享一个字母,均值则存在显著差异。

查看置信区间时,除了评估统计上的显著性之外,还可以评估均值之间差异的实际显著性。通常,在置信区间不包含零时,您会否定均值之间无差异的原假设。

除了 Fisher 方法,Minitab 会计算假设检验统计量的调整 p 值。在假设集合内对某特定假设的调整 p 值是否定此特定假设所在的最小全族 a- 水平。