选择合适的异常值检验
主题
    
 

如果样本中包含多个可疑异常值,则 Grubbs 检验法和 Dixon 的 Q 比率法可能不会有效。其他 Dixon 检验可用来克服多个潜在异常值可能引起的屏蔽效应。

对于同一样本,不应多次使用 Minitab 的异常值检验。如果从样本中删除异常值后重新检验,可能存在删除实际并非异常值的风险。

下图中,每一行列出了不同的 Dixon 比率(左侧显示的值)对同一样本的处理方式。标有圆圈的值为潜在异常值。它是距离样本中位数最远的值。每行中的 X 表示计算检验统计量时,每个 Dixon 比率会忽略哪些数据值。(此图假定最小或最大数据值是异常值最小数据值是异常值并被选为备择假设。)对于这些数据,Dixon 的 r22 比率检验最有可能将标有圆圈的值确定为异常值。

 

Dixon 强调说,[11] 正态总体的样本数量越大,包含极值的可能性就越大。他提议不同的比率采用以下基本指导原则:

样本数量 (n)

推荐比率

3 <= n <= 7

r10(也称为 Dixon 的 Q 比率)

8 <= n <= 10

r11

11 <= n <= 13

r21

n >= 14

r22