数据变换

许多分析都需要正态性假设。如果数据为非正态,有时您可以应用函数以使数据近乎正态,以便可以完成分析。

例如,假设您需要针对比萨饼送货所需的时间执行能力分析。尽管存在最小时间(下限),但可能没有最大时间(上限),因此数据可能会向右侧偏斜。

比萨饼送货时间向右偏斜,而且未呈正态分布。

取倒数以使数据更服从正态分布。倒数是使用方程 Y = 1/X 来获得的。因此变换后的数据 = 1/送货时间。概率图显示变换后的数据更加符合正态分布。

根据数据,存在许多不同的函数(如平方根、对数、幂、倒数或反正弦),可以应用这些函数来变换数据。在您不确定要尝试哪种变换时,Minitab 可以提供帮助。

Minitab 提供了两种数据变换方法:

·    Box-Cox 变换 - Minitab 仅查找最优指数变换。(W = Y**Lambda,Minitab 将使用此公式查找 lambda 的最佳值)。尽管 lambda 的最佳估计值可能是 -5 到 5 之间的任何数字,但在任何实际情况下,您都需要一个与容易理解的变换对应的 lambda 值,如平方根(lambda 为 0.5)或自然对数(lambda 为 0)。

Box-Cox 变换很容易理解,但是作用非常有限,而且通常找不到适合的变换。而且,此变换仅适用于正数据。

·    Johnson 变换 - Johnson 变换与 Box-Cox 变换使用的算法不同。Johnson 变换函数是从 Johnson 系统中的三个系列的函数中选择的。由于函数通过更改参数可涵盖大量分布,因此 Minitab 通常会找到可接受的变换。Minitab 选择的系列称为“最佳变换类型”。

如果 Box-Cox 算法找不到合适的变换,请尝试 Johnson 变换(或假设数据服从非正态分布,并且使用其他分布,而不变换数据)。Johnson 变换函数较为复杂,但对于查找合适的变换而言功能非常强大。

注意

Box-Cox 变换利用数据位于子组中(当子组 > 1 时)这样一个事实;但 Johnson 变换不利用这个事实。这就是“子组内”分析只能使用 Box-Cox 变换的原因所在。