概率图通过根据其估计累积概率标绘每个观测值(包括重复的值),从样本创建估计的累积分布函数 (cdf)。
估计累积概率根据在工具 > 选项 > 单独图表 > 概率图中所选的内容(默认值为中位数秩)按以下公式之一进行计算。对于每个公式,使 n 等于观测值数,使 i 等于每个观测值的等级顺序,这样 i = 1 表示最小值,而 i = n 表示最大值。
方法 |
公式 | ||
中位数等级 (Benard) |
| ||
均值等级 (Herd-Johnson) |
| ||
修正后 Kaplan-Meier (Hazen) |
| ||
Kaplan-Meier |
|
拟合分布线表示具有所指参数(无论估计的或历史的)的所选理论分布的 cdf。如果未提供历史参数,则 Minitab 将使用最小二乘估计(正态分布或对数正态分布)或极大似然估计(其他分布)来估计参数。
Y 值(在某些情况下是 X 值)将变换,以使拟合线为线性。但是,刻度标签始终与未变换值保持一致。因此,所选分布与数据达到完全拟合的程度,以致,标绘点形成一条直线。
下表显示了对每种分布使用的变换。
分布 |
X 坐标 |
Y 坐标(分值) |
正态 |
数据 |
(p) |
对数正态 |
ln(数据) |
(p) |
3 参数对数正态 |
ln(数据 - 阈值) |
(p) |
Gamma |
ln(数据) |
G-1(p), k |
3 参数 Gamma |
ln(数据 - 阈值) |
G-1(p), k |
指数 |
ln(数据) |
ln(-ln(1 - p)) |
2 参数指数 |
ln(数据 - 阈值) |
ln(-ln(1 - p)) |
最小极值 |
数据 |
ln(-ln(1 - p)) |
Weibull |
ln(数据) |
ln(-ln(1 - p)) |
3 参数 Weibull |
ln(数据 - 阈值) |
ln(-ln(1 - p)) |
最大极值 |
数据 |
-ln(-ln(p)) |
Logistic |
数据 |
ln(p / (1 - p)) |
对数 Logistic |
ln(数据) |
ln(p / (1 - p)) |
3 参数对数 Logistic |
ln(数据 - 阈值) |
ln(p / (1 - p)) |
其中: |
|
|
数据 |
= |
观测的数据值 |
In(x) |
= |
x 的自然对数 |
(p) |
= |
标准正态分布的逆 cdf 为 p 返回的值。 |
G-1(p), k |
= |
Gamma 分布(形状 = k 且尺度 = 1)的逆 cdf 为 p 返回的值。除非输入历史值,否则 Minitab 不会使用估计的形状参数。 |
更多 |
如果标绘未针对阈值调整的数据,则分布拟合不是由直线表明。 |