病态数据
主题
 

病态数据与预测变量中的问题相关,它们会给统计和计算造成困难。存在两种类型的问题:多重共线性以及小变异系数。对于在 Minitab 中进行病态数据检查的研究,Velleman 等人做出了很大贡献。 [39], [40].

多重共线性

多重共线性意味着某些预测变量与其他预测变量相关。如果这种相关性很高,Minitab 将显示一条警告信息并继续进行计算。预测值和残差的计算在统计上和数字上仍然具有很高的准确度,但系数的标准误将很大,这会影响它们的数字准确度。如果某个预测变量与其他预测变量的相关性非常高,Minitab 将从模型中去掉该预测变量并显示一条消息。

要识别具有高共线性的预测变量,可以检查预测变量的相关性结构并将每个可疑的预测变量回归到其他预测变量上。您也可以查看方差膨胀因子 (VIF),当您的预测变量相关时,它们用于度量估计回归系数的方差增加的幅度。如果 VIF < 1,就不存在多重共线性;如果 VIF > 1,预测变量可能就是相关的。Montgomery 和 Peck 认为,如果 VIF 介于 5 - 10 之间,表示回归系数估计得不准确。

多重共线性问题的可能解决方案包括:

·    从模型中去除预测变量,尤其是删除它们对 R2 几乎没有影响时。

·    通过使用偏最小二乘回归主成份分析对预测变量进行线性组合来更改这些预测变量。

·    如果您要拟合多项式,请在执行平方运算前减去一个接近预测变量均值的值。

小变异系数

具有小变异系数并接近常量的预测变量会造成一些数字上的问题。例如,包含从 1970 到 1975 多个值的变量 YEAR 具有一个小变异系数,这些变量之间的数字差体现在第四个数位上。如果将 YEAR 平方,这个问题就会复杂化。您可以从数据中减去一个常量,用 YEARS SINCE 1970 替换 YEAR,前者的值为 0 至 5。

如果变异系数小的程度适中,将会部分丧失统计上的准确性。在此情况下,Minitab 会告诉您该预测变量接近常量。如果变异系数非常小,Minitab 将从模型中去掉该预测变量,并显示一条消息。

更多

如果数据呈现极度病态,Minitab 会从模型中删除一个有问题的列。您可以结合使用 TOLERANCE 子命令和 REGRESS 强行让 Minitab 将该列保留在模型中。降低公差会很危险,可能会产生不准确的数字结果。有关详细信息,请参见会话命令帮助。

闂佸憡绻€濞村洤顔忓┑鍫笉闁挎稑瀚崐锟� 闂佺ǹ娴氶崣鈧柕鍫濇健瀵粙鎳栭埡浣哥船 闁荤姳绶ょ换婵嬪闯濞差亜妞介悘鐐垫櫕閺夎棄螖閻欏懏瀚� ISO9001缂備焦绋戦ˇ顔剧礊鐎n剙瀵查柨鐕傛嫹 IATF16949,VDA
Minitab闁汇埄鍨奸崰鏍ㄦ叏閿燂拷 Minitab闂佹悶鍎查崕鎶芥嚋閿燂拷 Minitab DOE Minitab闂佺硶鏅炲▍锝夈€侀崨顖滅<闁绘梹妞块崥鈧� SPC,MSA,CPK缂備焦鍐婚幏锟�
闂佸憡顨呯花鑲╂嫻閻旂厧绀冮柛娑欐綑閸斻儵鎮硅鐎氼參寮搁敓锟� 闁诲孩鍐荤紓姘卞姬閸曨垰鏄ョ痪顓炴媼閸烇拷(濠殿喚鎳撳ú锕傚焵椤掑﹥瀚�)
濠殿噯绲鹃弻褏鑺辩憴鍕氦闁跨噦鎷�,闂佺粯顨夐~澶愬蓟婢舵劕绠柨鐕傛嫹,闂佸憡顨嗛惌顔剧箔閿燂拷,婵炴垶鎸绘竟鍡涘极閿燂拷,婵犮垹鐖㈤崒婊嗗煘缂備焦绋戦ˇ宕囩矈椤愶箑妫橀柨鐕傛嫹
闂佸憡鐟崹璺横缚椤掑嫬绠戠憸宥嗗閹邦喚鐭欓柨鐕傛嫹, 濠电偞娼欓鍫ユ儊椤栫偛妫橀悷娆忓閵嗗﹪鏌涘▎蹇ユ敾闁绘牭缍佸畷娆撴晸閿燂拷
8D闂佺缈伴崕閬嶅箟閳ユ剚娴栭柛顐g矌娴兼劙鏌曢崱鏇熺グ鐎瑰憡绻堥弻宀冪疀閺傝法浜i梺鍝勭墳閹凤拷
闂佺ǹ娴氶崣鈧柕鍫濇健瀵粙鎳栭埡浣哥船闂侀潧妫旂粭宀禨S, 闂佽桨鑳舵晶妤€鐣垫笟鈧畷姘跺幢濡皷鍋撻敓锟�
APQP, PPAP, FMEA, MSA, SPC
ISO9001, ISO14001, ISO45001缂備焦绋戦ˇ顔剧礊鐎n剙瀵查柡鍕禋閸氬洭鎮归崶閿嬪
闂佽鍓濋褔鐛幘鑸靛皫閻忕偠濮ょ花姘槈閹捐銆冪紒顔肩墛缁嬪﹪宕煎⿰鍛崶闁哄鐗婇幐濠氬磿閹绢喗鏅柣鏂挎啞濞堝爼鏌熺拠鈥虫灈闁搞劌閰e鎼佸箛椤掍礁鏆堥柣鐘叉搐椤︻喚绱為敓锟�