使用交叉验证
主题
    
 

交叉验证计算潜在模型的预测能力,以帮助您确定要保留在模型中的适当的分量数。如果不知道最优的分量数,建议使用交叉验证。当数据包含多个响应变量时,Minitab 同时验证所有响应的分量。有关详细信息,请参见 [18]

下面列出的是交叉验证的方法:

·    逐一剔除法:计算潜在模型时一次剔除一个观测值。对于大型数据集,此方法可能很费时,因为重新计算模型的次数相当于观测值的数量。

·    成组剔除个数:计算模型时每次剔除多个观测值,从而减少必须重新计算模型的次数。此方法最适用于大型数据集。

·    剔除值所在的列:计算模型时,同时剔除在组标识符列(在工作表中创建)中具有匹配数字的观测值。此方法使您可以指定同时忽略哪些观测值。例如,如果组标识符列包括数字 1、2 和 3,则同时忽略所有含 1 的观测值,并重新计算模型。接下来,忽略所有含 2 的观测值,并重新计算模型,以此类推。在本例中,模型一共重新计算 3 次。组标识符列必须与响应和预测变量列等长,且不能包含缺失值。