交叉验证
主题
 

交叉验证是一种用于补偿乐观明显误差率的方法。明显误差率是指误分类观测值的百分比。由于分类数据与用于构建分类函数的数据相同,因此该数字往往比较乐观。

交叉验证例程的工作原理是:一次忽略一个观测值,接着使用剩余数据重新计算分类函数,然后分类被忽略的观测值。计算时间要比此过程长四倍左右。执行完交叉验证后,Minitab 会显示另一个摘要表。

另一种可用于计算更加理想的误差率的方法是将数据分割为两部分。使用一个部分创建判别函数,使用另一个部分作为验证集。预测验证集的组成员,然后将误差率计算为误分类数据的百分比。