统计 > 回归 > 回归 > 最佳子集
最佳子集回归用于确认从您指定的所有预测变量集合中生成最高 R值的子集模型。最佳子集回归是用尽可能少的预测变量确认实现目标的模型的有效方式。实际上,子集模型可以估计回归系数,并且可预测未来响应得到的方差比使用所有预测变量的完整模型的方差更小 [22]。
Minitab 检验所有可能的预测变量子集,从所有包含一个预测变量的模型开始,然后是包含两个预测变量的模型,依此类推。默认情况下,Minitab 对每种数量的预测变量显示两个最佳模型。
例如,假设您执行了含三个预测变量的最佳子集回归。Minitab 将报告最佳和次佳单预测变量模型,接着是最佳和次佳双预测变量模型,再接着是包含所有三个预测变量的完整模型。
响应:输入包含响应 (Y) 变量的列。
自由预测变量:输入包含候选预测变量 (X) 的列。可以指定多达 31 个变量,但模型越大,需要的计算时间就越长。
所有模型中的预测变量:选择包含要作为预测变量包括在每个模型中的变量的列。在此输入的列一定不能出现在自由预测变量列表中。如果您正在分析含 15 个预测变量以上的大型数据集,则请考虑在此包括某些预测变量,以便减少自由变量的数量,从而加快计算。可以输入的最大变量数为 100 减在“自由预测变量”中输入的变量数。