回归中的类别预测变量编码
主题
     
 

要在一般回归模型中包含类别预测变量,Minitab 会对这些类别进行编码以便它们可以包含在回归方程中。回归会自动执行此操作。您有两个编码选项:- 1、0、 1 编码或 0、1 编码。可以在编码子对话框中选择编码方案。不论您选择哪种编码方法,类别变量整体效果的检验都将保持不变。

当您具有类别预测变量时,回归系数将相对参考水平进行解释。有关详细信息,请参见设置回归中的参考水平

-1、0、1 编码

您也可以使用 -1、0、1 方案(也称为效应或处理编码)对类别预测变量进行编码。这种编码类型可根据与均值的差异给出效应的估计值。- 1、0、1 编码用于 一般线性模型试验设计 (DOE)

设计矩阵中,Minitab 将生成列并且当行属于列组时分配一个 1。没有为参考水平创建任何列。在下面的示例中,如果任意列中的行对应于纽约(参考水平),将分配一个 -1。

如果位置为...

香港将编码为...

伦敦将编码为...

香港

1

0

伦敦

0

1

纽约

-1

-1

1、0 编码

1、0 编码(也称为二进制编码或虚拟编码)通常用在回归分析中。这种编码类型将给出可以解释为不同于参考水平的水平的参数估计值。

例如,您希望在回归模型中包含类别预测变量位置。位置具有三种水平:香港、伦敦和纽约。如果您选择 1、0 编码,Minitab 将按照下列方式为这三种预测变量水平编码。

如果位置为...

伦敦将编码为...

纽约将编码为...

香港

0

0

伦敦

1

0

纽约

0

1

设计矩阵中并不包含参考水平“香港”的单独代码列。当某个观测值与此参考水平相等时,该观测值在所有虚拟变量列中都将编码为 0。

注释

计算 > 产生指示变量使用 1、0 编码。

提示

要了解 Minitab 如何在您的分析中为类别预测变量编码,请将设计矩阵存储在存储子对话框中。然后选择数据 > 显示数据并选择设计矩阵以便在会话窗口中查看该矩阵。