日期:2024-11-13 15:22
的贡献。虽然因变量与自变量之间的相关性是我们所期望的,但自变量之间的相关性却是我们需要避免的。例如,我们不希望出现以下情况:
X₂ = ₀ + ₁X₁
这就是多重共线性的表现 自变量之间表现出类似因变量的线性关系,给模型的训练和推断带来了混淆和不确定性。
为何需要处理多重共线性?
让我们通过一个简单的例子来理解多重共线性的影响。考虑以下用于预测目标变量ŷ的方程:
ŷ = 10 + 2X₁ + 5X₂
假设X₁和X₂之间存在强相关性,我们可以将它们的关系表示为:
X₁ = X₂ + 1
那么,原始方程可以转化为以下两种形式:
ŷ = 12 + 0X