我的线性回归中有三个独立的数值变量 . 他们都有不同的规模 . 我的教授现在建议对其中一个使用z分数归一化(情绪量级,下面列表中的变量3)以使它们具有可比性 . 我不应该将所有这些标准化以使它们真正具有可比性吗?
变量是:
1)项目描述长度(字数) - 范围从10到1000字
2)描述的情绪分数 - 范围从-1到1(从负到正)
3)描述的情绪幅度 - 范围从0到无穷大
我预测的因变量是获得项目资金所需的天数 .
另外,我想知道如何解释归一化变量的线性回归中的系数?当使用其他模型(随机森林等非线性模型)时,这会有所不同吗?
任何帮助深表感谢!
1 回答
将所有预测变量设置为x并对y进行响应,并在LinearRegression对象中设置normalize = True,如下所示 .