线性回归中的归一化 - 所有与仅1变量相对应-Java 学习之路

我的线性回归中有三个独立的数值变量 . 他们都有不同的规模 . 我的教授现在建议对其中一个使用z分数归一化（情绪量级，下面列表中的变量3）以使它们具有可比性 . 我不应该将所有这些标准化以使它们真正具有可比性吗？

变量是：
1）项目描述长度（字数） - 范围从10到1000字
2）描述的情绪分数 - 范围从-1到1（从负到正）
3）描述的情绪幅度 - 范围从0到无穷大

我预测的因变量是获得项目资金所需的天数 .

另外，我想知道如何解释归一化变量的线性回归中的系数？当使用其他模型（随机森林等非线性模型）时，这会有所不同吗？

任何帮助深表感谢！

1 回答

将所有预测变量设置为x并对y进行响应，并在LinearRegression对象中设置normalize = True，如下所示 .

from sklearn.linear_model import LinearRegression
import pandas as pd

regr = LinearRegression(normalize=True)  
regr.fit(x, y)
intercept = round(regr.intercept_, 2)
cols = x.columns.tolist()
coefficients = dict(zip(cols, [round(i, 4) for i in regr.coef_]))

回复于 2024-04-27T06:45:04+08:00

线性回归中的归一化 - 所有与仅1变量相对应

1 回答

相关问题