使用Python,我试图使用历史销售数据预测产品的未来销售数量 . 我也试图预测各种产品组的这些数量 .
例如,我的列看起来像这样:
Date Sales_count Department Item Color
8/1/2018, 50, Homegoods, Hats, Red_hat
如果我想使用历史数据(时间)构建一个预测每个Department / Item / Color组合的sales_count的模型,那么最好使用哪种模型?
如果我按时对销售进行线性回归,我该如何考虑各种类别?我可以将它们分组吗?
我是否会使用多线性回归,将各种类别视为自变量?
1 回答
我在python预测中遇到的最好的方法是在statsmodel库中使用SARIMAX(季节性自动回归整合移动平均值和外生变量)模型 . 以下是SARIMAX using python中非常好的教程的链接 . 另外,如果您能够根据Department / Item?颜色组合对数据框进行分组,则可以将它们放在循环中并应用相同的模型 . 您可以为每个独特的组合创建一个密钥,并且可以为每个关键条件预测销售额 . 例如,