首页 文章

预测,(找到合适的型号)

提问于
浏览
1

使用Python,我试图使用历史销售数据预测产品的未来销售数量 . 我也试图预测各种产品组的这些数量 .

例如,我的列看起来像这样:

Date Sales_count Department Item Color

8/1/2018, 50, Homegoods, Hats, Red_hat

如果我想使用历史数据(时间)构建一个预测每个Department / Item / Color组合的sales_count的模型,那么最好使用哪种模型?

如果我按时对销售进行线性回归,我该如何考虑各种类别?我可以将它们分组吗?

我是否会使用多线性回归,将各种类别视为自变量?

1 回答

  • 1

    我在python预测中遇到的最好的方法是在statsmodel库中使用SARIMAX(季节性自动回归整合移动平均值和外生变量)模型 . 以下是SARIMAX using python中非常好的教程的链接 . 另外,如果您能够根据Department / Item?颜色组合对数据框进行分组,则可以将它们放在循环中并应用相同的模型 . 您可以为每个独特的组合创建一个密钥,并且可以为每个关键条件预测销售额 . 例如,

    df=pd.read_csv('your_file.csv')
    df['key']=df['Department']+'_'+df['Item']+'_'+df['Color']
    for key in df['key'].unique():
        temp=df.loc[df['key']==key]#filtering only the specific group
        temp=temp.groupby('Date')['Sales_count'].sum().reset_index()
        #aggregating the sum of sales in that date. Ignore if not required. 
        #write the forecasting code here from the tutorial
    

相关问题