我需要 Build 一个模型来预测每个月的销售额给出产品的畅销商排名 .

这一挑战在于数据 . 对于某个类别,比如“宝贝”,有许多子类别(玩具,衣服等),每个子类别都有自己的子类别 . 它是一种树状结构 . 在兄弟节点中,畅销列表中的产品是唯一的 . 换句话说,兄弟姐妹中没有重复的产品 . 对于每个类别,我只列出了1000个最畅销的商品,尽管该类别中可能还有更多商品 . 我无法在类别中看到1000以外的其他项目 . 子类别的1000项目列表可能使其某些项目与父项列表重叠,但它也可以包含其他项目(例如,我们无法在父项列表中看到的父项1001项目) .

“婴儿”类别树中共有202个类别 .

获取产品每月的销售数据(“跟踪”产品)是一项昂贵的操作,因此我希望尽量减少要跟踪的项目数量 . 我可以跟踪任何产品 .

当在图表上绘制时,按月销售的最畅销等级具有对数关系 .

考虑到产品畅销排名,我如何想出一种估算任何产品月销量的方法?如何使用最少数量的“跟踪”产品执行上述操作,以使预测仍然合理?需要跟踪的项目的大致数量是多少?