首页 文章

featuretools last_time_index未设置

提问于
浏览
4

我已经构建了一个实体集,并且该实体集中的一个表称为“检查” . 我已为此表设置了time_index列,但在运行dfs时,我收到警告“使用training_window但未在实体检查中设置last_time_index” . 文档显示应将其设置为一系列:last_time_index(pd.Series) - 所有子实体中每个实例的最后一个事件的时间索引 .

有人可以提供一个示例,说明我应该如何设置last_time_index以及将其设置为什么值?

注意,计算仍然是正确的,但我关注的是警告信息 .

1 回答

  • 3

    您可以通过调用 your_entityset.add_last_time_indexes() 自动将 last_time_index 添加到所有实体 . 配置完整个实体集后,将其作为最后一步运行 .

    last_time_index 仅在使用培训窗口计算要素时使用,因此我们不会花时间默认创建它 . 如果您运行该命令,警告将消失 .

    使用了 last_time_index ,因此我们可以在训练数据窗口开始之前排除具有最后数据的行 . 这与 time_index 不同,后者确保行已知或在训练数据窗口结束之前有第一个数据 .

相关问题