首页 文章
  • 2 votes
     answers
     views

    使用featuretools为预测模型生成标签

    我目前正在使用自己的数据处理功能工具演示(https://github.com/Featuretools/predict_next_purchase/blob/master/Tutorial.ipynb) . 我创建了一个实体集,并尝试首先创建标签 . 笔记本引用了import utils,但没有使用功能工具进行安装 . 这是我需要安装的独立模块吗? python 2.7 pip install ...
  • 2 votes
     answers
     views

    Featuretools dfs运行时错误

    根据我自己的数据完成featuretools“predict_next_purchase”演示 . 我已经创建了实体集,并且还创建了一个由标签和时间组成的新pandas.dataframe . 我正在使用ft.dfs进行深度特征合成,并且遇到RuntimeError:超出了最大递归深度 . 下面是堆栈跟踪: feature_matrix, features = ft.dfs(target_enti...
  • 4 votes
     answers
     views

    featuretools last_time_index未设置

    我已经构建了一个实体集,并且该实体集中的一个表称为“检查” . 我已为此表设置了time_index列,但在运行dfs时,我收到警告“使用training_window但未在实体检查中设置last_time_index” . 文档显示应将其设置为一系列:last_time_index(pd.Series) - 所有子实体中每个实例的最后一个事件的时间索引 . 有人可以提供一个示例,说明我应该如何设...
  • 1 votes
     answers
     views

    如何使用featuretools get_pandas_data_slice

    有人可以展示一个例子,或者就如何使用featuretools.EntitySet.get_pandas_data_slice()提供更多解释吗?我查看了API文档,但我不清楚参数filter_entity_ids,index_eid和instances 具体来说,我想将我的实体集过滤到一个子集,这种方法看起来很有希望 .
  • 0 votes
     answers
     views

    如何修复错误featuretools包安装python

    安装featuretools时出现此错误...为什么? “NewConnectionError <”无法 Build 新连接:[Errno 11004] getaddrinfo failed',>
  • 0 votes
     answers
     views

    使用训练窗口运行DFS training_window = '90 minute'

    文件样本是: window_fm, window_features = ft.dfs(entityset=es, ....: target_entity="customers", ....: cutoff_time=cuto...
  • -1 votes
     answers
     views

    Deep Feature Synthesis和Featuretools背后的算法细节?

    为了正确使用,理解深度特征合成和特征工具的算法/数学基础是很重要的 . 是否有论文,专利,与其他工具的比较?
  • 0 votes
     answers
     views

    featuretools实体集中的错误

    当我使用featuretools定义实体集时,我收到以下错误消息: AttributeError:'str'对象没有属性'copy' 这是我的代码: import featuretools.variable_types as vtype es = ft.EntitySet(id="Policy") es = es.entity_from_dataframe(entity...
  • 0 votes
     answers
     views

    了解featuretools中的PercentTrue原语输出

    我一直在玩predict-appointment-noshow notebook tutorial并且我对 PERCENT_TRUE 原语的输出感到困惑 . 我的理解是,在特征生成之后,像 locations.PERCENT_TRUE(appointments.sms_received) 这样的列给出了 sms_received 为真的行的百分比,给定一个位置,之前定义为它自己的 Entity ...
  • 1 votes
     answers
     views

    在单个表上使用特征工具来显示滞后特征

    我已经看到,使用featuretools创建聚合的建议范例通常是通过关系链接的单独实体 . 现在,我的情况有点不同,我有一个看起来像这样的表 user_id | time_id | feature1_lag1 | feature1_lag2 | ... | feature1_lagn | feature2_lag1| ... | featurem_lagn 基本上我有相同功能的滞后版本作为同一个...
  • 2 votes
     answers
     views

    从Python featuretools中排除特征工程的当前行

    我正在使用 featuretools 为当前行生成历史功能 . 例如,在会话期间的最后一小时内进行的事务数 . 包 featuretools 包含参数 cutoff_time 以排除 cutoff_time 之后的所有行 . 我将 cutoff_time 设置为 time_index value - 1 second ,因此我希望这些功能基于历史数据减去当前行 . 这允许包含历史行的响应变量 . ...
  • 0 votes
     answers
     views

    Featuretools处理多个连接键

    如何在featuretools中表示多个连接键的一对多关系?是否有一些集成方法 - 或者手动将连接键连接到一个列中?
  • 1 votes
     answers
     views

    featuretools的截止时间和训练窗口

    假设我有两个数据集(对应于我的实体集中的两个实体): 第一个:客户(cust_id,name,birthdate,customer_since)第二个:预订(booking_id,service,chargeamount,booking_date) 现在我想创建一个包含从 all customers (no matter since when they are customer) but only...
  • 2 votes
     answers
     views

    使用Featuretools中的多个训练窗口计算相同的特征

    Featuretools支持已经处理多个截止时间https://docs.featuretools.com/automated_feature_engineering/handling_time.html In [20]: temporal_cutoffs = ft.make_temporal_cutoffs(cutoffs['customer_id'], ....: ...
  • 1 votes
     answers
     views

    根据featuretools中的截止时间创建要素

    我使用featuretools,我需要创建一个使用截止时间进行计算的功能 . 我的实体集包含一个客户端表和一个订阅表(它有更多但是对于问题只有这些是必要的): import featuretools as ft import pandas as pd client_table = pd.DataFrame({'client_id': (1,2,3), ...

热门问题