我正在使用scikit-learn DecisionTreeClassifier来构建决策树 . 假设给定的决策树具有6个叶/终端节点(A,B,C,D,E和F) . 我现在想要分配编码的原始记录,以确定它们属于哪个叶子/终端节点(将其视为特征工程的一种形式) .
我不想直接对记录进行评分,而是将各种树的虚拟变量集合构建到特征工程管道中 .
有谁知道这样做的简单方法?
类似的东西在 ensemble.RandomTreesEmbedding 下实施 . 请注意, n_estimators 表示决策树的数量 .
ensemble.RandomTreesEmbedding
n_estimators
见文档here .
1 回答
类似的东西在
ensemble.RandomTreesEmbedding
下实施 . 请注意,n_estimators
表示决策树的数量 .见文档here .