我的随机森林分类模型包含500个决策树,并训练了200个变量和10,000个数据点 . 每个决策树负责200维参数空间中的特定子区域,并由若干输入变量表示 . 我想实现两件事: - 识别500个决策树中的哪一个与给定点X相关 - 输出决策树中包含的变量列表 . 理想情况下,它应该是一个函数调用:

list_of_variables < - getSignificantVariables(RF,X)

其中RF是随机森林模型,X是训练(或测试)数据集中的一行 .

我尝试在RandomForest包中使用现有的API . 函数GetTree(n)输出一个表,其中包含与树编号n相关的信息 . 可以将变量名称与从表中获取的变量号相关联 . 但是,我们如何识别500个决策树中的哪一个与给定点X相关?