首页 文章

r caret包中的列车功能输出的巨大尺寸

提问于
浏览
1

我正在使用r caret包中的train()函数训练bagFDA模型,并将模型输出保存为.Rdata文件 . 输入文件大约有300k条记录,有26个变量,但输出.Rdata的大小为3G . 我只需运行以下命令:modelout < - train(x,y,method =“bagFDA”)save(file =“myout.Rdata”,modelout)在窗口系统下 . 问题:(1)为什么myout.Rdata如此之大? (2)如何减小文件的大小?

提前致谢!

JT

1 回答

  • 2

    在trainControl中为starters设置returnData = FALSE,因此您不会在模型中创建额外的数据副本 . 我的理解是使用bagFDA创建了许多bootstrap,它们基本上创建了相同数量的数据副本 . 降低B参数,默认为50,也应该缩小它 . 另外,看看这篇文章:

    Why is caret train taking up so much memory?

相关问题