我一直致力于市场购物篮分析,通过先验方法在R中,数据包含12个变量和21,00,000个观测值,我的笔记本电脑有4 GB RAM,我的R代码没有运行将数据转换成事务 . 请帮忙 .
我过去曾为更大的数据集研究apriori算法 . 我遇到了类似的问题 . 为了暂时解决它,我使用了采样 . 后来我把它变成了几行spark实现,永久地解决了我的问题 .
https://spark.apache.org/docs/1.6.0/mllib-frequent-pattern-mining.html
1 回答
我过去曾为更大的数据集研究apriori算法 . 我遇到了类似的问题 . 为了暂时解决它,我使用了采样 . 后来我把它变成了几行spark实现,永久地解决了我的问题 .
https://spark.apache.org/docs/1.6.0/mllib-frequent-pattern-mining.html