我正在使用带有8 GB RAM机器的RStudio(MacBook Pro) . 我还在AWS中使用带有15 GB RAM的RStudio Server .
两者似乎都无法完成数据大小为800,000条记录的som() . 100,000条记录似乎也永无止境 .
我想知道R kohonen包的实际数据大小是否有限制?接下来,我应该如何处理这些大数据的SOM?
更新:RStudio服务器终于完成错误:
矩阵错误(0,nd * ncodes,nmaps):无效'nrow'值(太大或NA)另外:警告消息:在nd * ncodes:由整数溢出产生的NAs
那么限制是什么呢?
2 回答
我没有使用'trainingset'作为trainX,而是回收som_model的数据(因为keep.data = TRUE),所以当空间是约束时,我不必为trainX保留额外的数据集 .
我有同样的问题,事实证明我没有将一些数据转换为矩阵 .
kohonen包不能很好地处理数据帧 . 一定要使用:
例如