首页 文章

R kohonen:最大数据量有多大?整数溢出错误

提问于
浏览
2

我正在使用带有8 GB RAM机器的RStudio(MacBook Pro) . 我还在AWS中使用带有15 GB RAM的RStudio Server .

两者似乎都无法完成数据大小为800,000条记录的som() . 100,000条记录似乎也永无止境 .

我想知道R kohonen包的实际数据大小是否有限制?接下来,我应该如何处理这些大数据的SOM?

更新:RStudio服务器终于完成错误:

矩阵错误(0,nd * ncodes,nmaps):无效'nrow'值(太大或NA)另外:警告消息:在nd * ncodes:由整数溢出产生的NAs

那么限制是什么呢?

2 回答

  • 2

    我没有使用'trainingset'作为trainX,而是回收som_model的数据(因为keep.data = TRUE),所以当空间是约束时,我不必为trainX保留额外的数据集 .

    prediction <- predict(som_model, newdata = as.matrix(testset), trainX = som_model$data, trainY=cl )
    
  • 0

    我有同样的问题,事实证明我没有将一些数据转换为矩阵 .

    kohonen包不能很好地处理数据帧 . 一定要使用:

    as.matrix(data)
    

    例如

    som_model <- som(data = as.matrix(trainingset), grid = som_grid, rlen=1000, alpha=c(0.05,0.01), 
                 keep.data = TRUE,
                 n.hood="circular" )
    prediction <- predict(som_model, newdata = as.matrix(testset), trainX = as.matrix(trainingset), trainY=cl )
    

相关问题