首页 文章
  • 1 votes
     answers
     views

    TermDocumentMatrix as.matrix使用大量内存

    我目前正在使用tm软件包来提取出集群的术语,以便在我的桌面上运行的25k项目(30Mb)的大小相当的数据库中进行重复检测,但是当我尝试在我的服务器上运行它时似乎需要一个不节制的时间 . 仔细观察后,我发现我已经通过4GB交换运行了线路应用(posts.TmDoc,1,sum)来计算条款的频率 . 此外,即使运行as.matrix在我的桌面上生成3GB的文档,请参阅http://imgur.com/...

热门问题