首页 文章

如何在包裹检查期间有效处理未压缩的保存?

提问于
浏览
28

在最近开发包的努力中,我将数据集包含在我的包的 data/ 文件夹中 . 在我的具体情况下,我有5个数据集,所有数据集都采用 data.table 格式(尽管如果我将它们保留为 data.frame ,我在下面描述的问题仍然存在) . 我已将每个文件保存为单独的 .rda 文件并对其进行适当记录 .

当我从包 devtools 运行 check() 时,我收到以下警告:

checking data for ASCII and uncompressed saves ... WARNING
  Warning: large data file(s) saved inefficiently:
          size ASCII compress
  data1.rda 129Kb  TRUE     gzip
  data2.rda 101Kb  TRUE     gzip
  data3.rda 1.6Mb  TRUE     gzip

  Note: significantly better compression could be obtained
        by using R CMD build --resave-data
              old_size new_size compress
  data1.rda         129Kb     34Kb       xz
  data2.rda         101Kb     20Kb       xz
  data4.rda          92Kb     35Kb       xz
  data3.rda         1.6Mb    116Kb       xz
  species.rda     12Kb      9Kb       xz

我尝试使用推荐的 xz 压缩 resaveRdaFiles (包 tools )保存数据 . 即便这样做,警告仍然存在 .

好的,所以我运行 R CMD build --resave-data 并且警告继续存在 .

我在这里想念的是什么?如何克服这个问题(现在和未来)?

1 回答

  • 21

    保存 .rda 文件时,请使用以下命令: save(..., file='test.rda', compress='xz') 这将有助于解决问题!

相关问题