在最近开发包的努力中,我将数据集包含在我的包的 data/
文件夹中 . 在我的具体情况下,我有5个数据集,所有数据集都采用 data.table
格式(尽管如果我将它们保留为 data.frame
,我在下面描述的问题仍然存在) . 我已将每个文件保存为单独的 .rda
文件并对其进行适当记录 .
当我从包 devtools
运行 check()
时,我收到以下警告:
checking data for ASCII and uncompressed saves ... WARNING
Warning: large data file(s) saved inefficiently:
size ASCII compress
data1.rda 129Kb TRUE gzip
data2.rda 101Kb TRUE gzip
data3.rda 1.6Mb TRUE gzip
Note: significantly better compression could be obtained
by using R CMD build --resave-data
old_size new_size compress
data1.rda 129Kb 34Kb xz
data2.rda 101Kb 20Kb xz
data4.rda 92Kb 35Kb xz
data3.rda 1.6Mb 116Kb xz
species.rda 12Kb 9Kb xz
我尝试使用推荐的 xz
压缩 resaveRdaFiles
(包 tools
)保存数据 . 即便这样做,警告仍然存在 .
好的,所以我运行 R CMD build --resave-data
并且警告继续存在 .
我在这里想念的是什么?如何克服这个问题(现在和未来)?
1 回答
保存
.rda
文件时,请使用以下命令:save(..., file='test.rda', compress='xz')
这将有助于解决问题!