我正在尝试将几个大型生物医学本体加载到GraphDB Owl Horst优化的存储库中,以及使用来自这些本体的术语的数百万个三元组 . 我可以在不到1小时的时间内将这些数据加载到RDFS优化的仓库中,但如果我让它过夜,我甚至无法加载其中一个本体(chebi_lite) . 这是在64核,256 GB AWS服务器上使用loadrdf .

我之前的问题Can GraphDB load 10 million statements with OWL reasoning?导致我使用 preload 命令,然后重新推断的建议 . 预载确实非常快,但是当重新推断时,只使用了一个核心 . 我还没能让它超过一个小时 . Is re-inferring using just one core a consequence of using the free version? Might loadrdf work better if I just did a better configuration?

当我使用 loadrdf 时,所有内核都接近100%,但内存使用率从未超过10%左右 . 我对JVM内存设置进行了一些修改,但我还没有做到 . 例如

-Xmx80g -Dpool.buffer.size=2000000