首页 文章

Julia Dataframes与Python大熊猫

提问于
浏览
11

我目前正在使用python pandas 并想知道是否有办法将数据从pandas输出到julia Dataframes ,反之亦然 . (我想你可以用 Pycall 从Julia调用python,但我不确定它是否适用于数据帧)有没有办法从python调用Julia并让它接收 panda 的数据帧? (不保存为像csv这样的其他文件格式)

除了非常大的数据集和运行具有许多循环(如神经网络)的东西之外,何时使用Julia Dataframes而不是Pandas是否有利?

2 回答

  • 1

    我是这方面的新手,但最近一直在使用这两者 . 说实话,它们似乎非常具有可比性,但是有更多关于熊猫的文档,Stack Overflow问题,所以我会给它一点点优势 . 不要让这个事实让你气馁,因为朱莉娅有一些我才刚刚开始理解的惊人功能 . 对于大型数据集,比如几次演出,两个软件包都很慢但是Pandas似乎有一点点优势(我决不认为我的基准测试是确定的) . 如果没有对你想要实现的目标有更细致的理解,我很难想象你甚至想在使用Julia DataFrame时调用Pandas函数的情况,反之亦然 . 除非你正在做一些非常大脑或使用非常大的数据集的事情,否则我看不出两者都做错了 . 当你说“输出数据”是什么意思?难道你不能将Pandas数据对象写入文件,然后在Julia DataFrame中打开/操作该文件(如你所述)?再说一次,除非你有一个非常好的机器读数据到大熊猫或Julia DataFrame是乏味的,可能会非常慢 .

  • 5

    所以有一个为此开发的库

    PyJulia 是一个用于使用Python 2和3与Julia交互的库

    https://github.com/JuliaLang/pyjulia

    它是实验性的但有些作用

    其次朱莉娅也有 pandas 的前端,这是 pandas.jl

    https://github.com/malmaud/Pandas.jl

    它看起来只是pandas的包装器,但您可以使用julia的并行功能执行多个功能 .

    至于到目前为止哪个更好 pandas 根据这个reading csv in Julia is slow compared to Python具有更快的I / O

相关问题