首页 文章

在Google Colaboratory中保留数据

提问于
浏览
7

有没有人找到一种方法来保持文件在Google的_1776776中的会话中保持不变?

使用示例笔记本,我成功地从我的Google Drive实例中验证和传输csv文件,并将它们存储在/ tmp,my~和〜/ datalab中 . 熊猫也可以通过磁盘读取它们 . 但是一旦会话超时,看起来整个文件系统都被擦除,新的虚拟机就会被刷新,没有下载的文件 .

我想这不是't surprising given Google' s Colaboratory Faq

问:我的代码在哪里执行?如果我关闭浏览器窗口,我的执行状态会发生什么?答:代码在专用于您帐户的虚拟机中执行 . 闲置一段时间后,虚拟机会被回收,并且系统会强制执行最长生命周期 .

鉴于此,也许这是一个功能(即"go use Google Cloud Storage, which works fine in Colaboratory")?当我第一次使用该工具时,我希望 My File/Colab Notebooks Google Drive文件夹中的任何.csv文件也会加载到运行笔记本的VM实例上:/

3 回答

  • 0

    你的解释是正确的 . 虚拟机是短暂的并且在不活动期间被回收 . 目前,VM本身没有持久数据机制 .

    为了使数据持久存在,您需要将其存储在VM之外的某个位置,例如Drive,GCS或任何其他 Cloud 托管提供商 .

    有关从外部源加载和保存数据的一些配方,请参见I/O example notebook .

  • 2

    不确定这是否是最佳解决方案,但您可以使用以下自动身份验证在Colab和 Cloud 之间同步您的数据:https://gist.github.com/rdinse/159f5d77f13d03e0183cb8f7154b170a

  • 4

    Clouderizer可能会提供一些数据持久性,代价是长时间设置(因为你只使用google colab作为主机)并且工作空间很小 .

    但是,在我看来,当你忘记保存进度时,最好将文件“回收” .

相关问题