首页 文章

对存储在BigQuery中的数据进行预处理

提问于
浏览
0

我刚开始使用GCP,我对它的一些工具的正确使用有一些疑问 . 特别是,我正在尝试将Google Analytics中的数据提取到BigQuery中 . 是否可以在存储在BigQuery中的数据上使用Dataprep?几乎我见过的每个例子都使用Dataprep可视化存储在Google Storage中的数据,但没有任何内容涉及BigQuery .

任何帮助将非常感激 .

2 回答

  • 0

    您可以完全使用Dataprep来处理存储在BigQuery中的数据 . 它为您提供了一种可视化数据集外观的方式,并以交互方式定义转换 .

    现在,你真的想使用Dataprep吗?转换将更加昂贵和缓慢,因为它们将在Dataflow上运行 - 这通常比在BigQuery中执行所有内容更加昂贵和缓慢(因为问题涉及已经在BigQuery中的数据) .

    另一方面,交互式环境可以帮助您快速定义所需内容并定期运行创建的配方 .

    在Lak的“如何使用Dataprep安排BigQuery ETL作业”中查看更多相关信息 .

  • 1

    根据documentation on Dataprep,您可以导入BigQuery数据集 .

    但是,打开Dataprep并检查那里的导入选项可能更容易:

    enter image description here

相关问题