使用Beam将Avro写入BigQuery

提问于 2024-04-29T08:34:46+08:00

浏览次

0

Q1：假设我使用BigQuery加载工具加载Avro编码数据 . 现在我需要将这些数据写入仍然采用Avro格式的不同表格 . 我试图测试不同的分区，以测试表性能 . 如何使用Beam将SchemaAndRecord写回BigQuery？在这种情况下，模式检测也会工作吗？

Q2：从Avro架构类型转换为BigQuery架构类型时，看起来架构信息会丢失 . 例如，在BigQuery中，double和float Avro类型都转换为FLOAT类型 . 这是预期的吗？

1 回答

1

Q1：如果表已经存在且模式与您要复制的模式匹配，则应该能够使用CREATE_NEVER CreateDisposition（https://cloud.google.com/dataflow/model/bigquery-io#writing-to-bigquery）并直接从原始表的readTableRows（）输出中编写TableRows . 虽然我建议使用BigQuery的TableCopy命令 .

Q2：这是预期的，BigQuery没有Double类型 . 您可以在此处找到有关类型映射的更多信息：https://cloud.google.com/bigquery/docs/loading-data-cloud-storage-avro#avro_conversions . 此外，很快也会支持逻辑类型：https://issuetracker.google.com/issues/35905894 .

回复于 2024-04-29T08:34:46+08:00

相关问题