我有一组看起来像这样的Json数据文件
[
{"client":"toys",
"filename":"toy1.csv",
"file_row_number":1,
"secondary_db_index":"4050",
"processed_timestamp":1535004075,
"processed_datetime":"2018-08-23T06:01:15+0000",
"entity_id":"4050",
"entity_name":"4050",
"is_emailable":false,
"is_txtable":false,
"is_loadable":false}
]
我用以下自定义分类器Json Path创建了一个Glue Crawler
$[*]
Glue返回正确的模式,并正确识别列 .
但是,当我在Athena上查询数据时...所有数据都在第一列中着陆而其余列都是空的 .
如何根据列显示数据?
谢谢!
1 回答
这是一个与Hive相关的问题 . 我建议两种方法 . 首先,您可以使用结构数据类型在Athena中创建新表:
然后您可以按如下方式运行查询:
其次,您可以重新设计您的json文件,然后再次运行Crawler . 在这个例子中,我使用了Single-JSON-Record-Per-Line格式 .