我尝试创建一个hive外部表:
CREATE EXTERNAL TABLE TestXML(storexml string)STORED as TEXTFILE LOCATION'wasb:/// test /';
但是,当我尝试执行如下所示的查询时,它无法提取字段:SELECT xpath_string(storexml,'/ trades / trade / USI')
FROM TestXML;
我看了一篇帖子,谈到了指定输入格式 . 添加JARS <> set xmlinput.element = Store; CREATE EXTERNAL TABLE EventStoreXML(storexml string)STORED AS INPUTFORMAT'msdn.hadoop.mapreduce.input.XmlElementStreamingInputFormat'OUTPUTFORMAT'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'LOCATION'wasb:///eventstore@tradedata.blob .core.windows.net /';
我无法确定要在add JARs语句中包含哪些jar . 我在Linux上使用HDInsight .
任何指针将不胜感激 . -Madhu
1 回答
实现问题的原因是XML具有回车符,因此无法读取XML .