我在Spark中处理JSON数据时遇到问题 .
DataFrame有一个列为String格式的JSON .
DF架构:
root
|-- id: string (nullable = true)
|-- jsonString: string (nullable = true)
示例jsonString: "{\"sample\":\"value\"}";
我想将此jsonString转换为嵌套的JSON对象 . 这使得能够读取和遍历JSON数据 .
我正在寻找的目标DF结构如下 .
root
|-- id: string (nullable = true)
|-- json: struct (nullable = true)
| |-- sample: string (nullable = true)
感谢任何帮助 .
2 回答
您可以使用
to_json
函数转换jsonString . 为此,您需要创建一个架构输出架构:
输出:
希望这可以帮助!
您可以使用Gson中提供的动态json解析器将json字符串转换为对象 . 请在这里查看java中的示例代码:
如果它解决了您的问题,请告诉我 .