Spark Executor在将数据框写入镶木地板时表现不佳-Java 学习之路

Spark版本：2.3 hadoop dist：azure Hdinsight 2.6.5平台：Azure存储：BLOB

集群中的节点：6个执行程序实例：每个执行程序6个核心：每个执行程序3个内存：8GB

尝试通过同一存储帐户上的火花数据框将天蓝色blob（wasb）中的csv文件（大小4.5g - 280 col，2.8 mil行）加载到镶木地板格式 . 我已经重新划分了不同大小的文件，即20,40,60,100，但面临一个奇怪的问题，处理一小部分记录（<1％）的6个执行者中的2个继续运行1小时左右并最终完成 .