我有两百万个文件要在我们的集群上读取,当我提交作业来操作这些数据时,我们在“事件时间轴”上看到,在集群上添加Executor到“runJob”进程之间存在差距 .

差距大约是30-40分钟,同时事件时间表没有显示“runJob”进程,集群也没有创建任务阶段 .

问题是,有没有人知道事件时间表或阶段创建之前的过程是什么?我该如何识别“隐藏”过程 .

我猜这些进程正在读取2百万个数据文件的元数据,但我找不到明确显示该进程的日志 .

群集详细信息:

  • 15名 Worker ,1名硕士

  • 16核心cpu / worker

  • 60 GB RAM /工作人员

  • 45执行人,5核/执行人,3 GB /执行人