早些时候我使用Spark并且非常熟悉Spark WebUI(localhost:8080) . 我能够检查一个 Worker 是否已连接到主人,连接了多少 Worker ?每个 Worker 使用的RAM量等等 .

Tensorflow使用gRPC进行分布式计算 . RAM和GPU内存对于分布式计算至关重要 . Is there any utility which acts like a Spark WebUI for Distributed Tensorflow, assuming first parameter server / task id as master and workers as slave?

Note :在单个工作者的帮助下使用摘要编写器并在tensorboard中加载日志与我想要实现的不同 .