首页 文章

如何通过内存和vcore配置更快地使Hadoop YARN?

提问于
浏览
0

在Hadoop YARN上,如果我有更多容器来运行map任务或减少任务,处理作业会变得更快吗?

因此,如果我将容器分配内存小于默认值,那么我可以在主机上运行更多容器,并使作业更快 .

那么vcore怎么样,我的意思是如果我们有更多的容器可以运行,但它会根据vcore分配一个接一个地运行吗?换句话说,无论是多少容器还是少数容器,它仍然是一个接一个地运行 .

1 回答

  • 0

    不,任务可以并行运行 .

    让我们考虑您的YARN群集有24核和96 GB内存 . mapreduce.map.cpu.vcoresmapreduce.reduce.cpu.vcores 的默认值为1

    因此,您可以启动24个容器,每个容器有4个GM内存,它们可以并行运行 . 如果您的工作需要超过24个容器,那么最初将启动前24个任务,并且一旦所需资源(容器)可用,将立即启动后续任务 .

相关问题