我在GKE中运行了多个Kubernetes集群 . 我正在使用heapster Influxdb来获取pods性能的指标 . 获取和存储群集范围指标的建议方法是:
命名空间中的pod数量
每个命名空间请求的总内存/限制每个命名空间
总cpu请求/限制
每个节点请求的总内存/限制
每个节点请求/限制的总CPU数
每个状态的pod数(运行,待处理等)
AFAIK这超出了heapster的范围,但我们需要密切关注这一点,以了解集群的状态 .
谢谢!
如果您创建自定义仪表板并充分利用Grafana模板,则可以使用Grafana可视化您提及的4个指标:
按“pod_namespace”排序并按“cpu / usage”或“cpu / limit”或“cpu / request”汇总
按“主机名”排序并按“内存/限制”或“内存/请求”或“cpu / usage”或“cpu / limit”或“cpu / request”聚合
请参阅:Heapster storage schema . 一旦你理解了InfluxDB架构,你就可以做到魔术 .
Heapster没有收集其他2个,这意味着如果你想在某个地方推送那些数据,你必须在Kubernetes API上提出你自己的查询,在你的情况下可能还有InfluxDB .
1 回答
如果您创建自定义仪表板并充分利用Grafana模板,则可以使用Grafana可视化您提及的4个指标:
每个命名空间
按“pod_namespace”排序并按“cpu / usage”或“cpu / limit”或“cpu / request”汇总
每个节点请求的总内存/限制
每个节点请求/限制的总CPU数
按“主机名”排序并按“内存/限制”或“内存/请求”或“cpu / usage”或“cpu / limit”或“cpu / request”聚合
请参阅:Heapster storage schema . 一旦你理解了InfluxDB架构,你就可以做到魔术 .
Heapster没有收集其他2个,这意味着如果你想在某个地方推送那些数据,你必须在Kubernetes API上提出你自己的查询,在你的情况下可能还有InfluxDB .