我最近遇到了我的普罗米修斯设置问题 . 前段时间我将Prometheus配置为从目标上的WebApi(比如说)中删除指标:someHost001:443和其他主持人:443 . 我的web api正在公开我测量请求次数的摘要度量 .

这是我的配置:

...
- job_name: "someJob"
tls_config:
    insecure_skip_verify: true
scheme: https
metrics_path: 'api/metrics'
bearer_token: 'token_string'
static_configs:
  - targets: ['someHost001:443', 'otherHost001:443']
...

一切都很好,生活很棒,直到大约3-4周之后,我又增加了第三个目标:'someHost002:443' .

我期望看到的是一个新的数据系列,实例标签等于'someHost002:433' . 我还希望看到的是,新数据系列将在新主机上存储来自新webapi实例的api调用指标 .

事实上,prometheus创建了新的时间序列,然而它接触到的数据不是来自someHost002:443 / api / metrics,而是形成someHost001:443 / api / metrics .

我做了一些测试来缩小问题范围,并注意到一些有趣的事实:

  • 当我取下someHost002实例时 - prometheus会识别实例已关闭,并且没有新的度量标准被读取到此时间序列 .

  • 当我只对某些主题ap2进行api调用prometheus时不会读取它们(因为它只是从someHost001读取度量标准)

几乎从我的设置开始,prometheus已经从otherHost001中删除了指标而没有任何问题 .

我还创建了一个新工作,只读取新主机的指标,并且它仍然是prometheus从错误的实例读取它们的接缝 .

有人经历过类似的问题吗?这可能是普罗米修斯的错误吗?