我有一些带有图表的grafana仪表板,有时会显示“无数据点” . 我知道有数据,因为有时我在同一页面上看到图形和其他图形显示来自相同测量的其他结果 . 另外,我可以直接在Influxdb中查询数据 .

有趣的是,似乎更长的时间段更可能导致这种失败而不是更短的时间(即30天有时失败,1天很少失败) . 这是每隔几秒钟的数据,如系统统计数据 .

我怀疑(数据不充分)潮流有时需要太长时间才能响应并且grafana超时,否则由于相对于可用资源的数据过多,涌入的内核完全无法通过查询 . OTOH,直接查询Influxdb工作得很好(见下文),虽然我一次只抛出一个查询 . 如果我在仪表板更新时进行查询,则查询需要更长时间,就像我正在等待工作线程处理我的查询一样 .

但在我开始增加硬件之前,我已经拥有了那么多数据 . 然而,涌入和grafana日志并没有向我显示任何非常有趣的内容(例如OOM,超时或查询失败) .

有什么建议?

顺便说一句,grafana中的示例查询是这样的:

SELECT percentile("usage_system", 95) FROM "cpu"
WHERE "host" =~ /^$host$/ AND $timeFilter
GROUP BY time($__interval), "host"

如果我直接查询Influxdb,查询结果几乎立即返回,而在grafana中,我等待很长一段时间用微调器显示 . (如果我在更新仪表板的同时查询,则查询需要一点,与等待工作线程处理我的查询一致 . )

select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= 1519216559000000000 AND time <= 1521808559000000000
GROUP BY time(1h), host

要么

select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= '2018-02-23T00:00:00Z' AND time <= '2018-03-23T00:30:00Z'
GROUP BY time(1h), host