首页 文章

是否可以配置nagios为每个主机组或服务组发送通知?

提问于
浏览
3

我在nagios中创建了几个主机组,每个主机组由几个主机组成 . 主机承载由服务检查监控的应用程序,每个应用程序至少7个或更多 . 因此我的问题是:当我们说主机组中的主机A上的应用程序“测试”正在下降时,我突然收到大约7个通知,描述主机组“测试”中主机A上的7个应用程序控制中的每一个都处于严重状态 .

我希望nagios配置的是发送一个通知,例如,主机A上的消息计数处于关键状态的服务检查,然后主机组“测试”关闭的最多一个通知 . 这样我就不会收到7次通知,我知道我必须修复特定主机组中特定主机的问题 . 这种方式更清楚要解决什么问题 .

添加另一个示例:当主机A上的应用程序关闭并且我接收时可以说10个通知,几秒钟之后http_checks也将开始通知我,因为apache不接收来自应用程序的数据 . 所以我最终解决了一个问题并收到大约20个或更多通知 . 我最不感兴趣的是最多4个通知 . 主机A上的一个服务检查和主机A所在的每个主机组一个,然后每个主机组相同,其中是apache . 或者,如果它们位于同一主机组中,则根本只有2个通知 .

如果同时在另一个主机组中发生类似问题,我将再次知道有两个主机组有问题需要修复 . 然而,目前的情况是我收到大约50个通知并且混淆了从哪里开始以及真正的问题是什么 .

你们中的任何一个人都面临类似的问我正在寻找相当长的时间来解决这个问题 . 我尝试使用依赖项,但没有找到方法来配置nagios到我上面描述的情况 . 父子关系只能用于每个主机 . 升级根本无法解决这个问题 .

也许我只是错过了有关此配置的文档中的一些信息 . 非常感谢任何建议 .

1 回答

  • 1

    Nagios可以通过服务依赖性检查来完成此操作 . 见:http://nagios.sourceforge.net/docs/nagioscore/3/en/dependencies.html

    但 Build 并保持管理真的很痛苦 . 我发现最简单的解决方案是使用NRPE命令(在目标主机上定义)可以执行几乎无限数量的实际检查 . 全部通过单一的Nagios服务检查 . 我'捆绑'单个应用程序的所有检查(处理上/下,各种日志碎片,日志年龄等),以便每个单独的应用程序只有一个检查 . 检查结果会告诉您哪个检查失败了 .

相关问题