首页 文章

在Nagios长期服务检查

提问于
浏览
0

我有一个服务检查,我在Nagios Exchange网站上找到了适用于小目录的服务检查,但不适合需要超过30或60秒才能完成的大型服务 .

http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/CheckDirSize/details

我遇到的问题是我需要配置一个服务检查,Nagios每天可以运行一次,但将保持打开1440分钟(一天) . 目录列表非常庞大,需要花费数小时才能完成(最多20小时) .

这是我的服务检查(每天检查,当使用nrpe时,超时是86400秒,这也是一天) . 但由于某种原因,即使我可以在ps -ef |中看到du -sk在命令行上运行grep du,Nagios报告“(服务检查超时)”:

define service {
    use                             generic-service,srv-pnp
    host_name                       IMAGEServer1
    service_description             Images
    check_command                   check_nrpe!check_dirsize -t 86400
    check_interval                  1440
    }

在我的Linux服务器上的nrpe.cfg文件中,我也有这两个指令:

command_timeout=86400
connection_timeout=86400

如何让Nagios完成支票而不是超时?我的印象是我的上述指示是正确的 .

1 回答

  • 1

    什么是超时是本地的 check_nrpe 命令(默认超时为2分钟) . 您可以编辑其命令定义以使用长超时 .

    或者,您可能希望将此作为IMAGEServer1的被动检查,作为cron作业运行 .

相关问题