Иногда не показывает, что "Node down"
Выключил сервер уже минут 10 назад, а он все отмечен как доступный
[26.11.2019 11:20:54] **** Poll request sent to server ****
[26.11.2019 11:20:54] Poll request accepted
[26.11.2019 11:20:55] Starting status poll for node ZLOCK (VS11)
[26.11.2019 11:20:55] Checking NetXMS agent connectivity
[26.11.2019 11:20:59] NetXMS agent unreachable
[26.11.2019 11:21:00] Starting status poll on interface Ethernet
[26.11.2019 11:21:00] Current interface status is UNKNOWN
[26.11.2019 11:21:00] Starting ICMP ping
[26.11.2019 11:21:03] Interface is UNKNOWN for 13 polls (2 polls required for status change)
[26.11.2019 11:21:03] Interface status after poll is UNKNOWN
[26.11.2019 11:21:03] Finished status poll on interface Ethernet
[26.11.2019 11:21:04] Checking ethernet connectivity...
[26.11.2019 11:21:04] Upstream interface GigabitEthernet1/0/32 on node SW29xx-9-2 (servernaya, stoyka 3) is down
[26.11.2019 11:21:04] Node is still unreachable
[26.11.2019 11:21:04] Finished status poll for node ZLOCK (VS11)
[26.11.2019 11:21:04] Node status after poll is NORMAL
[26.11.2019 11:21:04] **** Poll completed successfully ****
Статус смениля на Critical через 35 минут
В чем может быть дело?
Дело тут вот в этой строчке:
[26.11.2019 11:21:04] Upstream interface GigabitEthernet1/0/32 on node SW29xx-9-2 (servernaya, stoyka 3) is down
В netxms есть механизм корелляции, который при потере связи с нодой проверяет, не потеряна ли связь также со свичами/рутерами, через которые подключена нода. Сейчас этот механизм работает так, что переход порта на свиче в DOWN тоже тоже кореллируется и мы бы говорим, что нода недоступна (unreachable) потому что вот этот порт на свиче в дауне (эту логику планируется поменять).
Однако помимо unreachable нода должна была стать и critical, то что это не произошло, это не правильно.
Я так понимаю, что это происходило на 3.0. Планируете апгрейдиться на 3.1?
Планирую в ближайшее время