Состояние хоста в зависимости от ICMP

Started by mr.Z, October 15, 2015, 03:54:49 PM

Previous topic - Next topic

mr.Z

Здравствуйте!

Столкнулся со следующей проблемой. Есть хост, к которому нету связи и опция "Disable usage of ICMP pings for status polling". При её отключении (то есть, опросе хоста по ICMP) NetXMS определяет его состояние так:


[15.10.2015 15:28:46] **** Poll request sent to server ****
[15.10.2015 15:28:46] Poll request accepted
[15.10.2015 15:29:06] Starting status poll for node olt01.city01
[15.10.2015 15:29:06] Checking SNMP agent connectivity
[15.10.2015 15:29:14] SNMP agent unreachable
...
Опрос всех интерфейсов (около 120 штук, один "Expected State = UP", остальные "Expected State = IGNORE")
Для всех интерфейсов такая картина:
[15.10.2015 15:29:14]       Current interface status is UNKNOWN
[15.10.2015 15:29:14]       Interface status cannot be determined
[15.10.2015 15:29:14]       Interface is UNKNOWN for 43 polls (1 poll required for status change)
[15.10.2015 15:29:14]       Interface status after poll is UNKNOWN
...
[15.10.2015 15:29:22] Node is connected
[15.10.2015 15:29:28] Finished status poll for node olt01.city01
[15.10.2015 15:29:28] Node status after poll is NORMAL
[15.10.2015 15:29:28] **** Poll completed successfully ****


При включении "Disable usage of ICMP pings for status polling" и, следственно, отключении опроса по ICMP:


[15.10.2015 15:29:55] **** Poll request sent to server ****
[15.10.2015 15:29:55] Poll request accepted
[15.10.2015 15:29:55] Starting status poll for node olt01.city01
[15.10.2015 15:29:55] Checking SNMP agent connectivity
[15.10.2015 15:30:03] SNMP agent unreachable
...
[15.10.2015 15:30:05]       Current interface status is UNKNOWN
[15.10.2015 15:30:05]       Interface status cannot be determined
[15.10.2015 15:30:05]       Interface is UNKNOWN for 44 polls (1 poll required for status change)
[15.10.2015 15:30:05]       Interface status after poll is UNKNOWN
...
[15.10.2015 15:30:05] Checking ethernet connectivity...
[15.10.2015 15:30:05] Checking network path...
[15.10.2015 15:30:06] Node is unreachable
[15.10.2015 15:30:06] Finished status poll for node olt01.city01
[15.10.2015 15:30:06] Node status after poll is CRITICAL
[15.10.2015 15:30:06] **** Poll completed successfully ****


Получается, что при проверке по ICMP статус "NORMAL", а без неё - "CRITICAL". Хотя, по идее, должно быть наоборот. Как это понимать с точки зрения NetXMS (логику определения состояния)?

Спасибо!

Victor Kirhenshtein

Здравствуйте,

судя по

[15.10.2015 15:29:06] Checking SNMP agent connectivity
[15.10.2015 15:29:14] SNMP agent unreachable

SNMP для NetXMS сервера недоступен. Соответственно если ICMP включен, то нода отзывается на пинг, и сервер считает ее up. Если же ICMP отключить, то остается только SNMP, а он недоступен - соответственно сервер решает, что нода down.

mr.Z

Должно было быть именно так, как Вы описали. Но, во время приведённой проверки доступу к ноде не было вообще (она отключена в обеих случаях) - это как раз и странно.
В предыдущем выводе между опросами интерфейсов затерялась ещё одна строка - "Starting ICMP ping". То есть, при включенном опросе по ICMP, результат выглядит так:


[19.10.2015 09:39:19] **** Poll request sent to server ****
[19.10.2015 09:39:19] Poll request accepted
[19.10.2015 09:39:19] Starting status poll for node sw1.city01
[19.10.2015 09:39:19] Checking SNMP agent connectivity
[19.10.2015 09:39:27] SNMP agent unreachable
...
[19.10.2015 09:39:27]       Starting ICMP ping
...
[19.10.2015 09:39:33] Node is connected
[19.10.2015 09:39:41] Finished status poll for node sw1.city01
[19.10.2015 09:39:41] Node status after poll is NORMAL
[19.10.2015 09:39:41] **** Poll completed successfully ****


При этом, напоминаю, нода отключена от сети физически. Получается, что результат пинга или не учитывается вообще, или SNMP имеет больший приоритет, но поскольку результат опроса по SNMP отсутствует, то состояние ноды не изменяется.

И, если не сложно, что за проверка появляется при отключении ICMP?

[15.10.2015 15:30:05] Checking ethernet connectivity...
[15.10.2015 15:30:05] Checking network path...

mr.Z

Есть какие-то объяснения такого поведения? Вопрос актуальный.

Victor Kirhenshtein

Сегодня получили точно такую-же ситуацию еще в одной сети. Разбираемся, пока не ясно в чем проблема.

mr.Z

Спасибо. Если будут нужны какие-то дополнительные данные или тесты - мы в вашем распоряжении.

Victor Kirhenshtein

А можно прислать полный лог status poll'a? И если возможно, то лог сервера в этот момент с дебагом 6.
И на какой ОС сервер работает?

mr.Z

Логи во вложении.

Сервер (версия 1.2.17, кстати) работает на Debian 7.9.
Ядро: Linux nms01 2.6.32-42-pve #1 SMP Fri Oct 9 10:50:32 CEST 2015 x86_64 GNU/Linux

Victor Kirhenshtein

По логам выходит, что интерфейс VLAN801 остается в состоянии NORMAL, даже после ping'a. А какой адрес у этого интерфейса?

mr.Z

Это как раз управляющий VLAN для хоста. Его IP 172.31.1.18.

mr.Z

Можем ли мы ещё что-нибудь сделать для решения этого вопроса?