Добрый день.
Мониторю шлюз. Шлюз перестал пинговаться и netxms исправно пометил его как critical. Вроде все нормально. Однако после того как шлюз опять начал пинговаться объект не перешел в статус normal. Ручной status poll выдает следующее:
Quote[25.05.2015 14:38:59] **** Poll request sent to server ****
[25.05.2015 14:38:59] Poll request accepted
[25.05.2015 14:38:59] Starting status poll for node Шлюз VoIP (IP: 10.73.4.99)
[25.05.2015 14:38:59] Starting status poll on interface unknown
[25.05.2015 14:38:59] Current interface status is NORMAL
[25.05.2015 14:38:59] Starting ICMP ping
[25.05.2015 14:38:59] Interface is NORMAL for 3 polls (1 poll required for status change)
[25.05.2015 14:38:59] Interface status after poll is NORMAL
[25.05.2015 14:38:59] Finished status poll on interface unknown
[25.05.2015 14:38:59] Node is connected
[25.05.2015 14:38:59] Finished status poll for node Шлюз VoIP (IP: 10.73.4.99)
[25.05.2015 14:38:59] Node status after poll is CRITICAL
[25.05.2015 14:38:59] **** Poll completed successfully ****
Вот отсюда и вопрос: какой логикой руководствуется netxms, когда назначает объекту статус critical?
CRITICAL назначается для всей ноды, если хотя бы что то на ней висит с соответствующим статусом (интерфейс, DCI, etc.)
Если я правильно понял, то "Status" это и есть DCI. Вот собственно и вопрос в том, на основании каких параметров этому DCI присваивается статус critical?
p.s. На этом объекте у меня есть только интерфейс, который пингуется, и DCI "status" в состоянии critical. Больше ничего нет.
Нет. DCI - это метрика, мониторинговый параметр и т.д.
Пришли скрин с развернутой нодой и открытой вкладкой Last Values в момент когда имеется проблема.
а.. только сейчас дошло, про какой ты "Status"... Да, можно сказать и так, это он. но тем не менее - высылай скрин ))
ну собственно вот и скрин
Прикольно. А в Alarm что есть? Event Processing Policy изменял?
Event Processing Policy менял. скрины прилагаю.
В алармах висит этот объект, с надписью node down
Я бы обратил внимания на 2 момента:
1. Попадает ли нода в группу: 01. Сетевое и серверное оборудование?
2. Если да, то аларм сгенерировался до изменения EPP или после (или так: менялась ли структура дерева объектов после возникновения аларма, но до поднятия ноды)?
Советую убить аларм в ручную и сымитировать ситуацию.
1. Да нод именно в этой группе.
2. структура EPP не менялась после возникновения аларма.
ок. попробую сымитировать ситуацию