Как считается статус объекта?

Started by seaman, May 25, 2015, 03:30:27 PM

Previous topic - Next topic

seaman

Добрый день.
Мониторю шлюз. Шлюз перестал пинговаться и netxms исправно пометил его как critical. Вроде все нормально. Однако после того как шлюз опять начал пинговаться объект не перешел в статус normal. Ручной status poll выдает следующее:
Quote[25.05.2015 14:38:59] **** Poll request sent to server ****
[25.05.2015 14:38:59] Poll request accepted
[25.05.2015 14:38:59] Starting status poll for node Шлюз VoIP (IP: 10.73.4.99)
[25.05.2015 14:38:59]    Starting status poll on interface unknown
[25.05.2015 14:38:59]       Current interface status is NORMAL
[25.05.2015 14:38:59]       Starting ICMP ping
[25.05.2015 14:38:59]       Interface is NORMAL for 3 polls (1 poll required for status change)
[25.05.2015 14:38:59]       Interface status after poll is NORMAL
[25.05.2015 14:38:59]    Finished status poll on interface unknown
[25.05.2015 14:38:59] Node is connected
[25.05.2015 14:38:59] Finished status poll for node Шлюз VoIP (IP: 10.73.4.99)
[25.05.2015 14:38:59] Node status after poll is CRITICAL
[25.05.2015 14:38:59] **** Poll completed successfully ****

Вот отсюда и вопрос: какой логикой руководствуется netxms, когда назначает объекту статус critical?

kozlov_ao

CRITICAL назначается для всей ноды, если хотя бы что то на ней висит с соответствующим статусом (интерфейс, DCI, etc.)

seaman

Если я правильно понял, то "Status" это и есть DCI. Вот собственно и вопрос в том, на основании каких параметров этому DCI присваивается статус critical?
p.s. На этом объекте у меня есть только интерфейс, который пингуется, и DCI "status" в состоянии critical. Больше ничего нет.

kozlov_ao

Нет. DCI - это метрика, мониторинговый параметр и т.д.
Пришли скрин с развернутой нодой и открытой вкладкой Last Values в момент когда имеется проблема.

kozlov_ao

а.. только сейчас дошло, про какой ты "Status"... Да, можно сказать и так, это он. но тем не менее - высылай скрин ))

seaman

ну собственно вот и скрин

kozlov_ao

Прикольно. А в Alarm что есть? Event Processing Policy изменял?

seaman

Event Processing Policy менял. скрины прилагаю.
В алармах висит этот объект, с надписью node down

kozlov_ao

#8
Я бы обратил внимания на 2 момента:
1. Попадает ли нода в группу: 01. Сетевое и серверное оборудование?
2. Если да, то аларм сгенерировался до изменения EPP или после (или так: менялась ли структура дерева объектов после возникновения аларма, но до поднятия ноды)?

Советую убить аларм в ручную  и сымитировать ситуацию.

seaman

1. Да нод именно в этой группе.
2. структура EPP не менялась после возникновения аларма.

ок. попробую сымитировать ситуацию