Создается впечатление что обработка ивентов происходит "не сразу", например:
получены ивенты:
2540416 02.09.2015 21:49:54 AGG-campus-4 SYS_NODE_WARNING Warning Node status changed to WARNING 0
2540178 02.09.2015 21:39:48 AGG-campus-4 SYS_IF_PEER_CHANGED - пропушено несколько в этом листинге
2539944 02.09.2015 21:27:23 AGG-campus-4 SYS_THRESHOLD_REARMED Normal Threshold rearmed for data collection item Inbound error rate on 1/21 (UPL to ONUA) (errs/min) (Parameter: .1.3.6.1.2.1.2.2.1.14.21) Threshold rearmed for data collection item Inbound error rate o 0
2539939 02.09.2015 21:25:23 AGG-campus-4 SYS_THRESHOLD_REACHED Warning Threshold reached for data collection item "Inbound error rate on 1/21 (UPL to ONUA) (errs/min)" (Parameter: .1.3.6.1.2.1.2.2.1.14.21; Threshold value: 0; Actual value: 4) Threshold reached for data collection item "Inbound error rate 0
В евент процессинг полиси из экшнов - только установка аларма и отсылка письма + xmpp сообщения.
Алармы установленные при обработке ивентов:
59214 Terminated Ignored AGG-campus-4 Warning Warning SYS_THRESHOLD_REACHED Threshold reached for data collection item "Inbound error rate on 1/21 (UPL to ONUA) (errs/min)" (Parameter: .1.3.6.1.2.1.2.2.1.14.21; Threshold value: 0; Actual value: 4) 1 02.09.2015 22:08:50 02.09.2015 22:09:31 admin admin admin DC_THRESHOLD_0x000005A6_0x000004DD
Таким образом выходит что ивент SYS_THRESHOLD_REACHED был сгенерирован в 02.09.2015 21:25:23, далее был сгенерирован ивент SYS_THRESHOLD_REARMED в 2539944 02.09.2015 21:27:23.
То есть абстрактно говоря проблема длилась с 02.09.2015 21:25:23 по 02.09.2015 21:27:23.
Однако аларм DC_THRESHOLD_0x000005A6_0x000004DD был установлен в 02.09.2015 22:08:50 и терминирован в 02.09.2015 22:09:31, то есть через 40 минут.
В теле письма которое оповещало о аларме тоже стоит время 21:25:23 - то есть дата ивента, а отослано оно было в 22:08:50.
Кроме того иногда происходят подвисания при сохранении конфигурации чего либо через интерфейс - при сохранении Actions configurations, Event processing policy, я получаю request processing timeout.
Если в это время написать команду в Server Console - она тоже не обрабатывается.
Версия сервера: 2.0-RC1
netxmsd: show q
Data collector : 0
DCI cache loader : 0
Database writer : 0
Database writer (IData) : 0
Database writer (raw DCI values) : 0
Event processor : 0
Node poller : 0
Syslog processing : 0
Syslog writer : 0
netxmsd: show stats
Total number of objects: 3756
Number of monitored nodes: 117
Number of collectable DCIs: 2798
sh po показывает поллинг 1-2 объектов ( как я понимаю это норма).
top на сервере не показывает какой либо аномальной активности
Что может влиять на задержку обработки ивентов?
А лог сервера пишется? Если нет, попробуйте поставить debug level 6 или выше, и пришлите лог сервера от получения ивента до генерации аларма.