Есть подозрение, что данное событие срабатывает ложно, например на Juniper (роутере, коммутаторах) периодически на интерфейсах em, ge, lc, ae, ipip и прочее. Это порой уже начинает немного напрягать т.к. после этого прилетают SYS_IF_IP. Может быть эта проблема тесно связана с https://www.netxms.org/forum/oe-oo/ooe-aata-sys_if_up-sys_if_expected_down/ и https://www.netxms.org/forum/oe-oo/koe-eto/
А может просто сервер считает что snmp не ответил, хотя это не так. Связность и передача данных не нарушается при этом, проверял через разные snmp тестеры и net-snmp.
Есть так же действительно верная обработка данного события когда на самом деле SNMP агент не доступен и сервер не может узнать статус интерфейсов на удалённых коммутаторах доступа, но в примере выше это происходит постоянно.
Проблема может и не в самом сервере, я понимаю что его задача проверить статус и вернуть результат, но на основании чего он считает что SYS_IF_UNKNOWN?
Из того что можно покрутить в конфиге сервера:
QuoteSNMPRequestTimeout > Unfortunately this parameter does not affect SNMP agent status detection. It only affects interface status checks.
- было 2000, я поставил 3000, разницы особо нет.
QuotePollCountForStatusChange
- выставлять лично для каждого интерфейса не удобно.
2006877 29.08.2016 21:09:25 MX80 0 SYS_IF_UP Normal Interface 'ge-1/0/5' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 546) 0
2006875 29.08.2016 21:08:19 MX80 0 SYS_IF_UNKNOWN Warning Interface "ge-1/0/5" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 546)
Ну не может у него быть статус Unknown ни куда этот интерфейс не девался и не отключался.
Кто нибудь что-то подскажет ? Убрать ивент полностью не вариант.
С другого коммутатора:
1998274 28.08.2016 23:46:26 Prospect N.1 (112.13) 0 SYS_IF_UP Normal Interface '1/28' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 28) 0
1998266 28.08.2016 23:45:21 Prospect N.1 (112.13) 0 SYS_IF_UNKNOWN Warning Interface "1/28" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 28) 0
Что значит unknown, почему он был unknown, как увеличить время таймаута чтобы сервер не считал его unknown ?
А какие еще есть алармы про эту ноду в это время?
Можете собрать snmp и ICMP трафик tcpdump-ом, быть может там будут видны таймауты? У меня из проблем подобного рода осталась еще ситуация когда внезапно netxms решает что DCI Unsupported для какого то snmp oid. Я грешу на отвалы SNMP на коммутаторах где это происходит, но плотно не копал.
Quote from: 2c2i on August 30, 2016, 07:17:44 PM
А какие еще есть алармы про эту ноду в это время?
Да ни каких, в том то и дело.
2015869 30.08.2016 19:59:06 MX80 0 SYS_IF_UP Normal Interface 'fxp0 (mgmt_port)' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 1) 0
2015733 30.08.2016 19:58:01 MX80 0 SYS_IF_UNKNOWN Warning Interface "fxp0 (mgmt_port)" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 1) 0
1977412 26.08.2016 22:13:49 MX80 0 SYS_IF_UP Normal Interface 'ge-1/3/7.0' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 591) 0
1977410 26.08.2016 22:12:44 MX80 0 SYS_IF_UNKNOWN Warning Interface "ge-1/3/7.0" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 591) 0Есть коммутаторы ZyXEL где действительно SNMP глючное и UDP при опросах загоняет CPU в полку — там понятное дело такое часто, приходит сразу SYS_SNMP_UNREACHABLE и потом SYS_NODE_MAJOR SYS_IF_UNKNOWN или сразу SYS_NODE_MAJOR и SYS_IF_UNKNOWN с этими железками всё ясно и там были проблемы в других системах мониторинга к ним вопросов нет.
Но вот почему такое на Juniper (SYS_IF_UNKNOWN) - не понятно. Буду собирать и шутить, спасибо за наводку)