SYS_IF_UNKNOWN

Started by hsvt, August 29, 2016, 12:44:43 PM

Previous topic - Next topic

hsvt

Есть подозрение, что данное событие срабатывает ложно, например на Juniper (роутере, коммутаторах) периодически на интерфейсах em, ge, lc, ae, ipip и прочее. Это порой уже начинает немного напрягать т.к. после этого прилетают SYS_IF_IP. Может быть эта проблема тесно связана с https://www.netxms.org/forum/oe-oo/ooe-aata-sys_if_up-sys_if_expected_down/ и https://www.netxms.org/forum/oe-oo/koe-eto/

А может просто сервер считает что snmp не ответил, хотя это не так. Связность и передача данных не нарушается при этом, проверял через разные snmp тестеры и net-snmp.

Есть так же действительно верная обработка данного события когда на самом деле SNMP агент не доступен и сервер не может узнать статус интерфейсов на удалённых коммутаторах доступа, но в примере выше это происходит постоянно.

Проблема может и не в самом сервере, я понимаю что его задача проверить статус и вернуть результат, но на основании чего он считает что SYS_IF_UNKNOWN?

Из того что можно покрутить в конфиге сервера:

QuoteSNMPRequestTimeout > Unfortunately this parameter does not affect SNMP agent status detection. It only affects interface status checks.
- было 2000, я поставил 3000, разницы особо нет.

QuotePollCountForStatusChange
- выставлять лично для каждого интерфейса не удобно.




hsvt

2006877 29.08.2016 21:09:25 MX80 0 SYS_IF_UP Normal Interface 'ge-1/0/5' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 546) 0
2006875 29.08.2016 21:08:19 MX80 0 SYS_IF_UNKNOWN Warning Interface "ge-1/0/5" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 546)


Ну не может у него быть статус Unknown ни куда этот интерфейс не девался и не отключался.

Кто нибудь что-то подскажет ? Убрать ивент полностью не вариант.

С другого коммутатора:

1998274 28.08.2016 23:46:26 Prospect N.1 (112.13) 0 SYS_IF_UP Normal Interface '1/28' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 28) 0
1998266 28.08.2016 23:45:21 Prospect N.1 (112.13) 0 SYS_IF_UNKNOWN Warning Interface "1/28" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 28) 0


Что значит unknown, почему он был unknown, как увеличить время таймаута чтобы сервер не считал его unknown ?

2c2i

А какие еще есть алармы про эту ноду в это время?

2c2i

Можете собрать snmp и ICMP трафик tcpdump-ом, быть может там будут видны таймауты? У меня из проблем подобного рода осталась еще ситуация когда внезапно netxms решает что DCI Unsupported для какого то snmp oid. Я грешу на отвалы SNMP на коммутаторах где это происходит, но плотно не копал.

hsvt

Quote from: 2c2i on August 30, 2016, 07:17:44 PM
А какие еще есть алармы про эту ноду в это время?

Да ни каких, в том то и дело.

2015869 30.08.2016 19:59:06 MX80 0 SYS_IF_UP Normal Interface 'fxp0 (mgmt_port)' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 1) 0
2015733 30.08.2016 19:58:01 MX80 0 SYS_IF_UNKNOWN Warning Interface "fxp0 (mgmt_port)" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 1) 0

1977412 26.08.2016 22:13:49 MX80 0 SYS_IF_UP Normal Interface 'ge-1/3/7.0' changed state to UP (IP Addr: UNSPEC/0, IfIndex: 591) 0
1977410 26.08.2016 22:12:44 MX80 0 SYS_IF_UNKNOWN Warning Interface "ge-1/3/7.0" changed state to UNKNOWN (IP Addr: UNSPEC/0, IfIndex: 591) 0


Есть коммутаторы ZyXEL где действительно SNMP глючное и UDP при опросах загоняет CPU в полку — там понятное дело такое часто, приходит сразу SYS_SNMP_UNREACHABLE и потом SYS_NODE_MAJOR SYS_IF_UNKNOWN или сразу SYS_NODE_MAJOR и SYS_IF_UNKNOWN с этими железками всё ясно и там были проблемы в других системах мониторинга к ним вопросов нет.

Но вот почему такое на Juniper (SYS_IF_UNKNOWN) - не понятно. Буду собирать и шутить, спасибо за наводку)