Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Messages - nrg

#1
Quoteнапример часто бывает такое из-за слабого сигнала или постоянного включения отключения электричества на узле - коммутатор(нода) будет пинговаться с потерями и задержками, но при этом NetXMS не увидит что с ней какие то проблемы, либо увидит но не каждый раз.

   Я повешал на Ping time of {instance} 2 threshold-а, один срабатывает, когда время отклика превышает 1200 мс, второй отслеживает data collection error. Соотв. когда штормит срабатывает threshold при превышении 1200 мс, когда совсем все плохо data collection error. Это работает довольно стопудово, у меня много нодов на 3G, так что у меня это ситуация частая. Печально что ситуация отражается только в эвентлоге и алармах, визуально на графиках у меня не работает нигде, не только в Perfomance Tab.
   Может можно исправить ситуацию созданием скриптового параметра, который при удачном пинге всегда выдаёт некоторое число, напрмер 2000, при неудачном 0, далее накладывать график этого параметра на график Ping time of {instance}. Еще не ковырял в эту сторону, но другого метода обхода бага я не вижу.
#2
QuoteUPD. Тоже озадачился этим вопросом, какие Operation и Value используете чтобы мониторить потери на ноде ? На графиках удалось добиться изображения тресхолдов?

    Нет, этого мне сделать не удалось, опять вернулся к данному вопросу и наткнулся на свой же пост.

QuoteНо на проблемные ноды всё равно как то не понятно срабатывает.

Настройка threshold-а у меня следующая:

Function: "Data collection error:
Samples: "1"
Operation: "== equal to"
Value: "<<ERROR>>"

Все работает корректно, генерятся event-ы и alarm-ы, но threshold-ы в графиках так и не видно. Может Вам за это время удалось победить?


P.S. Версия netxms 2.0 RC2

Поковырял багтрекер:
https://dev.raden.solutions/issues/54

Если я правильно понял, багу 3 года...
#3
Может событие NODE_DOWN не успевает сгенериться, с настройками не игрались?
#4
   А ноду на доступность пингом проверяли? Critical это статус, по умолчанию даже если один интерфейс принимает состояние DOWN, нода примет состояние CRITICAL
#5
Общие вопросы / nxshell terminate alarm
September 30, 2015, 07:39:24 AM
    Всем привет!
    Подскажите плз. как удалять alarm-ы через nxshell? Перерыл java api но так и не нашел. В nxsl есть, но нужно именно в nxshell
#6
Благодарю, Виктор! Навешал threshold-ы на data collection error, теперь хотя бы вижу, когда пропадают пакеты. Осталось непонятным как это отразить на графике? Из него не видно когда были потери пакетов, включал флаг Show thresholds в настройках графика (properties->data sources->modify->show tresholds), но ничего не происходило, если сходить опять в ту настройку флаг show trecholds оказывается отключеным. Я что-то опять не так делаю? Или баг?
#7
Прицепил диаграмму сети для лучшего понимания.

У всех маршрутизаторов есть 2 сети, зеленая и оранжевая. На данный момент как я писал netxms цепляется к loopback-интерфейсам маршрутизаторов. Но Loopback-и напрямую зависят от состоянии маршрутизации и работы OSPF, в случае проблем с последней я буду видеть что ноды в дауне, не смотря на то что на самом деле каналы живы. Задача оценивать состояние каналов, мне показалось логичным решить ее именно так, и все бы хорошо, если бы я мог вразумить xms воспринимать временное отсутвие данных в DCI Ping of time. На сколько мне известно DCI отрабатыет в момент опроса статуса ноды?

Прицепил график DCI Ping of Time. Нода ушла в даун в 11:40:27, вернулась в 11:41:06. На графике видно в этот момент ту самую прямую. В history отсутствие данных. Сам по себе DCI работает.
#8
    DCI располагаются на нодах, ноды мониторятся по snmp, агентов на них нет. А как быть если нод очень много (сотни)? При этом у ноды минимум 2 канала, за резервирование отвечает OSPF, в качестве primary ip ноды используется loopback-интерфейс ноды, который так же анонсируется по OSPF. Вот я и хотел создать template с ping of time {instance}, где instance интерфейсы ноды для каждого канала, а в template потом закинуть все ноды (благо они однотипные).
#9
    Всем привет!
    Помогите разобраться. Навешал на ноды DCI Ping of time {instance} через template, poller interval 5 сек., глобальный параметр сервера StatusPollerInterval = 10. Где то читал что при таймаутах в DCI данного типа возвращается значение 10000, начал замечать что такой ситуации никогда не возникает, хотя ноды с этими DCI не раз уходили в down. При разборе таких ситуаций видно, что в history на периоды down-ов отсутвуют данные, на графиках в это время прямая, которая соединяет последнее значение пинга на момент, когда нода пинговалась и следующее после down-а. Возможно это корректное поведение данного типа DCI, но хотелось бы как то отлавливать такие ситуации, привязать к ним treshold, alarm или что-то вроде этого. Может можно как то в transformation script-е фиксировать отсутвие данных, преобразовывать в те же 10000 или 0, и уже к этим значениям привязывать threshold-ы? Или существуют другие пути?

версия 2.0 M2
#10
    Понял о чем речь. Благодарю за ответ.
#11
    Всем привет
    Помогите советом. Имеется много Mikrotik-ов, необходимо снимать инфу с интерфейсов ppp0, а именно необходимо подчитывать объем трафика на этих интерфейсах за определенный период. Mikrotik-и persistent ifindex не умеют, по этому при разрыве PPP-сессии велика вероятность смены OID-а у интерфейса, да и на данный момент OID-ы PPP-интерфейсов разные. Каким образом можно реализовать такую штуку наилучшим образом? И можно ли вообще?
#12
Премного благодарен! Модули подгрузились, xlwt работает, уже проверил, до xlrd пока не добрался.
#13
    Привет всем!
    Начал вникать в nxshell, да, собственно и в сам python, но столкнулся с проблемой. Возникла необходимость использовать подули xlwt и xlrd для генерации отчетов в формате Excel, но nxshell не видит эти модули. Пытаюсь ипортировать эти модули, на что nxshell отвечает:

Traceback (most recent call last):
  File "/home/nrg/workspace/nodes/zone_oper.py", line 4, in <module>
    import xlrd,xlwt
ImportError: No module named xlrd

Сами модули установлены и в голом питоне прекрасно импортируются:

$ python
Python 2.7.3 (default, Mar 13 2014, 11:03:55)
[GCC 4.7.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import xlwt,xlrd
>>>

Может ли вообще nxshell использовать сторонние модули? Может я что-то делаю не так?

Гугл особо не обнадёжил, по nxshell вообще информации крайне не много. Заранее извиняюсь если вопрос тривиальный, я не программист, не судите строго.

nxshell-2.0-M2
#14
Приветствую!

Возникла проблема с добавлением нового параметра SNMP для устройства. Делал следующее:

1) Подключил устройство по протоколу SNMP. NetXMS вытащил сетевые интерфейсы.
2) Создал Data Collection для интересующих интерфесов и построил графики.
3) Создаю новый параметр SNMP и пытаюсь выбрать параметр кнопкой Select. Открывается окно Select MIB Object и за ним сразу вылазит окно с ошибкой: An error has occurred. See error log for more details.
java.lang.NullPointerException. Пробывал разные варианты, делал duplicate рабочего параметра, но стоит нажать кнопку Select как опять вываливается это сообщение. Если при этом сделать выбор того же самого OID-а, то при применении он становится UNSUPPORTED. Так же пробывал просто вставить OID без выбора, в результате параметр так же становится UNSUPORTED. Вышеописанное пробовал как с GTK-клиента, так и с WEB, результат одинаковый.

У кого то еще наблюдается подобное?

OS: Debian Squeeze
NetXMS: 1.2.5
WEB Console: 1.2.5
GTK Console 1.2.5
WEB Server: Jetty 6.1.24-6 из репозитария
MySQL: 5.1.66 из репозитария
Java: openjdk-6-jre 6b18-1.8.1 из репозитария