Проблеммы с Treshhold

Started by andrey--k, June 10, 2014, 01:10:59 PM

Previous topic - Next topic

andrey--k

Создал 2 трешхолда.
1й == 2
2й != 2

При смене показателя по snmp и перехода из Major в Normal значения трешхолда меняются на значения OID.
Следующий положительный трешхолд уже нормальный.
В истории dci все в порядке.
Лог в момент происшествия:

[10-Jun-2014 12:01:19.794] [DEBUG] EVENT 100001 (ID:4533657 F:0x0001 S:0 TAG:"") FROM I0______: Mail data collection item "rttMonCtrlOperTimeoutOccurred 81101" (Parameter: 1.3.6.1.4.1.9.9.42.1.2.9.1.6.81101; Threshold value: 0x00001B05; Actual value: 81101)
[10-Jun-2014 12:01:19.794] [DEBUG] *actions* Action 2 (emailDeveloper) is disabled and will not be executed
[10-Jun-2014 12:01:19.794] [DEBUG] *actions* Executing action 3 (EmailASOP2) of type SEND EMAIL
[10-Jun-2014 12:01:19.794] [DEBUG] *actions* Sending mail to ____@________: "Target: 1.3.6.1.4.1.9.9.42.1.2.9.1.6.81101
Device: I0______
IP: 0.0.0.0
Alert: rttMonCtrlOperTimeoutOccurred 81101
State: Normal
Value: 81101
Thresholds: Normal:0x00001B05
LastCheck: 10-Jun-2014 12:01:19"


Как можно исправить?

kozlov_ao

раз 5 прочитал, но не понял что не так и что вы итоге нужно :)

andrey--k

Value должно принимать значения 1 или 2.
А тут, при смене с Major в Normal меняется на значение OID(81101).

Как-то совсем некрасиво :(

kozlov_ao

Покажи настройки Tresholds и Transformation script

andrey--k

Transformation скрипт отсутствует.
Скриншот трешхолдов в аттаче.

kozlov_ao

может быть я что то недопонимаю, но почему не пойти по такому пути:
1. создать только 1 treshold, проверяющий последнее значение на !=2 и к нему зацепить 2 эвента - активации и деактивации. По сути, в такой конфигурации (как есть сейчас), они получаются у тебя взаимоисключающими
2. сделать transformation script типа такого:

if ($1 == TRUE_VALUE)
return 2;
else
return $1;

kozlov_ao

Сорри, протупил. Т.е. проблема в том, что при определенных обстоятельствах вместо значения вставляется OID?

andrey--k

Да.
И я пока не понимаю почему :(

kozlov_ao

А для чего создано 2 трешхолда? Попробуй с одним, как я описал выше. Не думаю, что это поможет, но нагрузка упадет, т.к. серверу не нужно будет обрабатывать одну и ту же информацию дважды.

andrey--k

Сейчас попробую.
Вопрос лишь, будут ли создаваться alarm в обоих случаях?

kozlov_ao

ну как.. при совпадении условия - активация. при несовпадении - деактивация )) должно работать :)

andrey--k

Поменял, теперь приходит event Major с ошибкой :(

Что может быть?

в аттаче скриншоты:
ошибка
лог по dci  с ошибкой
конфигурация threshold

andrey--k

Настроил мониторинг памяти, используя встроенные "sys_threshold_reached,sys_threshold_realmed".
Настроил отправку уведомлений на почту.
Та же ошибка возникает. :(

Преход в критическое состояние:
Target: Dummy
Device: _________
IP: ________
Alert: hrPhysicalMemoryUsedPercent
State: Warning
Value: 96.798620
Thresholds: Warning:95
LastCheck: 11-Jun-2014 15:09:51

Возврат в обычное, используя тот же шаблон:
Target: Dummy
Device: ___________
IP: ____________
Alert: hrPhysicalMemoryUsedPercent
State: Normal
Value: .1.3.6.1.2.1.25.2.1.2
Thresholds: Normal:0x00002338
LastCheck: 11-Jun-2014 15:45:51

andrey--k

У кого-либо возникают подобные ошибки?