Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Messages - Victor Kirhenshtein

#7036
Общие вопросы / Re: 0.2.23-rc3
October 07, 2008, 11:40:31 PM
Quote from: Anth0ny on October 07, 2008, 02:10:11 PM
о проблемах: не разлистывается каталог - https://www.netxms.org/download/rc
а точное имя файла не известно... как ж его скачать? =)

ispravil
#7037
Teper' ponjatno. Pohoze chto na connect timeout dovol'no bol'shoj, poetomu soedinenija visjat, t.e. s tochki zrenija agenta zapros na znachenie parametra do konca ne obrabotan. Po umolchaniju agent prinimaet ne bolee 32 odnovremennih zaprosov. Ja k sledujuschemu relizu razberus' s timeout'ami pri proverke servisov, poka chto v kachestve workaround mozno sdelat' dve veschi:

1. Na agente, gde zagruzen portCheck.nsm, dobavit' parametr MaxSessions = 256 (ili drugoe bol'shoe chislo vplot' do 1024).
2. Dobavit' esche odin threshold na parametr ServiceCheck.HTTP na oshibku sbora dannih - togda mozno budet uznavat' o takih problemah. Ponjatno chto oshibka sbora DCI ne oznachaet chto service ne rabotaet, mogut bit' i drugie prichini, no po krajnej mere budet vidno chto kakie-to problemi est'.
#7038
Общие вопросы / 0.2.23-rc3
October 06, 2008, 08:07:30 PM
Выложил версию 0.2.23-rc3 в https://www.netxms.org/download/rc для желающих потестировать мониторинг логов.
Добавлена возможность:
1. проверять сообщения, принимаемые встроенным syslog сервером на соответствия шаблонам и создавать события при соответствии;
2. через агента проверять записи в текстовых логах на соответствия шаблонам и создавать события при соответствии;
3. на Windows - то-же самое для Windows Event Log.

Для 1. надо обновить сервер, для 2 и 3 достаточно поставить новых агентов.

Как настраивать монтторинг логов через агента:

1. Создать необходимые события (через Control Panel -> Events);
2. В конфиге агента добавить загрузку субагента logwatch.nsm (libnsm_logwatch.so на UNIX);
3. Для каждого лога добавить запись вида Parser = config_file в секции LogWatch. Например так:


*LogWatch
Parser = /opt/netxms/etc/log_1.xml
Parser = /opt/netxms/etc/log_2.xml


4. Создать конфиги парсеров. Каждый конфиг - это отдельный XML файл следующего формата:

<parser>
   <file>file_name</file>
   <rules>
      <rule>
         <match>regexp</match>
         <event params="n">event_code</event>
      </rule>
      ...
   </rules>
</parser>

Таг <rule> можно повторять сколько необходимо. Аттрибут params в таге event указывает, сколько подстрок (обозначенных в regexp'e скобками) надо передать как параметры события (их потом можно использовать через макросы %1, %2, ...). Если параметров нет, то фттрибут events можно не указывать.
Для мониторинга Windows event logs вместо имени файла надо указывать *log_name, например *System

Примеры:

1. Послать событие с кодом 1000 если в строке лога найдено слово "error":
<rule>
   <match>error</match>
   <event>1000</event>
</rule>

2. Послать событие с кодом 2000 если строка начинается со слова "warning:", при этом текст после "warning:" передать как параметр:

<rule>
   <match>^warning: (.*)</match>
   <event params="1">2000</event>
</rule>
#7039
Понятно. Проблема в том, что на Windows вместо аббревиатуры подставляется название зоны, которое потом никто не может распознать. Исправим.
#7040
Буду сегодня вечером все это анализировать. Очень жду логи...
#7041
Looks like a bug in WMI subagent. I'll check it today.
#7042
Quote from: Anth0ny on October 06, 2008, 11:37:40 AM
запускать на сервере мониторинга?

да
#7043
Само по себе большое количество объектов блокировки вызывать не должно. А вот несколько недоступных узлов могут. Я просматривал код, связанный с этими блокировками - еще одна возможная причина - медленная работа базы данных одновременно с наличием большого количества измененных объектов (напримет после изменений в топологии сети, добавления новых узлов, изменения в шаблонах).
#7044
There are not too much information about WMI support in NetXMS unfortunately. Brief discussion are here: https://www.netxms.org/forum/index.php/topic,389.0.html.

Best regards,
Victor
#7045
Quote from: Anth0ny on October 03, 2008, 12:13:16 PM
Интерес не праздный: столкнулся вчера со странной проблемой. По неясной мне пока причине вчера на двух серверах наблюдал странную картину, возможно схожую с твоей...

2 одинаковых сервера, опрос одинаковых сервисов ведётся через ServiceCheck.HTTP.

Так вот, в какой-то момент времени я вдруг обнаружил, что опрос приостановился, т.е. в истории полученных результатов начиная со времени "Х" виден перерыв, минут на 40 (интервал опроса- 300 секунд), до следующего полученного результата опроса, "У". Причём что самое странное, одновременно (примерно, учитывая сдвиги между поллами) на обоих серверах. Я не могу пока понять что это. И это не очень приятно, так как именно на этот самый промежуток пришлось падение www-сервиса на одном из этих серверов...

U ob'ekta servera monitoringa dolzen bit' DCI pod nazvaniem "Average length of data collection poller's request queue for last minute" - kak on menjalsja v eto vremja?
#7046
Item poller - eto potok, kotorij otvechaet za postanovku DCI v ochered' na sbor dannih. On perestaet otvechat' iz-za vnutrennih blokirovok - t.e. kakoe-to dejstvie s ob'ektom uzla sil'no zatjanulos', i vse ostal'nie, v tom chisle item poller, zdali svoej ocheredi na dostup k etomu ob'ektu. V normal'noj situacii takogo proishodit' ne dolzno.

A mozno vkljuchit' 6 uroven' debug'a dljanetxmsd i prislat' mne log?

Best regards,
Victor
#7047
Updated libnxsl.dll.

Best regards,
Victor
#7048
Quote from: Victor Kirhenshtein on October 02, 2008, 11:21:24 PM
Hi!

Quote from: Lostavar on October 02, 2008, 10:15:03 PM
1) Is it possible to send alerts using a time-schedule?
For example it want E-Mail notification Monday-Friday to person A, on Saturday and Sunday to person B.

Yes, you can create two rules with different e-mail actions, and use filtering script in each rule to match Monday-Friday or Saturday-Sunday. Script to match Monday-Friday will look like following:


sub main()
{
t = localtime();
return (t->wday >= 1) && (t->wday <= 5);
}


Best regards,
Victor


Just discovered that due to a bug attribute wday is not accessible. To fix it, replace file src/libnxsl/functions.cpp with attached one and recompile NetXMS server. If your server running on Windows, ask me and I'll post recompiled libnxsl.dll.

Best regards,
Victor
#7049
Hello!

There are no limitations of having both NetXMS and SNMP agent on one host. If you see SNMP agent as inactive, most likely you have problems with SNMP settings. Most common problems are:

1. SNMP community string is incorrect
2. NetXMS server is not allowed to communicate with SNMP agent (many SNMP agents can be configured to accept requests only from specific addresses)
3. SNMP traffic between NetXMS server and host is blocked by firewall

Best regards,
Victor
#7050
Quote from: Lostavar on October 02, 2008, 10:15:03 PM
2) How can I add values from different DCIs to one alert?
For example I have a threshold for percentage of disk usage. But in the alert message I want to see a) percentage used, b) absolutely used space (GB) and c) total amount of disk space.

There are no easy way to achieve that - only via scripting. In message text, you can use %[..] macro, which will be substituted by value returned by given script. To use script in such macro, you should create it in script library (Control Panel -> Script Library).
In the script, you can use FindDCIByName or FindDCIByDescription and GetDCIData functions to retrieve data of some other DCIs.

For example, script wchich will return total amount of disk space on root partition will look like this (assuming thet you have configured appropriate DCI):


GetDCIValue($node, FindDCIByName($node, "Disk.Total(/)"))


Best regards,
Victor