News:

We really need your input in this questionnaire

Main Menu
Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Messages - Victor Kirhenshtein

#7426
General Support / Re: CPU load and utlization
February 12, 2008, 10:17:43 AM
You mean just divide value to a constant number of processors? Currently you can do it on server side by using transformation script in DCI. If you have two processors, your transformation script can look like this:


$1 / 2


Drawback of this method is that you cannot create an universal template which can be used on machines with different number of CPUs, because CPU number is hard coded as a constant.

Best regards,
Victor
#7427
General Support / Re: CPU load and utlization
February 11, 2008, 10:57:35 PM
Hello!

CPU load is an average length of processor queue (number of processes ready for execution but waiting for free CPU time slot) for last minute. This measure is widely used in UNIX world, often called "load average".

Best regards,
Victor
#7428
Hello!

It's already implemented - in Object Browser select Object -> View -> Hide unmanaged leaf objects.

Best regards,
Victor
#7429
Process.UserTime and Proccess.KernerlTime is a total amount of time spent by process in appropriate mode. It's a always-increasing counters. You can collect perfmon counters via either PDH.CounterValue parameter or by defining new parameters via Counter in *WinPerf section of agent's configuration file.

Best regards,
Victor

P.S. Look at this message for some more information about creating agent parameters from PDH counters:
https://www.netxms.org/forum/index.php/topic,88.msg381.html#msg381
#7430
General Support / Re: System.Uptime Calculation
February 08, 2008, 04:45:32 PM
Hello!

If I understand your correctly, you need to calculate percentage of server's uptime (or normal operation) for a month. You can use two approaches:
1) scan collected data of System.Uptime parameter - while it's growing, it means that system is up. Gap in values means that system was down - so you need to calculate the amount of time passed between high and low value. For example, if System.Uptime history looks like this:

...
11:00:00 10000
11:01:00 10060
11:04:00 7
11:05:00 67
...

it means that server was down for about 3 minutes. So you sum all gap intervals, and then calculate uptime percentage using formula gap_interval_sum / total_seconds_in_month * 100 if you measure gap intervals in seconds.

2) Second approach is similar, but you scan event log for SYS_NODE_DOWN and SYS_NODE_UP events, and sum intervals between them. This method is less reliable then first one, because SYS_NODE_DOWN may be generated if, for example, NetXMS server loses connectivity with the server, while server still up and running. It's up to you to decide what should be considered uptime and what - downtime.

Best regards,
Victor
#7431
Общие вопросы / Re: SNMP + switch
February 08, 2008, 12:48:21 PM
Про долгие проверки каждого интерфейса - это баг. А в лог они попадают в одно время с SYS_NODE_DOWN поскольку их придерживает механизм корреляции событий - чтобы можно было все SYS_IF_DOWN скоррелировать с SYS_NODE_DOWN и через event policy пропустить только SYS_NODE_DOWN.
#7432
Там чисто технические проблемы, но сделать надо. Кстати Windows агент такие процессы принудительно завершает.
#7433
Да, поддержка формата Cisco уже включена в 0.2.20.
#7434
Quote from: weec on February 08, 2008, 10:00:13 AM
Quote from: Victor Kirhenshtein on February 07, 2008, 11:30:11 PMzdem etot timeout, esli ne poluchili dannie - schitaem chto proizoshla oshibka i perehodim k sledujuschemu DCI.
тобишь процесс порожденный DCI для получения данных статистики будет уничтожен по достижению таймаута
я правильно понимаю?

Нет, не будет. На агенте все будет продолжать работать, просто сервер не будет ждать результатов. Он и раньше должен был так делать, но был баг, который ему мешал :) Я сейчас переделываю также и агента, чтобы он не ждал долго работающие процессы вызванные для ExternalParameter.
#7435
А если присылают два устройства из разных зон - всегда показывать timestamp как он был прислан?
#7436
Davaj na primerah, a to opjat' zaputaemsja :) S ustrojstva prihodit timestamp skazem 14:10:00, u menja timezona GMT+3 i lokal'noe vremja 17:10:00. Chto pokazat' v syslog browsere - 14:10:00 ili 17:10:00?
#7437
Ispravil problemu s DCI kotorie vizivajut timeout. Teper' server dolzen ih normal'no obrabativat'. Takze pojavilsja novij parametr - AgentCommandTimeout, po omolchaniju 2 secundi. Kogda sobiraem znachenija s agenta, zdem etot timeout, esli ne poluchili dannie - schitaem chto proizoshla oshibka i perehodim k sledujuschemu DCI.
#7438
Quote from: weec on February 07, 2008, 02:48:35 PM
изменил количествo  poller-ов c 10 до 1000
перезапустил netxmsd, не могу подключиться win-консолью, сервис не забиндил порт

Похоже что какие-то ресурсы закончились. Каждый поллер - это отдельный поток. Не может бать каких-то ограничений на количество потоков в процессе?
#7439
Quote from: weec on February 07, 2008, 10:16:59 AM
содержимое config.h
/* Define to 1 if you have the `gmtime_r' function. */
#define HAVE_GMTIME_R 1

/* Define to 1 if you have the `iconv' function. */
/* #undef HAVE_ICONV */

/* Define to 1 if iconv supports ASCII */
#define HAVE_ICONV_ASCII 1

для версии 0.2.19 выкладывался патч
почему ошибка с ICONV не исправлена в 0.2.20 RC1 ?

Она исправлена. Наверняка в config.h присутствует

#define HAVE_LIBICONV 1


а дальше правильная функция выбирается уже в unicode.cpp.
#7440
Quote from: weec on February 07, 2008, 10:16:59 AM
при инициализации новой базы выводит ошибку
# mysql -p netxms < dbinit_mysql.sql
Enter password:
ERROR 1064 (42000) at line 342: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'integter not null,
situation_instance varchar(255) not null,
PRIMARY KEY(rule_' at line 12


Спасибо, исправил. В аттаче исправленные скрипты для инициализации.