RE: Re: RE: Время обновления информации по DCI

From: Victor Kirhenshtein <victor_at_DOMAIN_REMOVED>
Date: Sat, 7 Oct 2006 00:51:35 +0300

Poka chto vidno chto ochered' na data collection ochen' bol'shaja, chto oznachaet chto vse DCI ne mogut bit' oprosheni vovremja - otsjuda I prigajuschie intervali mezdu sobrannimi dannimi. Etomu mozet bit' neskol'ko prichin, vobschem-to pohozih drug na druga:

1. Kolichestvo hostov I DCI prosto sil'no viroslo - nado posmotret' skol'ko hostov I skol'ko data pollerov. Kolichestvo hostov I DCI mozno posmotret' cherez nxadm -c "sh st". Kolichestvo data pollerov zadaetsja parametrom servera NumberOfDataCollectors. Stoit ego uvelichit'.

2. Kakoi-to iz hostov (ili neskol'ko hostov) medlenno otdaet znachenija DCI, no pri etom sistema ne schitaet ego nedostupnim. Sistema stavit DCI v ochered' na polling, no vse polleri podolgu zanjati takimi problemnimi DCI.

Poka-chto mozno probovat' uvelichit' kol-vo pollerov I smotret' chto poluchitsja. I ja esche raz proverju kak proishodit smena IP adresa u hosta.

Best regards,
Victor

> -----Original Message-----
> From: Lobahin Ilya [mailto:ex_corsar_at_mail.ru]
> Sent: Friday, 06 October, 2006 19:59
> To: NetXMS Users - Russian
> Subject: [netxms-users-ru] Re: [netxms-users-ru] RE:
> [netxms-users-ru] Время обновления информации по DCI
>
>
>
> Здравствуйте NetXMS Users - Russian!
> 5 октября 2006 г. вы писали.
>
>
> VK> Ochen' interesno...
>
> VK> Mozno bilo bi prislat' sledujuschuju infu?
>
> VK> 1. Na konsoli NetXMS servera, rezul'tati vipolnenija:
> VK> nxadm -c "sh po"
> --------------
> PT TIME STATE
> S 06/Oct/2006 20:38:07 wait
> S 06/Oct/2006 20:37:47 wait
> S 06/Oct/2006 20:38:43 wait
> S 06/Oct/2006 20:38:32 wait
> S 06/Oct/2006 20:38:22 wait
> S 06/Oct/2006 19:50:14 poll: APG [58] - wait for lock
> S 06/Oct/2006 20:37:27 wait
> S 06/Oct/2006 20:37:52 wait
> S 06/Oct/2006 20:37:33 wait
> S 06/Oct/2006 20:38:02 wait
> C 06/Oct/2006 20:26:41 wait
> C 06/Oct/2006 19:49:10 poll: APG [58] - interface check
> C 06/Oct/2006 20:25:02 wait
> C 06/Oct/2006 20:21:37 wait
> R 06/Oct/2006 20:36:52 wait
> R 06/Oct/2006 20:36:47 wait
> R 06/Oct/2006 20:38:02 wait
> R 06/Oct/2006 20:36:17 wait
> R 06/Oct/2006 20:22:36 poll: APG [58]
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> N 22/Sep/2006 06:01:44 wait
> --------------
> VK> nxadm -c "sh mu"
> ---------------------
> Mutex status:
> g_hMutexIdIndex: unlocked
> g_hMutexNodeIndex: unlocked
> g_hMutexSubnetIndex: unlocked
> g_hMutexInterfaceIndex: unlocked
> ---------------------
> VK> nxadm -c "sh w"
> -------------------
> Thread Interval Status
> --------------------------------------------------------------
> --------------
> Item Poller 20 Running
> Syncer Thread 130 Running
> Poll Manager 60 Running
> -------------------
> VK> nxadm -c "sh q"
> -----------------
> Condition poller : 0
> Configuration poller : 0
> Data collector : 162
> Database writer : 0
> Event processor : 0
> Network discovery poller : 0
> Node poller : 0
> Routing table poller : 0
> Status poller : 0
> -----------------
>
> VK> 2. U node object, kotorij izobrazaet sam NetXMS server, dolzni
> VK> bili avtomaticheski sozdatsja parametri:
>
> VK> Average length of configuration poller queue for last minute
> Время сбито, данные нерегулярны, примерно раз в 29 минут.
> Данные - 0.00000000
> Смена данных с нормального периода на ненормальный - данные 0.
>
> VK> Average length of data collection poller's request queue
> for last minute
> Время сбито, данные нерегулярны, примерно раз в 29 минут.
> Данные - от 153 до 175. Как правило целые, но иногда дробные.
> В нормальном периоде данные как-правило 0, иногда (каждые 10 минут)
> проскакивают цифры 59.583333 или например 110.916667
> Смена данных с нормального периода на ненормальный - данные были в 0
> потом резко стали отличными от нуля.
>
> VK> Average length of database writer's request queue for last minute
> Время сбито, данные нерегулярны, примерно раз в 29 минут.
> Данные - 0.00000000
> Смена данных с нормального периода на ненормальный - данные 0.
> И в нормальном и в ненормальном периоде иногда проскакивают числа
> отличные от 0, как целые так и дробные.
>
> VK> Average length of status poller queue for last minute
> Время сбито, данные нерегулярны, примерно раз в 29 минут.
> Данные - 0.00000000
> Смена данных с нормального периода на ненормальный - данные 0.
>
> VK> Average time to queue DCI for polling for last minute
> Время сбито, данные нерегулярны, примерно раз в 29 минут.
> Данные - 0.00000000, иногда проскакивает 30.00000
> Смена данных с нормального периода на ненормальный - данные 0.
>
> VK> Istoriju etih parametrov.
>
> VK> Po povodu smeni IP - ja vecherom posmotrju.
>
>
>
> >> -----Original Message-----
> >> From: Lobahin Ilya [mailto:ex_corsar_at_mail.ru]
> >> Sent: Thursday, 05 October, 2006 05:19
> >> To: NetXMS Users - Russian
> >> Subject: [netxms-users-ru] Время обновления информации по DCI
> >>
> >>
> >>
> >> Здравствуйте NetXMS Users - Russian!
> >>
> >> В процессе тестирования наткнулся на непонятный глюк,
> точнее даже 2.
> >> Выставлен параметр Process.Count(pure-ftpd)
> >> Время собирания информации - 60 секунд.
> >> Смотрю в show data и офигеваю.
> >> Время показываемой информации - раз в 1:15:00 (в среднем).
> >> Причем видно, что до какого-то времени информация собиралась
> >> корректно, а потом - пошел сбой.
> >> По времени увязываю с работами по другим машинам, когда возникли
> >> зависающие поллеры. Poll->Configure
> >>
> >> По поводу зависающий поллеров:
> >> Сменился у нас primary провайдер в офисе. На gate машине
> >> соответственно сменился основной IP. gate машина также выступает в
> >> качестве proxy для еще парочки серверов.
> >> IP я ей сменил, сказал Poll->Configure. А оно возьми и брякнись,
> >> таймауты начало выдавать.
> >> Второй из серверов, на котором тоже IP сменился - не смог
> обновиться.
> >> Тоже на Poll->Configure таймауты выдает.
> >> При этом обе машины замечательно показывают информацию о
> процессах в
> >> системе, свою конфигурацию в консоли, а gate работает в
> режиме proxy.
> >> Единственное - показывают ошибки на интерфейсах: Unknown &
> Critical.
> >>
> >> Агентов перезапускал.
> >> Сервер не перезапускал, жду релиза.
> >>
> >>
> >> ----------------
> >> С уважением.
> >> Lobahin Ilya
> >>
> >>
>
>
>
> ----------------
> С уважением.
> Lobahin Ilya
>
>
Received on Sat Oct 07 2006 - 00:51:35 EEST

This archive was generated by hypermail 2.2.0 : Sat Oct 07 2006 - 00:56:25 EEST