Здравствуйте NetXMS Users - Russian!
7 октября 2006 г. вы писали.
Поставил RC1.
Ситуация с получением данных стабилизировалась.
По пункту 1 увеличу параметр NumberOfDataCollectors с 10 до 20.
Пункт 2 кажется более вероятным. Но проблем со связью быть в принципе
не должно. Каналы достаточно толстые, связь стабильная.
Какое рекомендуемое соотношение количества DCI и
NumberOfDataCollectors?
VK> Poka chto vidno chto ochered' na data collection ochen'
VK> bol'shaja, chto oznachaet chto vse DCI ne mogut bit' oprosheni
VK> vovremja - otsjuda I prigajuschie intervali mezdu sobrannimi
VK> dannimi. Etomu mozet bit' neskol'ko prichin, vobschem-to pohozih drug na druga:
VK> 1. Kolichestvo hostov I DCI prosto sil'no viroslo - nado
VK> posmotret' skol'ko hostov I skol'ko data pollerov. Kolichestvo
VK> hostov I DCI mozno posmotret' cherez nxadm -c "sh st". Kolichestvo
VK> data pollerov zadaetsja parametrom servera NumberOfDataCollectors. Stoit ego uvelichit'.
VK> 2. Kakoi-to iz hostov (ili neskol'ko hostov) medlenno otdaet
VK> znachenija DCI, no pri etom sistema ne schitaet ego nedostupnim.
VK> Sistema stavit DCI v ochered' na polling, no vse polleri podolgu zanjati takimi problemnimi DCI.
VK> Poka-chto mozno probovat' uvelichit' kol-vo pollerov I smotret'
VK> chto poluchitsja. I ja esche raz proverju kak proishodit smena IP adresa u hosta.
>>
>>
>> VK> Ochen' interesno...
>>
>> VK> Mozno bilo bi prislat' sledujuschuju infu?
>>
>> VK> 1. Na konsoli NetXMS servera, rezul'tati vipolnenija:
>> VK> nxadm -c "sh po"
>> --------------
>> PT TIME STATE
>> S 06/Oct/2006 20:38:07 wait
>> S 06/Oct/2006 20:37:47 wait
>> S 06/Oct/2006 20:38:43 wait
>> S 06/Oct/2006 20:38:32 wait
>> S 06/Oct/2006 20:38:22 wait
>> S 06/Oct/2006 19:50:14 poll: APG [58] - wait for lock
>> S 06/Oct/2006 20:37:27 wait
>> S 06/Oct/2006 20:37:52 wait
>> S 06/Oct/2006 20:37:33 wait
>> S 06/Oct/2006 20:38:02 wait
>> C 06/Oct/2006 20:26:41 wait
>> C 06/Oct/2006 19:49:10 poll: APG [58] - interface check
>> C 06/Oct/2006 20:25:02 wait
>> C 06/Oct/2006 20:21:37 wait
>> R 06/Oct/2006 20:36:52 wait
>> R 06/Oct/2006 20:36:47 wait
>> R 06/Oct/2006 20:38:02 wait
>> R 06/Oct/2006 20:36:17 wait
>> R 06/Oct/2006 20:22:36 poll: APG [58]
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> N 22/Sep/2006 06:01:44 wait
>> --------------
>> VK> nxadm -c "sh mu"
>> ---------------------
>> Mutex status:
>> g_hMutexIdIndex: unlocked
>> g_hMutexNodeIndex: unlocked
>> g_hMutexSubnetIndex: unlocked
>> g_hMutexInterfaceIndex: unlocked
>> ---------------------
>> VK> nxadm -c "sh w"
>> -------------------
>> Thread Interval Status
>> --------------------------------------------------------------
>> --------------
>> Item Poller 20 Running
>> Syncer Thread 130 Running
>> Poll Manager 60 Running
>> -------------------
>> VK> nxadm -c "sh q"
>> -----------------
>> Condition poller : 0
>> Configuration poller : 0
>> Data collector : 162
>> Database writer : 0
>> Event processor : 0
>> Network discovery poller : 0
>> Node poller : 0
>> Routing table poller : 0
>> Status poller : 0
>> -----------------
>>
>> VK> 2. U node object, kotorij izobrazaet sam NetXMS server, dolzni
>> VK> bili avtomaticheski sozdatsja parametri:
>>
>> VK> Average length of configuration poller queue for last minute
>> Время сбито, данные нерегулярны, примерно раз в 29 минут.
>> Данные - 0.00000000
>> Смена данных с нормального периода на ненормальный - данные 0.
>>
>> VK> Average length of data collection poller's request queue
>> for last minute
>> Время сбито, данные нерегулярны, примерно раз в 29 минут.
>> Данные - от 153 до 175. Как правило целые, но иногда дробные.
>> В нормальном периоде данные как-правило 0, иногда (каждые 10 минут)
>> проскакивают цифры 59.583333 или например 110.916667
>> Смена данных с нормального периода на ненормальный - данные были в 0
>> потом резко стали отличными от нуля.
>>
>> VK> Average length of database writer's request queue for last minute
>> Время сбито, данные нерегулярны, примерно раз в 29 минут.
>> Данные - 0.00000000
>> Смена данных с нормального периода на ненормальный - данные 0.
>> И в нормальном и в ненормальном периоде иногда проскакивают числа
>> отличные от 0, как целые так и дробные.
>>
>> VK> Average length of status poller queue for last minute
>> Время сбито, данные нерегулярны, примерно раз в 29 минут.
>> Данные - 0.00000000
>> Смена данных с нормального периода на ненормальный - данные 0.
>>
>> VK> Average time to queue DCI for polling for last minute
>> Время сбито, данные нерегулярны, примерно раз в 29 минут.
>> Данные - 0.00000000, иногда проскакивает 30.00000
>> Смена данных с нормального периода на ненормальный - данные 0.
>>
>> VK> Istoriju etih parametrov.
>>
>> VK> Po povodu smeni IP - ja vecherom posmotrju.
>>
>>
>>
>> >> -----Original Message-----
>> >> From: Lobahin Ilya [mailto:ex_corsar_at_mail.ru]
>> >> Sent: Thursday, 05 October, 2006 05:19
>> >> To: NetXMS Users - Russian
>> >> Subject: [netxms-users-ru] Время обновления информации по DCI
>> >>
>> >>
>> >>
>> >> Здравствуйте NetXMS Users - Russian!
>> >>
>> >> В процессе тестирования наткнулся на непонятный глюк,
>> точнее даже 2.
>> >> Выставлен параметр Process.Count(pure-ftpd)
>> >> Время собирания информации - 60 секунд.
>> >> Смотрю в show data и офигеваю.
>> >> Время показываемой информации - раз в 1:15:00 (в среднем).
>> >> Причем видно, что до какого-то времени информация собиралась
>> >> корректно, а потом - пошел сбой.
>> >> По времени увязываю с работами по другим машинам, когда возникли
>> >> зависающие поллеры. Poll->Configure
>> >>
>> >> По поводу зависающий поллеров:
>> >> Сменился у нас primary провайдер в офисе. На gate машине
>> >> соответственно сменился основной IP. gate машина также выступает в
>> >> качестве proxy для еще парочки серверов.
>> >> IP я ей сменил, сказал Poll->Configure. А оно возьми и брякнись,
>> >> таймауты начало выдавать.
>> >> Второй из серверов, на котором тоже IP сменился - не смог
>> обновиться.
>> >> Тоже на Poll->Configure таймауты выдает.
>> >> При этом обе машины замечательно показывают информацию о
>> процессах в
>> >> системе, свою конфигурацию в консоли, а gate работает в
>> режиме proxy.
>> >> Единственное - показывают ошибки на интерфейсах: Unknown &
>> Critical.
>> >>
>> >> Агентов перезапускал.
>> >> Сервер не перезапускал, жду релиза.
>> >>
----------------
С уважением.
Lobahin Ilya
Received on Sat Oct 07 2006 - 01:27:07 EEST
This archive was generated by hypermail 2.2.0 : Sat Oct 07 2006 - 01:30:16 EEST