RE: Re: Опять сервер сдох

From: Victor Kirhenshtein <victor_at_DOMAIN_REMOVED>
Date: Wed, 27 Dec 2006 15:36:23 +0200

Hi!

Я некоторое время назад посылал патч в netxms-users, не пробовали его ставить? Он как раз относится к коммуникациям, возможно это та самая проблема. Я уже несколько раз получал сообщения о похожих падениях сервера, но у себя повторить эту ситуацию не получается.

Best regards,
Victor

P.S. На всякий случай еще раз посылаю этот патч

-----Original Message-----
From: Lobahin Ilya [mailto:ex_corsar_at_mail.ru]
Sent: Wednesday, 27 December, 2006 07:59
To: NetXMS Users - Russian
Subject: [netxms-users-ru] Re: [netxms-users-ru] Опять сервер сдох

Здравствуйте NetXMS Users - Russian!
27 декабря 2006 г. вы писали.

LI> Сегодня в ночь сервер 2 раза умирал.
LI> Без особых криков в логи, просто тихо скончался процесс.
LI> Перезапустили.
LI> Через 50 минут умер снова.
LI> Потом пришел я и запустил с ключиком --debug-all.
LI> Теперь жду когда снова упадет.

LI> Gentoo Linux, 2.6.17 kernel
LI> 0.2.14

LI> Может на падение как-то повлияло то обстоятельство, что у нас между
LI> сервером и несколькими агентами сегодня ночью очень нестабильная связь,
LI> потери пакетов до 40%. Среди агентов есть один проксирующий.
LI> В логах есть строчки:
LI> Client session closed due to communication error (Connection reset by peer)

Пока писал письмо, он скончался в очередной раз.
Вот последние 3 строчки из лога. Все отмеченных 3 узла - имеют плохую связь.
[27-Dec-2006 08:54:01] DEBUG: Node(test2)->GetItemFromAgent(Net.Interface.AdminStatus(2)): dwError=0 dwResult=0
[27-Dec-2006 08:54:06] DEBUG: Node(APG)->GetItemFromAgent(Agent.Uptime): dwError=900 dwResult=1
[27-Dec-2006 08:54:22] DEBUG: Node(Dev)->GetItemFromAgent(Net.Interface.AdminStatus(2)): dwError=408 dwResult=1

----------------
С уважением.
Lobahin Ilya

Received on Wed Dec 27 2006 - 15:36:23 EET

This archive was generated by hypermail 2.2.0 : Wed Dec 27 2006 - 15:47:58 EET