Re: RE: Re: RE: Re: Опять сервер сдох

From: Lobahin Ilya <ex_corsar_at_DOMAIN_REMOVED>
Date: Mon, 8 Jan 2007 20:01:50 +0300

Здравствуйте NetXMS Users - Russian!
8 января 2007 г. вы писали.

VK> Изменилось что-нибудь после установки патча?

Пока сервер не падал.

9-)
Эмулировать плохую связь к сожалению не могу. Клиенты побьют.
=)))))))))))))))))))))))))))))

P.S. В среднем время дизни сервера в автономке - месяц/полтора, будем
ждать.

>> VK> Я некоторое время назад посылал патч в netxms-users, не пробовали
>> VK> его ставить? Он как раз относится к коммуникациям,
>> возможно это та
>> VK> самая проблема. Я уже несколько раз получал сообщения о похожих
>> VK> падениях сервера, но у себя повторить эту ситуацию не получается.
>>
>> Нет, не ставил. Спасибо.
>> Щас прикрутил ... ставится ...
>>
>> Еще интересный момент - на узле где плохая связь и который
>> выступает в роли "проксирующего" - во время последнего сбоя
>> связи умер агент. Скончался без криков о помощи. Правда
>> происходило это в тот момент когда я на это сервере
>> маршрутизацию менял.
>>
>> VK> P.S. На всякий случай еще раз посылаю этот патч
>>
>> LI>> Сегодня в ночь сервер 2 раза умирал.
>> LI>> Без особых криков в логи, просто тихо скончался процесс.
>> LI>> Перезапустили. Через 50 минут умер снова.
>> LI>> Потом пришел я и запустил с ключиком --debug-all.
>> LI>> Теперь жду когда снова упадет.
>>
>> LI>> Gentoo Linux, 2.6.17 kernel
>> LI>> 0.2.14
>>
>> LI>> Может на падение как-то повлияло то обстоятельство, что
>> у нас между
>> LI>> сервером и несколькими агентами сегодня ночью очень нестабильная
>> LI>> связь, потери пакетов до 40%. Среди агентов есть один
>> проксирующий.
>> LI>> В логах есть строчки: Client session closed due to communication
>> LI>> error (Connection reset by peer)
>>
>> VK> Пока писал письмо, он скончался в очередной раз.
>> VK> Вот последние 3 строчки из лога. Все отмеченных 3 узла - имеют
>> VK> плохую связь. [27-Dec-2006 08:54:01] DEBUG:
>> VK> Node(test2)->GetItemFromAgent(Net.Interface.AdminStatus(2)):
>> VK> dwError=0 dwResult=0 [27-Dec-2006 08:54:06] DEBUG:
>> VK> Node(APG)->GetItemFromAgent(Agent.Uptime): dwError=900 dwResult=1
>> VK> [27-Dec-2006 08:54:22] DEBUG:
>> VK> Node(Dev)->GetItemFromAgent(Net.Interface.AdminStatus(2)):
>> VK> dwError=408 dwResult=1

----------------
С уважением.
Lobahin Ilya
Received on Mon Jan 08 2007 - 19:01:50 EET

This archive was generated by hypermail 2.2.0 : Mon Jan 08 2007 - 19:11:12 EET