Проблемы в 0.2.22

Started by Alex, August 03, 2008, 09:31:09 PM

Previous topic - Next topic

Alex

Первое что заметил:
Если зайти в Network Maps из Control Panel, то окно Network Maps закрыть невозможно... Опять же рядом с меню (минимизировать, восстановить, закрыть) начинают плодиться дубликаты кнопок.
Опять же нельзя редактировать названия карт. В меню есть только Create Map и Delete Map.

Anth0ny

#1
Win2008 (32bit)

после обновления с 0.2.21 до 0.2.22 сервер валится через 2-3-5 минуты после запуска.
не сразу, а именно по прошествии от 2 до 5 минут.

Quote
Faulting application netxmsd.exe, version 0.0.0.0, time stamp 0x48931a95, faulting module nxcore.dll, version 0.0.0.0, time stamp 0x48931a85, exception code 0xc0000005, fault offset 0x00024d0f, process id 0x75c, application start time 0x01c8f6040cfb45c4.

может быть конфликт между сервером 0.2.22 и клиентами 0.2.21?

откатился до версии сервера 0.2.21.

Victor Kirhenshtein

A mozno bilo bi zapustit' v debug rezime server? Prosto s konsoli

netxmsd --debug=7

Pered etim v netxmsd.conf postavit' LogFile v kakoj-nibud' fail, i prislat' etot fail mne posle crash'a.

V ljubom sluchae budu segodnja razbiratsja. Sledujuschij raz v onlin'e budu vecherom.

Anth0ny

сейчас проведу ещё один тест.
по результатам отпишу.

Anth0ny

#4
странное дело...

у меня 2 сервера, один- тестовый, физический. второй- продуктивный, виртуальный (сделано через Intel VT и MS Hyper-V).

на тестовом всё работает нормально, обновляется до 2.22 и крутится дальше. а продуктивный через некоторое время после после обновления валится, как подкошенный...

Quote
  Problem Event Name:   APPCRASH
  Application Name:   netxmsd.exe
  Application Version:   0.0.0.0
  Application Timestamp:   48931a95
  Fault Module Name:   nxcore.dll
  Fault Module Version:   0.0.0.0
  Fault Module Timestamp:   48931a85
  Exception Code:   c0000005
  Exception Offset:   00024d0f
  OS Version:   6.0.6001.2.1.0.272.7
  Locale ID:   1049

разница между ними в том что тестовый - Win2003 а продуктивный- Win2008 (ну и несколько различаются конфиги: на продуктивном, так как он помощнее, увеличено число poller'ов).

собственно на этом разница кончается.

debug-лог на продуктивном сервере получил, но там никакого криминала нет. просто в какой-то момент прекращается запись в лог-файл (обрывается на обычной строке) и демон сервера вылетает с ошибкой. причём вылетает довольно быстро, минут через 3-5 как я уже писал. я лог весь просмотрел, но, повторяюсь, ничего странного там не увидел. Виктор, если лог всё же нужен- готов выслать мылом (не готов запостить сюда, сами понимаете почему).

вот концовка лога:

Quote
[04-Aug-2008 14:31:30] DEBUG: Name for node 77 was resolved to quantuma.test.net
[04-Aug-2008 14:31:30] DEBUG: Finished configuration poll for node quantuma.test.net (ID: 77)
[04-Aug-2008 14:31:30] DEBUG: Starting configuration poll for node f01.test.net (ID: 129)
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(f01.test.net): trying SNMP GET
[04-Aug-2008 14:31:30] DEBUG: SnmpCheckCommSettings: trying version 1 community 'public'
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(h01.test.net): checking for NetXMS agent - finished
[04-Aug-2008 14:31:30] DEBUG: Name for node 79 was resolved to b4.test.net
[04-Aug-2008 14:31:30] DEBUG: Finished configuration poll for node b4.test.net (ID: 79)
[04-Aug-2008 14:31:30] DEBUG: Starting configuration poll for node samanta.test.net (ID: 132)
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(s01.test.net): trying SNMP GET
[04-Aug-2008 14:31:30] DEBUG: SnmpCheckCommSettings: trying version 1 community 'public'
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(f01.test.net): checking for CheckPoint SNMP on port 260
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(g01.test.net): checking for NetXMS agent - finished
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(r01.test.net): checking for NetXMS agent - connected
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(f01.test.net): checking for NetXMS agent Flags={00000003} DynamicFlags={00000002}
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(f01.test.net): checking for NetXMS agent - connecting
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(s01.test.net): checking for CheckPoint SNMP on port 260
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(s01.test.net): checking for NetXMS agent Flags={00000003} DynamicFlags={00000002}
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(s01.test.net): checking for NetXMS agent - connecting
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(r01.test.net): checking for NetXMS agent - finished
[04-Aug-2008 14:31:30] DEBUG: ConfPoll(f01.test.net): checking for NetXMS agent - connected

Victor Kirhenshtein

Esche odna pros'ba - esli est' vozmoznost' esche raz zapustit' 0.2.22, dobavte v netxmsd.conf takie stroki:


CreateCrashDumps = yes
DumpDirectory = C:\dump


C:\dump dolzen suschestvovat' ili ego mozno zamenit' na ljuboj drugoj suschestvujushij katalog. Pri sboe tam dolzen pojavitsja dump. Otpravte ego na [email protected].

Alex

Хм.. Что-то все мои вопросы почему-то остаются без ответа.. Интересно, к чему бы это?

Alex Kirhenshtein

Quote from: Alex on August 06, 2008, 09:34:50 AM
Хм.. Что-то все мои вопросы почему-то остаются без ответа.. Интересно, к чему бы это?

Виктор сейчас в Лихтенштейне; когда доберется до нормального интернета - ответит.

Alex

Появилась новая проблема.
У меня NetXMS с агентом стоит в Frankfurt am Main, Germany. Я мониторю узлы в Гон-Конге. В итоге последние 3 дня у меня расколбас начался. Средний пинг с сервера до гон-конгского узла 385 мс. Это в принципе нормально. А NetXMS мне по 2-3 раза  вдень сообщения о том что узел падал на одну-две секунды. Т.е. все железки и голосовые потоки в начале в статусе DOWN присылает и тут же в догонку шлет UP. Что за проблема могла возникнуть? Сделал тест. На этом же серваке в screen запустил ping до железки в Hong-Kong-е. И в тот момент когда NetXMS сказал что все плохо, я смотрел реальные данные с Ping_а. Так вот выяснилось что NetXMS ме соврал и не было ни каких проблем с каналом.

Victor Kirhenshtein

Izvinjajus' za bol'shie pauzi, u menja dejstvitel'no redko sejchas dostup k kompu s internetom. Na sledujuschej nedele vernus' v Rigu i budu otvechat' v obichnom rezime.

Problemu s Control Panel -> Network Maps ja ispravil, tak-ze kak i crash servera. Kak budet vozmoznost', vilozu obnovlenij build.

Po povodu ping'ov: a kak nastroen monitoring cherez NetXMS - cherez ping subagent? Kakimi imenno parametrami?


Alex

Нет.. Я не ставил ping subagent.
Статус железки меняется с 0 на 4 и через 1-2 минуты восстанавливается а 0. Причем никаких проблем со стороны collocation-а, ни со стороны сервера замечено не было. Проблема началась после переустановки с 0.2.21 на 0.2.22.

Anth0ny

Quote from: Victor Kirhenshtein on August 09, 2008, 11:43:27 AM
Problemu s Control Panel -> Network Maps ja ispravil, tak-ze kak i crash servera. Kak budet vozmoznost', vilozu obnovlenij build.

Виктор, очень, очень ждём... =)

Alex

Виктор очень жду ответа на предыдущее свое сообщение.. Я не могу сейчас мониторить целый узел :(

Victor Kirhenshtein

Ну вот, вернулся домой, теперь буду отвечать в обычном режиме :)

Quote from: Alex on August 08, 2008, 02:16:09 PM
Появилась новая проблема.
У меня NetXMS с агентом стоит в Frankfurt am Main, Germany. Я мониторю узлы в Гон-Конге. В итоге последние 3 дня у меня расколбас начался. Средний пинг с сервера до гон-конгского узла 385 мс. Это в принципе нормально. А NetXMS мне по 2-3 раза  вдень сообщения о том что узел падал на одну-две секунды. Т.е. все железки и голосовые потоки в начале в статусе DOWN присылает и тут же в догонку шлет UP. Что за проблема могла возникнуть? Сделал тест. На этом же серваке в screen запустил ping до железки в Hong-Kong-е. И в тот момент когда NetXMS сказал что все плохо, я смотрел реальные данные с Ping_а. Так вот выяснилось что NetXMS ме соврал и не было ни каких проблем с каналом.

Quote from: Alex on August 09, 2008, 03:55:07 PM
Нет.. Я не ставил ping subagent.
Статус железки меняется с 0 на 4 и через 1-2 минуты восстанавливается а 0. Причем никаких проблем со стороны collocation-а, ни со стороны сервера замечено не было. Проблема началась после переустановки с 0.2.21 на 0.2.22.

Я просто фразу "У меня NetXMS с агентом стоит в Frankfurt am Main" понял так, что там стоит ping субагент, а сам сервер в другом месте. Стало быть, там стоит именно сервер?
Код для поллинга интерфейсов не менялся. Если используется ping, то сервер делает три попытки с timeout 1500ms. А на узлах в Гонконге стоит агент или SNMP?

Alex

Quote from: Victor Kirhenshtein on August 18, 2008, 09:42:31 AM

Я просто фразу "У меня NetXMS с агентом стоит в Frankfurt am Main" понял так, что там стоит ping субагент, а сам сервер в другом месте. Стало быть, там стоит именно сервер?
Код для поллинга интерфейсов не менялся. Если используется ping, то сервер делает три попытки с timeout 1500ms. А на узлах в Гонконге стоит агент или SNMP?


В Гон-Конге стоят Cisco соответствено с SNMP. Все интерфейсы по SNMP отваливаются и статус железки меняется на 4.. Минуты через 3-4 возвращается на 0 и все интерфейсы поднимаются. По логам самих железок связь не падала, интерфейсы тоже в норме. Куда копать ума не приложу. Причем с предыдущей версией таких проблем не наблюдалось :(