NetXMS Support Forum

Russian Support => Общие вопросы => Topic started by: Anth0ny on December 24, 2008, 10:23:29 AM

Title: Потенциальная проблема?
Post by: Anth0ny on December 24, 2008, 10:23:29 AM
Если сервер мониторинга довольно сильно нагружен, то возникает ситуация, что могут возникнуть (я вот сейчас сижу и жду, чтоже получилось) проблемы с целостностью данных в базе.

Ситуация: если сервер нагружен, то возникают проблемы с применением шаблонов на объекты (нет уверенности что в таблицы вносятся все данные из шаблона).

В моём случае шаблон предельно прост - только одна простая запись (1 DCI).

После применения шаблона на объект (любую из нод) после минутного ожидания с окном "Applying template ..." получаем "Error applying template: request timed out."

Примерно тоже самое возникает при превращении DCI в шаблон - после минутного ожидания получаю ту же ошибку, НО в плюс к этому после ошибки таймаута падает сама консоль.

Хотя всё пока выглядит вроде рабочим я не уверен что всё на самом деле хорошо... Вдруг где-то какое-то из полей в базе не перенеслось или не заполнилось нужными данными...?

Вот беда..  :-\
Title: Re: Потенциальная проблема?
Post by: weec on December 24, 2008, 10:30:03 AM
довольно старая проблема, те же симптомы
давно писал об этом на форуме

как повторить:
настрогать скрипт с большим временем получения данных (50-60 сек)
и нагенерить кучу DCI для получения данных с этого скрипта
nx-ядро просядет и консоль отвалится

Title: Re: Потенциальная проблема?
Post by: Anth0ny on December 24, 2008, 11:10:15 AM
мда. есть мысли как такой проблемы избежать?
только ставить мониторинг на более мощное железо?
Title: Re: Потенциальная проблема?
Post by: Anth0ny on December 24, 2008, 11:13:32 AM
блин. после нескольких таких ошибок применения шаблонов закрыл консоль. запустил её заново и уже минут 10 вишу с сообщением "Synchronizing objects".

это не дело =(

update: вишу уже 1 час...

OMG Виктор, что делать????
Title: Re: Потенциальная проблема?
Post by: Anth0ny on December 24, 2008, 11:53:02 AM
остановил core. теперь сервис не запускается. долго тупит и в итоге по таймауту отваливается...

всё. мой  мониторинг сдох.

придётся очевидно всё из бэкапов поднимать  :-X.

мда. получается, что отказоустойчивости и проверки на целостность во время операций, связанных с перемещением объектов внутри базы NXMS (и если при этом происходит сбой) нет практически никакой... или я не прав?

может есть какая утилита для проверки целостности базы?
Title: Re: Потенциальная проблема?
Post by: Anth0ny on December 24, 2008, 12:26:57 PM
с грехом пополам машина с мониторингом и базой перезагрузилась.. сервис Core теперь после этого сбоя (я не стал откатываться) запускается минут 5-7. при этом все остальные сервисы системы (2008) курят.
Title: Re: Потенциальная проблема?
Post by: Victor Kirhenshtein on December 24, 2008, 10:45:56 PM
A mozno startanut' server s debug'om urovnja hotja-bi 7 (netxmsd -D 7) i prislat' log?
Title: Re: Потенциальная проблема?
Post by: Anth0ny on January 11, 2009, 04:26:37 PM
да вроде всё стабилизировалось... а я сильно опасался что разрушится структура базы...
уфф... пронесло.