Если сервер мониторинга довольно сильно нагружен, то возникает ситуация, что могут возникнуть (я вот сейчас сижу и жду, чтоже получилось) проблемы с целостностью данных в базе.
Ситуация: если сервер нагружен, то возникают проблемы с применением шаблонов на объекты (нет уверенности что в таблицы вносятся все данные из шаблона).
В моём случае шаблон предельно прост - только одна простая запись (1 DCI).
После применения шаблона на объект (любую из нод) после минутного ожидания с окном "Applying template ..." получаем "Error applying template: request timed out."
Примерно тоже самое возникает при превращении DCI в шаблон - после минутного ожидания получаю ту же ошибку, НО в плюс к этому после ошибки таймаута падает сама консоль.
Хотя всё пока выглядит вроде рабочим я не уверен что всё на самом деле хорошо... Вдруг где-то какое-то из полей в базе не перенеслось или не заполнилось нужными данными...?
Вот беда.. :-\
довольно старая проблема, те же симптомы
давно писал об этом на форуме
как повторить:
настрогать скрипт с большим временем получения данных (50-60 сек)
и нагенерить кучу DCI для получения данных с этого скрипта
nx-ядро просядет и консоль отвалится
мда. есть мысли как такой проблемы избежать?
только ставить мониторинг на более мощное железо?
блин. после нескольких таких ошибок применения шаблонов закрыл консоль. запустил её заново и уже минут 10 вишу с сообщением "Synchronizing objects".
это не дело =(
update: вишу уже 1 час...
OMG Виктор, что делать????
остановил core. теперь сервис не запускается. долго тупит и в итоге по таймауту отваливается...
всё. мой мониторинг сдох.
придётся очевидно всё из бэкапов поднимать :-X.
мда. получается, что отказоустойчивости и проверки на целостность во время операций, связанных с перемещением объектов внутри базы NXMS (и если при этом происходит сбой) нет практически никакой... или я не прав?
может есть какая утилита для проверки целостности базы?
с грехом пополам машина с мониторингом и базой перезагрузилась.. сервис Core теперь после этого сбоя (я не стал откатываться) запускается минут 5-7. при этом все остальные сервисы системы (2008) курят.
A mozno startanut' server s debug'om urovnja hotja-bi 7 (netxmsd -D 7) i prislat' log?
да вроде всё стабилизировалось... а я сильно опасался что разрушится структура базы...
уфф... пронесло.