Потенциальная проблема?

Started by Anth0ny, December 24, 2008, 10:23:29 AM

Previous topic - Next topic

Anth0ny

Если сервер мониторинга довольно сильно нагружен, то возникает ситуация, что могут возникнуть (я вот сейчас сижу и жду, чтоже получилось) проблемы с целостностью данных в базе.

Ситуация: если сервер нагружен, то возникают проблемы с применением шаблонов на объекты (нет уверенности что в таблицы вносятся все данные из шаблона).

В моём случае шаблон предельно прост - только одна простая запись (1 DCI).

После применения шаблона на объект (любую из нод) после минутного ожидания с окном "Applying template ..." получаем "Error applying template: request timed out."

Примерно тоже самое возникает при превращении DCI в шаблон - после минутного ожидания получаю ту же ошибку, НО в плюс к этому после ошибки таймаута падает сама консоль.

Хотя всё пока выглядит вроде рабочим я не уверен что всё на самом деле хорошо... Вдруг где-то какое-то из полей в базе не перенеслось или не заполнилось нужными данными...?

Вот беда..  :-\

weec

довольно старая проблема, те же симптомы
давно писал об этом на форуме

как повторить:
настрогать скрипт с большим временем получения данных (50-60 сек)
и нагенерить кучу DCI для получения данных с этого скрипта
nx-ядро просядет и консоль отвалится


Anth0ny

мда. есть мысли как такой проблемы избежать?
только ставить мониторинг на более мощное железо?

Anth0ny

#3
блин. после нескольких таких ошибок применения шаблонов закрыл консоль. запустил её заново и уже минут 10 вишу с сообщением "Synchronizing objects".

это не дело =(

update: вишу уже 1 час...

OMG Виктор, что делать????

Anth0ny

#4
остановил core. теперь сервис не запускается. долго тупит и в итоге по таймауту отваливается...

всё. мой  мониторинг сдох.

придётся очевидно всё из бэкапов поднимать  :-X.

мда. получается, что отказоустойчивости и проверки на целостность во время операций, связанных с перемещением объектов внутри базы NXMS (и если при этом происходит сбой) нет практически никакой... или я не прав?

может есть какая утилита для проверки целостности базы?

Anth0ny

с грехом пополам машина с мониторингом и базой перезагрузилась.. сервис Core теперь после этого сбоя (я не стал откатываться) запускается минут 5-7. при этом все остальные сервисы системы (2008) курят.

Victor Kirhenshtein

A mozno startanut' server s debug'om urovnja hotja-bi 7 (netxmsd -D 7) i prislat' log?

Anth0ny

да вроде всё стабилизировалось... а я сильно опасался что разрушится структура базы...
уфф... пронесло.