Здравствуйте!
Помогите пожалуйста разобраться вот с этим сообщением: Load average for server thread pool POLLERS is too high (1.973633)
Не могу понять что к чему и куда копать?
Добрый день!
похоже на самом деле на неправильный threshold - 1.97 это вполне нормальное значение. Пробламе с пулом потоков если его load average превышает его максимальный размер.
Не совсем понял Ваш ответ.
Смотрите, на сколько я понимаю есть 3 параметра (https://www.netxms.org/documentation/adminguide/quickstart.html (https://www.netxms.org/documentation/adminguide/quickstart.html) , которые влияют на данное значение:
PollerThreadPoolMaxSize, PollerThreadPoolBaseSize, NumberOfDataCollectors
Я увеличил их в два раза, но это ни как не отразилось, на выше указанном значении. Из чего я сделал вывод, что копаю не туда. Прошу Вас помочь мне разобраться с этим вопросом.
Еще раз перечитал документацию и форум, но так и не понял, что делать что бы исправить ситуацию.
Помогите, пожалуйста!
А сообщение где появляется? И какие текущие значения параметров пула DATACOLLECTION (должны собираться на верверной ноде)?
Извините, что долго не писал, не было возможности.
Появляется на сервере (прилагаю дневной график)
Значение DATACOLLECTION - graf2.png (если я правильно Вас понял)
Алерт все бомбит и бомбит :)
Проверьте threshold на параметре размера пула потоков DATACOLLECTION. Событие должно генерироваться если load average > размера пула, а сейчас похоже стоит очень низкое значение.
Эти значения по умолчанию, я их не менял.
Да, это ошибка в системном шаблоне. Поменяйте 1 на размер пула.
Я прошу прощения, но я тогда не понимаю значение/назначение остальных счетчиков?
Load average - средняя загрузка, usage и current size - колличество (это как я понимаю).
Вы пишите, что бы я установил в Load average значение какого параметра:
- PollerThreadPoolBaseSize
- PollerThreadPoolMaxSize
- NumberOfDataCollectors
Я просто хочу разобраться что к чему, т.к. запутался. Помогите, пожалуйста!
Load average растет, какие есть способы уменьшить это значение?
Quote from: Evgeniy Skoropadskiy on May 31, 2016, 10:08:36 AM
Я прошу прощения, но я тогда не понимаю значение/назначение остальных счетчиков?
Load average - средняя загрузка, usage и current size - колличество (это как я понимаю).
Вы пишите, что бы я установил в Load average значение какого параметра:
- PollerThreadPoolBaseSize
- PollerThreadPoolMaxSize
- NumberOfDataCollectors
Я просто хочу разобраться что к чему, т.к. запутался. Помогите, пожалуйста!
Здесь есть описание этих параметров:
https://www.netxms.org/documentation/adminguide/appendix.html?highlight=pollerthreadpoolmaxsize#server-configuration-parameters
Если вкатце:
- PollerThreadPoolBaseSize - минимальное количество потоков(используется для Status poll, Configuration poll, etc. кроме сбора данных)
- PollerThreadPoolMaxSize - количество до которого максимально может расти количество потоков(используется для Status poll, Configuration poll, etc. кроме сбора данных)
- NumberOfDataCollectors - количество потоков которое используется для сбора данных
Tatjana Dubrovica, огромное спасибо за ответ! Я читал описание данных параметров.
У Вас новый сайт с документацией! Это радует, спасибо!!!
Но вопрос мой пока так и остался без ответа, к сожалению.
У меня на сервере постоянно выскакивает алерт к DCI: Server thread pool POLLERS: load average (1 minute)
И я не понимаю о чем этот алерт говорит и что необходимо сделать, что бы он пришел в нормальное состояние?
Аллерт выскакивает потому что у нас баг в "NetXMS Server"->"Thread pools" Template. Там в пороговом значение(threshold) должно быть значение сильно больше 1. Мы это поправим к следующему релизу(2.0.5) и если Вы обновитесь когда мы его выпустим, то всё должно будет решиться само сабой или Вы можете сами поправить value. Оно должно быть PollerThreadPoolMaxSize(250). Это пороговое значение нужно, чтобы оповестить администратора о том, что есть запросы которые стоят в очереди на обработку, но не обрабатываться, потому что количество запросов превышает максимальное количество доступных потоков.
Урааа!!!
Покорнейше благодарю!!!
Теперь я понял, что означает этот алерт!!!
А где можно взять дефолтный шаблон для self мониторинга? БД, пуллеры, очередь и т.д.
Я так понимаю, может в скрипте создания БД?
Стандартные шаблоны лежат в <prefix>/share/netxms/templates (/usr/share/netxms/templates для deb пакетов, <path>\share\templates на Windows). Сервер при старте импортирует все из этого каталога, если параметр ImportConfigurationOnStartup выставлен в ненулевое значение.
Quote from: Victor Kirhenshtein on July 07, 2016, 12:19:02 PM
Стандартные шаблоны лежат в <prefix>/share/netxms/templates (/usr/share/netxms/templates для deb пакетов, <path>\share\templates на Windows). Сервер при старте импортирует все из этого каталога, если параметр ImportConfigurationOnStartup выставлен в ненулевое значение.
Спасибо Виктор! По умолчанию видимо этот параметр в 0. Нужно сейчас выставить в 1 и перезапустить сервер? Ничего лишнего он не импортирует или не поломаются текущие шаблоны?
Планируется что будут появляться и другие шаблоны - поэтому для старых инсталляций параметр по умолчанию 0. Сейчас только несколько шаблонов для мониторинга самого сервера. Сломать ничего не сломает, просто будут дополнительные шаблоны и события.
Quote from: Tatjana Dubrovica on July 05, 2016, 07:07:09 PM
Аллерт выскакивает потому что у нас баг в "NetXMS Server"->"Thread pools" Template. Там в пороговом значение(threshold) должно быть значение сильно больше 1. Мы это поправим к следующему релизу(2.0.5) и если Вы обновитесь когда мы его выпустим, то всё должно будет решиться само сабой или Вы можете сами поправить value. Оно должно быть PollerThreadPoolMaxSize(250). Это пороговое значение нужно, чтобы оповестить администратора о том, что есть запросы которые стоят в очереди на обработку, но не обрабатываться, потому что количество запросов превышает максимальное количество доступных потоков.
Импортировал новый 2.0.5 netxms_server.xml Server thread pool MAIN: normalized load average (1 minute) в Threshold осталось так же > 1
UPD: Вопрос решён, теперь изменился параметр который мониторится - normalized load average (= load average / thread count).