Обновился до 2.2.1. Собственно система работает, но агенты... Как только обновил их до версии 2.2.1, так они все мгновенно обрушились, и теперь я за считаные минуты остался вообще без системы управления сетью :( Что теперь делать-то? Бегать по всему предприятию, удаляя новые агенты и заменяя старыми? В конфигах агентов всё по умолчанию, кроме трёх строк:
RequireEncryption = yes
RequireAuthentication = yes
EncryptedSharedSecret = B/Cx9iK3RpLCpgp+8SvHuMKmCn7xK8e4wqYKfvErx7g=
Из-за них, может, проблема? Если так, то как же все предыдущие версии агентов нормально работали с такой конфигой? В общем, я в тупике. Помогите, пожалуйста...
Вот ошибки из логов системы, связанные со службой NetXMS Agent:
H_PdhObjectItems: PDH Error C0000BB8 in call to PdhEnumObjectItems (Указанные объекты не найдены на этом компьютере.)
Служба "NetXMS Agent" неожиданно прервана. Это произошло (раз): 2.
Пришлите хотя-бы один crash dump для агентов.
А где они находятся?
Задается параметрами DumpDirectory и EnableCrashDumps, например:
EnableCrashDumps = yes
DumpDirectory = C:\
По умолчанию это C:\
Ошибся в названии параметра, правильно будет CreateCrashDumps:
CreateCrashDumps = yes
еще желательно поставить
FullCrashDumps = yes
Включил следующие строки в конфиг-файл NetXMS Agent:
CreateCrashDumps = yes
FullCrashDumps = yes
DumpDirectory = C:\NetXMS
Служба упала раз 10 (я её много раз перезапускал), но дампов не выдала, ни одного :(
Самое забавное, что при запуске агента NetXMS в логах идут сообщения об успешной загрузке субагентов, затем, что служба NetXMS успешно стартанула. Она и правда работает какое-то время, но стоит опросить, к примеру, параметр Current CPU Utilization, как агент выдаёт нулевое значение (а оно точно ненулевое) и тотчас падает. Система выдаёт тревогу Native agent is not responding. На этом всё. Можно агента перезапустить через оснастку Службы, но он всё равно умирает через минуту.
Попробуйте запустить агента как процесс с командной строки. Кстати, если есть Telegram, то будет быстрее общаться в нашем Telegram канале.
Еще настройте логирование в файл и дебаг уровень 9, и пришлите лог вместе с полным конфигом. Мы попробовали несколько Windows систем у нас - везде агент работает, так что это какая-то комбинация настроек и особенностей конкретных систем.
Telegram даже не знаю что такое. Запуск с командной строки с ключом -d завершается ошибкой (и какой-то дикой кучей вопросительных знаков вместо символов сообщения). Запуск с ключом -s приводит к нормальному запуску службы (с успешным падением через 2 минуты). Пробовал запускать с ключами -s -D 9 (Debug Level 9) - информации нигде никакой.
Надо просто
nxagentd -D9
Надо только убедиться что логгирование идет в файл. Ну или добавить DebugLevel = 9 в nxagentd.conf и запустить как службу.
Задал в файле DebugLevel = 9 - вывалилось столько сообщений в лог, что не даёт сохранить (их там больше 3500 вывалилось!). Собрал последние 240 штук перед падением NetXMS-агента, но не могу приложить - слишком большой файл. Заодно прилагаю и конфиг-файл.
P. S. Это всё проделал на машине под Windows 8.1 x64 (SL, русская). Только что попытался поставить (вручную) агента версии 2.2.1 на комп под Windows 7 Pro x64. К своему удивлению, я даже не смог его установить (!), хотя предыдущая версия без разговоров вставала и работала. Вот что пишет при попытке установить (или удалить) агента:
Запуск программы невозможен, т. к. на компьютере отсутствует api-ms-win-crt-runtime-l1-1-0.dll. Попробуйте переустановить программу.
И такое выскакивает раз по 20 как при установке, так и при удалении. В конце концов, агент устанавливается, но, естественно, не работает - ошибка типа служба не ответила на запрос своевременно. Странно, кстати, что проблема с компьютерами или с Виндоус. Их у меня 55 штук (компов), все разные и с разной версией Windows (к слову, лицензия все, большинство подключены к Интернету, и все обновления скачиваются). И потом, как же я больше 2 лет работаю с NetXMS и горя не знаю, а тут обновился на 2.2.1 и сразу на всех машинах всё посыпалось. Проблемы разные, ошибки разные, но все приводят к неработоспособности агента, это их (проблемы) объединяет.
События выложил в облако mail.ru. Ссылка: https://cloud.mail.ru/public/ETJP/8okyyCbqn
А можно пожалуйста текстовый лог файл?
Quote from: iGodunoff on December 08, 2017, 02:18:32 PM
Запуск программы невозможен, т. к. на компьютере отсутствует api-ms-win-crt-runtime-l1-1-0.dll. Попробуйте переустановить программу.
Это ошибка упаковки инсталлера. Мы перепаковали, попртобуйте заново скачать инсталлятор агента и установить. Издержки перехода на более новую версию Visual C++.
Начиная с 2.0 вообще лучше обновляться очень аккуратно, сам уже много раз наступал когда что-то ломается или создаёт повышенную нагрузку на сам сервер или на удалённый маршрутизатор. Основано на личных наблюдениях конечно, много чего меняется в коде и проект развивается.
Да, пожалуйста. Прилагаю текстовый лог с DebugLevel = 9, сам конфиг-файл и все настроенные метрики (скриншот), которые мастер-сервер опрашивает у агентов. Увы, не то что дампов агенты не выдают, но и ошибки в логах. Работают нормально, но в какой-то момент (очень быстро) падают, не сказав ни слова. Нетрудно заметить, что агенты рушатся в тот момент, когда сервер опрашивает параметры в соответствии с настроенными метриками. Причём, значения они выдают вполне нормальные, успевая выдать довольно много перед смертью. Может, какая-то конкретная метрика обрушивает агенты? Старые версии нормально её выдавали, а новая при попытке выдать падает? Если удастся, попробую выяснить которая из метрик обрушивает агенты.
Quote from: Victor Kirhenshtein on December 08, 2017, 05:05:40 PM
А можно пожалуйста текстовый лог файл?
Всё - причина обрушения агентов установлена! Они не переносят, когда у них спрашивают модель физического диска (PhysicalDisk.Model(0), к примеру). Вот почему упали враз все агенты на всех версиях ОС. Предыдущая версия агента ничуть этим параметром не смущалась, нормально выдавала модель жёсткого диска(ов).
Что интересно, этот код не менялся уже много лет. Похоже что-то пошло не так с переходом на Visual C++ 2017.
Очень может быть. В общем, пока отключил я эту метрику, и сразу всё пошло нормально, никто нигде больше не падает. К счастью, метрики у меня сидят в шаблоне, и отключение любой из них сразу отражается на всех узлах сети.
Ещё одна новость - агенты 2.2.1 не работают в Windows XP. Установка проходит без ошибок, всё на местах, служба появляется. Но при попытке её запустить - ошибка 1053 - служба не ответила на запрос своевременно. Не стартует в итоге. В остальных системах агент работает нормально (если не спрашивать модель диска), начиная от Висты и до Десятки последней редакции. И ещё с удалённым обновлением агентов до 2.2.1 вышли грабли. Не на всех компьютерах, а как-то выборочно (непонятно по какому принципу). Пришлось ставить руками (причём иногда агент 2.2.1 не желал ставиться даже вручную - приходилось удалять предыдущую версию, либо криво вставшую новую).
Ещё одна странность обнаружилась: агенты версии 2.2.1 выдают неправильную версию ОС в случае Windows 10. Вместо Win 10 всегда пишут "Windows 8 Build 9200". Хотя агенты 2.1.2 сообщают её совершенно правильно (например, "Windows 10 Build 15063 AMD-64").
Quote from: iGodunoff on December 14, 2017, 09:10:01 AM
Ещё одна странность обнаружилась: агенты версии 2.2.1 выдают неправильную версию ОС в случае Windows 10. Вместо Win 10 всегда пишут "Windows 8 Build 9200". Хотя агенты 2.1.2 сообщают её совершенно правильно (например, "Windows 10 Build 15063 AMD-64").
Похоже на проблему с манифестом. Будем смотреть.
Quote from: iGodunoff on December 12, 2017, 11:13:14 AM
Ещё одна новость - агенты 2.2.1 не работают в Windows XP. Установка проходит без ошибок, всё на местах, служба появляется. Но при попытке её запустить - ошибка 1053 - служба не ответила на запрос своевременно. Не стартует в итоге. В остальных системах агент работает нормально (если не спрашивать модель диска), начиная от Висты и до Десятки последней редакции. И ещё с удалённым обновлением агентов до 2.2.1 вышли грабли. Не на всех компьютерах, а как-то выборочно (непонятно по какому принципу). Пришлось ставить руками (причём иногда агент 2.2.1 не желал ставиться даже вручную - приходилось удалять предыдущую версию, либо криво вставшую новую).
А если попробовать патч 2.2.1-18 на XP: https://netxms.org/download/patches/019/ (https://netxms.org/download/patches/019/)?
Попробовал - то же самое. Встаёт без ошибок, запуск службы невозможен - ошибка 1053. Откатываюсь пока на предыдущую версию.
Ещё одна проблема с агентами 2.2.1 - отказываются выдавать значение метрики File.Size(*). Ошибка и всё тут. Агенты предыдущей версии нормально отображают.
Если проблема на XP то сейчас она не решена. В данный момент мы совертуем использовать для XP агенты более старой версии 2.1.2. Для новых релизов в целом будем решать проблему.