Подвисает агент

Started by Vladimir-K, September 29, 2010, 03:26:41 PM

Previous topic - Next topic

Vladimir-K

Доброго времени суток.
На одном из серверов периодически (примерно один раз в 4 часа)  виснет агент, после чего данные перестают передоваться на netxms сервер.
В логах агента пишет: Unable to create process "/opt/netxms_scripts/disksp.sh c1t1d0s0": Too many open files.
Из консоли агент не перезапускается, конфиг не открывает, вообщем просто висит.
После перезапуска (причем только путем рестарта демона на самом сервере) агент начинает собирать всю
необходимую информацию.
Подобная проблема, относительно "Too many open files",  много где описана, и единственное решение, которое нашлось - выставить ulimit -n, однако
моему агенту это не помогло(.
Подскажите пожалуйста, в чем может быть проблема?
(Версия Агента: 1.0.4, ОС: SunOS 5.9)
На всякий случай прикрепил лог с дебагом.

Victor Kirhenshtein

Добрый день!
А можно прислать скрипт disksp.sh? Попробую у себя погонять. И еще вопрос - агент под рутом запущен?

Vladimir-K

Доброго времени суток. Агент запускается от root.
Скрипт в аттаче.

Alex Kirhenshtein

А другими скриптами все нормально? Zombie-процессов не остается?

А как решение конкретно этой проблемы - вместо скрипта использовать встроенный FileSystem.UsedPerc(/mountpoint)

Vladimir-K

Доброго времени суток!
Zombie - процессов нет, скрипт на данной машине используется только один. В более новых версиях соляриса все работает, как часы.
Насчет FileSystem.UsedPerc: проверяю место на диске именно скриптом, т.к. между данными FileSystem.UsedPerc и данными DF имеются различия, а именно,
FileSystem.UsedPerc показывает примерно на 5 процентов меньше, нежели DF (на любом из серверов *nix).