Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Topics - inspirit

#1
подскажите куда копать, при попопытке сделать make при сборке netxms получаем это.

  CXX    tools.o
  CXX    trap.o
  CXX    upgrade.o
  CXX    watchdog.o
  CXXLD  nxagentd
sa.o: In function `InterlockedIncrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
sa.o: In function `InterlockedDecrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
sa.o: In function `InterlockedIncrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
session.o: In function `InterlockedDecrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
collect2: ld returned 1 exit status
make[4]: *** [nxagentd] Error 1
make[4]: Leaving directory `/home/inspirit/netxms-1.2.17/src/agent/core'
make[3]: *** [all-recursive] Error 1
make[3]: Leaving directory `/home/inspirit/netxms-1.2.17/src/agent'
make[2]: *** [all-recursive] Error 1
make[2]: Leaving directory `/home/inspirit/netxms-1.2.17/src'
make[1]: *** [all-recursive] Error 1
make[1]: Leaving directory `/home/inspirit/netxms-1.2.17'
make: *** [all] Error 2


собирал так
./configure --prefix=/opt/netxms --with-agent

Linux pbx  2.6.18-164.11.1.el5 #1 SMP Wed Jan 20 07:39:04 EST 2010 i686 i686 i386 GNU/Linux

sb_release -ar
LSB Version:    :core-3.1-ia32:core-3.1-noarch:graphics-3.1-ia32:graphics-3.1-noarch
Distributor ID: CentOS
Description:    CentOS release 5.5 (Final)
Release:        5.5
Codename:       Final


gcc-4.1.2-55.el5
libgcc-4.1.2-55.el5
gcc-c++-4.1.2-55.el5




#2
Виктор, приветствую. Подскажите по системным требованиям для машинки под NetXMS для мониторинга 800 коммутаторов.

столкнулись с проблемой что при установке Netxms 1.2.12 виртуальную машину с 4х-ядерным XEON

model name      : Intel(R) Xeon(TM) CPU 3.00GHz
stepping        : 1
cpu MHz         : 2992.694
cache size      : 1024 KB
5251.55
bogomips        : 5985.38


при выполнении autodiscovery по достижении ~400 хостов все 4е ядра загружены в 100%. причем видно что загружает именно процесс netxmsd а не к примеру mysql


вот вывод

netxmsd: show stats
Total number of objects:     19937
Number of monitored nodes:   549
Number of collectable DCIs:  556

sh pol
Condition poller                 : 0
Configuration poller             : 1044
Topology poller                  : 16
Data collector                   : 556
Database writer                  : 0
Database writer (IData)          : 0
Event processor                  : 0
Network discovery poller         : 0
Node poller                      : 7709
Routing table poller             : 546
Status poller                    : 549

top - 19:41:43 up 6 days,  2:48,  2 users,  load average: 5.51, 5.61, 4.79
Tasks: 124 total,   1 running, 123 sleeping,   0 stopped,   0 zombie
Cpu0  : 76.9%us,  4.9%sy,  0.0%ni,  1.8%id,  0.0%wa,  2.2%hi, 14.2%si,  0.0%st
Cpu1  : 62.8%us,  6.4%sy,  0.0%ni, 25.6%id,  0.0%wa,  0.0%hi,  5.1%si,  0.0%st
Cpu2  : 61.4%us, 10.1%sy,  0.0%ni, 23.2%id,  0.0%wa,  0.0%hi,  5.3%si,  0.0%st
Cpu3  : 62.5%us,  9.9%sy,  0.0%ni, 21.6%id,  0.0%wa,  0.0%hi,  6.0%si,  0.0%st
Mem:   4019400k total,  1997360k used,  2022040k free,   164368k buffers
Swap:  2097144k total,        0k used,  2097144k free,  1439684k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
18250 root      20   0  117m  41m 3932 S 334.6  1.1 247:09.34 netxmsd

perf top показывает:


66.49%  libnxcore.so.1.0.0        [.] InterfaceMACComparator(NetObj*, void*)
  4.40%  [kernel]                  [k] __do_softirq
  3.91%  [kernel]                  [k] finish_task_switch
  2.19%  libnxcore.so.1.0.0        [.] ObjectIndex::find(bool (*)(NetObj*, void*), void*)
  1.08%  [kernel]                  [k] _spin_unlock_irqrestore
  1.07%  perf                      [.] 0x00030cc8
  0.96%  libnxcore.so.1.0.0        [.] Interface::Type()
  0.73%  [kernel]                  [k] __alloc_skb
  0.69%  libc-2.12.so              [.] _int_malloc

Можно ли как то оптимизировать ситуацию или стоит задуматься о покупке более производительного железа ?


#3
Общие вопросы / Графики и timezone
October 14, 2013, 03:37:20 PM
Приветствую Виктор.

С недавних пор перестали рисоваться графики.

Начал разбираться - увидел что timestamp при просмотре history для DCI - отстает на 7 часов(т.е у меня 16 00 а показывает что последние данные от 10 часов)

Посмотрел время на сервере с netxms - время верное
Посмотрел время на сервере с базой - время верное

SHOW VARIABLES LIKE '%time_zone%';
+------------------+--------+
| Variable_name    | Value  |
+------------------+--------+
| system_time_zone | MSK    |
| time_zone        | SYSTEM |
+------------------+--------+

select now();
+---------------------+
| now()               |
+---------------------+
| 2013-10-14 16:38:55 |
+---------------------+


Сам mysql - тоже все верно показывает.

Откуда такое расхождение во времени ?
#4
Общие вопросы / LLDP dicovery и cisco
March 28, 2013, 11:45:38 AM
Недавно обновили прошивку на cisco которая в ядре стоит и на нее все подключено.

У нее появился функционал LLDP, но Netxms с ней отказывается по LLDP работать.

В статусе железки указано что isLLDP - yes.
Если делать Tools->Info->LLDP Table, то все показывает, но в графе Local Port указано INTERNAL (баг?)

Если делать Topology Pool то вот что показывает

[28.03.2013 13:25:40] **** Poll request sent to server ****
[28.03.2013 13:25:40] Poll request accepted
[28.03.2013 13:25:40] Starting topology poll for node Cisco 7609
[28.03.2013 13:25:41] Switch forwarding database retrieved
[28.03.2013 13:25:41] Link layer topology retrieved (0 connections found)
[28.03.2013 13:25:41] Updating peer information on interfaces
[28.03.2013 13:25:41] Link layer topology processed
[28.03.2013 13:25:47] VLAN list successfully retrieved from node
[28.03.2013 13:25:47] Finished topology poll for node Cisco 7609
[28.03.2013 13:25:47] **** Poll completed successfully ****


а при попытке сделать L2 Discovery говорит что  - Node has no support for layer 2 topology discovery.

Как можно это починить ?
#5
Общие вопросы / Netxms rpm
March 28, 2013, 10:21:42 AM
Виктор, у вас есть spec файл для сборки netxms rpm?

Можете поделиться?
#6
Общие вопросы / top высокий wa
March 20, 2013, 11:17:41 AM
Обратил внимание на то что на сервере БД довольно часто подскакивает wa показатель у процессора. Сервер 4х-ядерный Xeon.
База лежит на аппаратном RAID 10.

посмотрел что пик загрузки приходится на момент когда запускается HouseKeeper, который начинает чистить старые значения DCI.

Пробовал играться с housekeeper interval. Но особого облегчения не принесло. Какую стратегию можно выбрать что бы  ненужные значения удалялись, но так что бы HDD не сильно прогибался ?
#7
Общие вопросы / Feature Request
March 19, 2013, 02:36:04 PM
Виктор, можно сделать чтобы во вкладке Ports(на коммутаторах cisco) при наведении на собственно Порт во всплывающем тултипе отображался его дескрипшн. Было бы удобно.
#8
Заметил в логе netxms следующие записи:

[04-Mar-2013 15:12:06.078] 9 network device drivers loaded
[04-Mar-2013 15:12:06.088] Built-in objects created
[04-Mar-2013 15:12:06.088] Loading container categories...
[04-Mar-2013 15:12:06.088] Apply template thread started
[04-Mar-2013 15:12:06.090] Loading built-in object properties...
[b][04-Mar-2013 15:12:06.110] NetObj::loadCommonProperties() failed for object Policies [5] class=16
[04-Mar-2013 15:12:06.114] NetObj::loadCommonProperties() failed for object Network Maps [6] class=19
[04-Mar-2013 15:12:06.117] NetObj::loadCommonProperties() failed for object Dashboards [7] class=22
[04-Mar-2013 15:12:06.120] NetObj::loadCommonProperties() failed for object Reports [8] class=24[/b]
[04-Mar-2013 15:12:06.131] Loading conditions...


На работе вроде бы не сказывается. Хотелось бы узнать - что это, и можно ли исправить, или забить.
#9
Виктор,обновились на 1.2.6 и возникло несколько вопросов.

- можно ли как то контролировать рост записей в Mysql таблице snmp_trap_log? (housekeeper c ней не работает?)
- В ява консоли когда выбираешь ноду - там есть вкладка Ports - что в ней отображается? у меня она почему то пустая.
- Можно ли сделать что бы при выборе ноды в ява-консоли, после вкладки Ports был бы раздел Topology (Как в Legacy консоли раньше было, теперь оттуда тоже убрали).
-Можно ли менять местами (или вообще выбирать только нужные) столбцы в разделе Interfaces для Ноды (было бы удобно)

Заранее благодарю.
#10
Добрый день Виктор.
Вчера пытался обновить свой Netxms 1.2.2 до 1.2.6
В общем, после установки libtre-dev все нормально собралось. И установилось.

Базу обновил - все без ошибок.

Попробовал запустить - все запустилось.

Захожу. Все коммутаторы горят красным. Причина - интерфейсы коммутаторов которые находятся не в UP - имеют статус CRITICAL(В 1.2.2 порты которые в DOWN имеют статус Unknown и красным не помечены).

Пробовал делать Pool status. Configuration pool - все отрабатывает без ошибок.
Пробовал делать Unmanage/Manage для ноды - Эффекта не дало.

Пришлось откатиться на 1.2.2 - куда копать ?
#11
Общие вопросы / 1.2.6 make
February 25, 2013, 11:01:43 PM
Не собирается на Centos 5

QuoteCXX    libnxsnmp_la-main.lo
  CXX    libnxsnmp_la-mib.lo
  CXX    libnxsnmp_la-oid.lo
  CXX    libnxsnmp_la-pdu.lo
  CXX    libnxsnmp_la-security.lo
  CXX    libnxsnmp_la-transport.lo
  CXX    libnxsnmp_la-variable.lo
  CXX    libnxsnmp_la-zfile.lo
  CXXLD  libnxsnmp.la
make[4]: Leaving directory `/root/netxms-1.2.6/src/snmp/libnxsnmp'
Making all in nxmibc
make[4]: Entering directory `/root/netxms-1.2.6/src/snmp/nxmibc'
  CXX    nxmibc-array.o
  CXX    nxmibc-lex.parser.o
  CXX    nxmibc-mibparse.o
  CXX    nxmibc-nxmibc.o
  CXX    nxmibc-parser.tab.o
  CXXLD  nxmibc
../../libnetxms/.libs/libnetxms.so: undefined reference to `tre_regwexec'
../../libnetxms/.libs/libnetxms.so: undefined reference to `tre_regwcomp'
collect2: ld returned 1 exit status
make[4]: *** [nxmibc] Error 1
make[4]: Leaving directory `/root/netxms-1.2.6/src/snmp/nxmibc'
make[3]: *** [all-recursive] Error 1
make[3]: Leaving directory `/root/netxms-1.2.6/src/snmp'
make[2]: *** [all-recursive] Error 1
make[2]: Leaving directory `/root/netxms-1.2.6/src'
make[1]: *** [all-recursive] Error 1
make[1]: Leaving directory `/root/netxms-1.2.6'
make: *** [all] Error 2

собирал так -

./configure --with-server --with-client --with-agent --with-mysql
#12
Общие вопросы / помогите с SQL
February 18, 2013, 02:56:13 PM
Виктор, добрый день. Помогите немножко.

Вобщем, есть много свичей в сети, сейчас на основе данных из Netxms нужно выбрать из базы некоторые параметры.

В частности IP - Наименование - Модель - snmp_description - MAC - VLAN

Сейчас выбирается это следующим скриптом

SELECT n.primary_ip AS `IP`,
o.name AS `наименование`,
n.uname AS `Модель`,
n.snmp_sys_name AS `snmp description`,
n.bridge_base_addr AS `MAC адрес`,
GROUP_CONCAT(REPLACE(i.description, 'VLAN ID', '') ORDER BY i.description) AS `vlan`
FROM nodes AS n
LEFT JOIN object_properties AS o ON n.id = o.object_id
LEFT JOIN interfaces AS i ON n.id = i.node_id AND i.description like '%vlan%'
GROUP BY  n.id
ORDER BY n.primary_ip


И все хорошо.

Также с коммутаторов через темплейты(разные модели - разные темплейты - разные Snmp запросы) и DCI и SNMP собирается параметр "Серийный номер устройства"

Вопрос - Как выбрать: IP - Наименование - Модель - snmp_description - MAC - VLAN - Serial Number

Есть ли такая возможность и как нужно модифицировать запрос? А то не совсем понятна логика табличных взаимосвязей в базе NETXMS.

#13
Общие вопросы / int64
January 16, 2013, 03:20:11 PM
Есть centos 6.3 x64 там стоит агент 1.2.0

Есть Сервер x86 версии 1.2.2

На агенте, временами, из-за большого трафика на интерфейсе переполняется insigned int.

Переключил на Unsigned Int64

и вот что происходит

16-Jan-2013 17:15:46   190309640
16-Jan-2013 17:14:46   2459565876129811888
16-Jan-2013 17:13:46   226940472
16-Jan-2013 17:12:46   211918824
16-Jan-2013 17:11:45   2459565876154644136
16-Jan-2013 17:10:45   205786488
16-Jan-2013 17:09:45   201115784
16-Jan-2013 17:08:45   2459565876116695312
16-Jan-2013 17:07:45   186127368
16-Jan-2013 17:06:45   2459565876135092576
16-Jan-2013 17:05:45   193094016
16-Jan-2013 17:04:45   184866544
16-Jan-2013 17:03:43   2419245124043854256
16-Jan-2013 17:02:42   202548632
16-Jan-2013 17:01:42   234047592
16-Jan-2013 17:00:42   2459565876139388744
16-Jan-2013 16:59:42   199077936
16-Jan-2013 16:58:42   201872776

Т.е пара значений корректно а 3е не корректно.

С чем это может быть связано?

стоит ли обновлять ?
#14
Общие вопросы / Вопрос по DCI
September 05, 2012, 03:02:36 PM
Скажите

если я знаю DCI name - например "Serial Number"
и его значение - 205003573

То как я могу определить к какой ноде он принадлежит? может скрипт какой ?

Заранее спасибо.
#15
Общие вопросы / ifXTable
August 30, 2012, 03:15:35 PM
При создании DCI счетчика через контекстное меню на интерфейсе - NetXMS может автоматом использовать ifXTable, а то счетчики из ifTable имеют свойство переполняться.

В настройках сервера есть параметр - useIfXtable - 1, но как то не помогает.

Есть какие варианты ?
#16
Проблема появилась именно после обновления.

База данных и сервер разнесены физически по разным серверам.

Смысл в том что когда выбираешь какой нибудь predefined graph котрый работает с DCI которые приходят от какого нибудь агента. То в первый момент вылетает ошибка - Unable to retrieve collected data: Database failure.

Потом или нажимаешь - F5 или по refresh time графики появляются по одному.

По данным snmp - графики рисуются нормально.

Обновление агента до версии 1.2.0 не помогло. Как отловить причину подобного поведения?
#17
Добрый день Виктор. Интересует такой вопрос.

Можно ли из скрипта (PERL) - добавлять устройства(коммутаторы) в NETXMS. Может есть какое то Аpi или еще какой путь?
вобщем не через графическую консоль.

Было бы удобно как то автоматизировать процесс добавления устройств.

Можете что то сказать по этому вопросу?

Вобщем что то вида AddNode(ip,container,some_parametrs)


И еще.. Можно ли в разделе где SNMP TRAP ы привязывают к EVENT ам - сделать что бы ивент возбуждался не сразу, а скажем после некоторого числа трапов которое можно указать там. Или скажем если трапов пришло какое то количество в течении какого то промежутка времени. Что то в таком духе.

Заранее спасибо.
#18
Общие вопросы / nxagent
February 20, 2012, 06:24:46 PM
Сегодня поставил агента на Centos 6.2 через ~5 минут его работы внезапно загрузка 2х ядер повышается до 200%.

пробовал версии 1.1.10 и 1.1.7
Версия сервера 1.1.7

в логах агента следующее..

0-Feb-2012 20:11:31] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:31] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:31] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:32] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:32] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:32] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:32] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:33] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:33] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:33] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:33] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:34] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:34] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:34] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:34] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:35] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:35] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:35] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:35] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:36] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:36] [session:0] CommSession::disconnect()
[20-Feb-2012 20:11:36] [session:1] Session disconnected by watchdog (last activity timestamp is 1329754164)
[20-Feb-2012 20:11:36] [session:1] CommSession::disconnect()
[20-Feb-2012 20:11:37] [session:0] Session disconnected by watchdog (last activity timestamp is 1329753859)
[20-Feb-2012 20:11:37] [session:0] CommSession::disconnect()


Покрутил IdleTimeout на агенте. Поставил 300. Не помогло :(

Виктор, что можете посоветовать ?
#19
После обновления сервера с 1.1.3 на 1.1.5

появилась куча странных символов в названиях нод. например

Грищенко
Дугина 27 sw1

раньше такого небыло.. посмотрел в базе. там теже символы. непонятно откуда они берутся

Единственное что можно сказать - база в CP1251

примерно так это выглядит


как видно из картинки - в комментариях к нодам тож фигня какая то )

посещают мысли конвертнуть базу UTF-8. Это вариант ?

спустя некоторе время....

конвертнул базу в утф.
прописал в конфиг codepage utf8
не помогло . все равно русские имена частично абракадабра.. как и комментарии к нодам.. блин.
#20
Проблема заключается в селующем.

Есть Netxms 1.0.3 и его база Mysql которая живет на отдельном сервере.

Так вот. Если смотреть в mgmt консоли раздел Last Values (там где DCI настроены) то Timestamp отстает ровно на час. Проверял время и на машине с сервером и с БД. Все нормально. Куда копать непонятно. Как netxms получает значение времени?!