Menu

Show posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.

Show posts Menu

Messages - inspirit

#1
Сам спросил - сам ответил.

Собрал вот так.

./configure --prefix=/opt/netxms --with-agent CXXFLAGS="-march=i686
#2
подскажите куда копать, при попопытке сделать make при сборке netxms получаем это.

  CXX    tools.o
  CXX    trap.o
  CXX    upgrade.o
  CXX    watchdog.o
  CXXLD  nxagentd
sa.o: In function `InterlockedIncrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
sa.o: In function `InterlockedDecrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
sa.o: In function `InterlockedIncrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1002:                                                     $
session.o: In function `InterlockedDecrement':
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
/home/inspirit/netxms-1.2.17/src/agent/core/../../../include/nms_threads.h:1023:                                                     $
collect2: ld returned 1 exit status
make[4]: *** [nxagentd] Error 1
make[4]: Leaving directory `/home/inspirit/netxms-1.2.17/src/agent/core'
make[3]: *** [all-recursive] Error 1
make[3]: Leaving directory `/home/inspirit/netxms-1.2.17/src/agent'
make[2]: *** [all-recursive] Error 1
make[2]: Leaving directory `/home/inspirit/netxms-1.2.17/src'
make[1]: *** [all-recursive] Error 1
make[1]: Leaving directory `/home/inspirit/netxms-1.2.17'
make: *** [all] Error 2


собирал так
./configure --prefix=/opt/netxms --with-agent

Linux pbx  2.6.18-164.11.1.el5 #1 SMP Wed Jan 20 07:39:04 EST 2010 i686 i686 i386 GNU/Linux

sb_release -ar
LSB Version:    :core-3.1-ia32:core-3.1-noarch:graphics-3.1-ia32:graphics-3.1-noarch
Distributor ID: CentOS
Description:    CentOS release 5.5 (Final)
Release:        5.5
Codename:       Final


gcc-4.1.2-55.el5
libgcc-4.1.2-55.el5
gcc-c++-4.1.2-55.el5




#3
Это не лог netxms. Это я в цикле запустил nxadm -c 'show dbcp'
#4
Видел вот такое

Quote0x8651a30 27.Feb.2014 12:25:39 config.cpp:221
0x86549a0 27.Feb.2014 12:25:39 config.cpp:221
0x8655148 27.Feb.2014 12:25:39 config.cpp:221
0x8655760 27.Feb.2014 12:25:39 config.cpp:221
0x8674108 27.Feb.2014 12:25:39 config.cpp:221
0xb5707c08 27.Feb.2014 12:25:39 config.cpp:221
0xb5e0f418 27.Feb.2014 12:25:39 config.cpp:221
0x96ba978 27.Feb.2014 12:25:39 config.cpp:221
0xb5f00b88 27.Feb.2014 12:25:39 config.cpp:221
0xb6207c18 27.Feb.2014 12:25:39 config.cpp:221
0xb6503c00 27.Feb.2014 12:25:39 config.cpp:221
0xb620a498 27.Feb.2014 12:25:39 config.cpp:221
0xb573bc10 27.Feb.2014 12:25:39 config.cpp:221
0xb5d82228 27.Feb.2014 12:25:39 config.cpp:221
0x8a5fca8 27.Feb.2014 12:25:39 config.cpp:221
0xab9e1250 27.Feb.2014 12:25:39 config.cpp:221
0xab415b88 27.Feb.2014 12:25:39 config.cpp:221
17 database connections in use
#5
Quote
Database Connection Pool exhausted, fallback connection used
[26-Feb-2014 09:46:13.127] [DEBUG] Database Connection Pool exhausted, fallback connection used
[26-Feb-2014 09:46:13.127] [DEBUG] Database Connection Pool exhausted, fallback connection used
[26-Feb-2014 09:46:13.736] [DEBUG] Database Connection Pool exhausted, fallback connection used
[26-Feb-2014 09:46:13.746] [DEBUG] Database Connection Pool exhausted, fallback connection used
[26-Feb-2014 09:46:13.788] [DEBUG] Database Connection Pool exhausted, fallback connection used

Аналогичная проблема. увеличение ConnectionPoolMaxSize не помогло..
#6
Так, вроде разобрался. Нагрузку пораждает configuration poll. Пока сделал 1 пулер. вроде все стало хорошо.

Поанализировал логи работы и вот что увидел.

Starting configuration poll for node up51-sw2 (ID: 3474)
[20-Feb-2014 13:20:20.274] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent Flags={00022805} DynamicFlags={00000002}
[20-Feb-2014 13:20:20.274] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - connecting
[20-Feb-2014 13:20:20.278] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - failed to connect (error 910)
[20-Feb-2014 13:20:20.279] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - finished
[20-Feb-2014 13:20:20.279] [DEBUG] ConfPoll(up51-sw2): calling SnmpCheckCommSettings()
[20-Feb-2014 13:20:20.280] [DEBUG] SnmpCheckV3CommSettings: failed
[20-Feb-2014 13:20:20.282] [DEBUG] SnmpCheckCommSettings: trying version 1 community 'public'
[20-Feb-2014 13:20:20.356] [DEBUG] ConfPoll(up51-sw2): selected device driver GENERIC
[20-Feb-2014 13:20:21.738] [DEBUG] ConfPoll(up51-sw2): checking for CheckPoint SNMP on port 260

1)Как для всех нод пометить поле  Disable usage of Netxms Agent for all polls. (на коммутаторах его все равно нет)
2) Как выключить проверку на наличие CheckPoint SNMP. Я нашел в конфигурации сервера параметр - EnableCheckPointSNMP. он стоит в 0. Но я так понимаю проверка все равно выполняется.

3) можно ли при построении L2 topology для ноды в админке как то подсвечивать ту ноду для которой я строю топологию.

В большой сети появляется мешанина из коммутаторов и непонятно где конкретно искомый коммутатор :)
#7
Да вот игрался уже - пока безрезультатно :) Можете экспортировать конфиг сервера netxms с такой машины. Было бы интересно посмотреть.
#8
Виктор, приветствую. Подскажите по системным требованиям для машинки под NetXMS для мониторинга 800 коммутаторов.

столкнулись с проблемой что при установке Netxms 1.2.12 виртуальную машину с 4х-ядерным XEON

model name      : Intel(R) Xeon(TM) CPU 3.00GHz
stepping        : 1
cpu MHz         : 2992.694
cache size      : 1024 KB
5251.55
bogomips        : 5985.38


при выполнении autodiscovery по достижении ~400 хостов все 4е ядра загружены в 100%. причем видно что загружает именно процесс netxmsd а не к примеру mysql


вот вывод

netxmsd: show stats
Total number of objects:     19937
Number of monitored nodes:   549
Number of collectable DCIs:  556

sh pol
Condition poller                 : 0
Configuration poller             : 1044
Topology poller                  : 16
Data collector                   : 556
Database writer                  : 0
Database writer (IData)          : 0
Event processor                  : 0
Network discovery poller         : 0
Node poller                      : 7709
Routing table poller             : 546
Status poller                    : 549

top - 19:41:43 up 6 days,  2:48,  2 users,  load average: 5.51, 5.61, 4.79
Tasks: 124 total,   1 running, 123 sleeping,   0 stopped,   0 zombie
Cpu0  : 76.9%us,  4.9%sy,  0.0%ni,  1.8%id,  0.0%wa,  2.2%hi, 14.2%si,  0.0%st
Cpu1  : 62.8%us,  6.4%sy,  0.0%ni, 25.6%id,  0.0%wa,  0.0%hi,  5.1%si,  0.0%st
Cpu2  : 61.4%us, 10.1%sy,  0.0%ni, 23.2%id,  0.0%wa,  0.0%hi,  5.3%si,  0.0%st
Cpu3  : 62.5%us,  9.9%sy,  0.0%ni, 21.6%id,  0.0%wa,  0.0%hi,  6.0%si,  0.0%st
Mem:   4019400k total,  1997360k used,  2022040k free,   164368k buffers
Swap:  2097144k total,        0k used,  2097144k free,  1439684k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
18250 root      20   0  117m  41m 3932 S 334.6  1.1 247:09.34 netxmsd

perf top показывает:


66.49%  libnxcore.so.1.0.0        [.] InterfaceMACComparator(NetObj*, void*)
  4.40%  [kernel]                  [k] __do_softirq
  3.91%  [kernel]                  [k] finish_task_switch
  2.19%  libnxcore.so.1.0.0        [.] ObjectIndex::find(bool (*)(NetObj*, void*), void*)
  1.08%  [kernel]                  [k] _spin_unlock_irqrestore
  1.07%  perf                      [.] 0x00030cc8
  0.96%  libnxcore.so.1.0.0        [.] Interface::Type()
  0.73%  [kernel]                  [k] __alloc_skb
  0.69%  libc-2.12.so              [.] _int_malloc

Можно ли как то оптимизировать ситуацию или стоит задуматься о покупке более производительного железа ?


#9
На рабочей станции все корректно. Всмысле что с любого ПК не рисует граффики) (на всех ПК неправильно быть не может :) )

если посмотреть timestamp в idata последний добавленный то он тоже не верный.

отсюда вопрос - как формируется  timestamp для idata? и как его поменять?
#10
Общие вопросы / Графики и timezone
October 14, 2013, 03:37:20 PM
Приветствую Виктор.

С недавних пор перестали рисоваться графики.

Начал разбираться - увидел что timestamp при просмотре history для DCI - отстает на 7 часов(т.е у меня 16 00 а показывает что последние данные от 10 часов)

Посмотрел время на сервере с netxms - время верное
Посмотрел время на сервере с базой - время верное

SHOW VARIABLES LIKE '%time_zone%';
+------------------+--------+
| Variable_name    | Value  |
+------------------+--------+
| system_time_zone | MSK    |
| time_zone        | SYSTEM |
+------------------+--------+

select now();
+---------------------+
| now()               |
+---------------------+
| 2013-10-14 16:38:55 |
+---------------------+


Сам mysql - тоже все верно показывает.

Откуда такое расхождение во времени ?
#11
1)Могу я что то еще прислать для прояснения ситуации ?
2) Можно ли сделать так что бы для устройств с которыми в данный момент отсуствует связь, можно было бы посмотреть Layer 2 topology. Бывает так что устройство упало, а схему его подключения уже не посмотришь. Было бы здорово если бы netxms запоминал последнюю известную топологию для данного устройства.
#12
нет ответа от cisco по этим oid ам.
#13
Общие вопросы / LLDP dicovery и cisco
March 28, 2013, 11:45:38 AM
Недавно обновили прошивку на cisco которая в ядре стоит и на нее все подключено.

У нее появился функционал LLDP, но Netxms с ней отказывается по LLDP работать.

В статусе железки указано что isLLDP - yes.
Если делать Tools->Info->LLDP Table, то все показывает, но в графе Local Port указано INTERNAL (баг?)

Если делать Topology Pool то вот что показывает

[28.03.2013 13:25:40] **** Poll request sent to server ****
[28.03.2013 13:25:40] Poll request accepted
[28.03.2013 13:25:40] Starting topology poll for node Cisco 7609
[28.03.2013 13:25:41] Switch forwarding database retrieved
[28.03.2013 13:25:41] Link layer topology retrieved (0 connections found)
[28.03.2013 13:25:41] Updating peer information on interfaces
[28.03.2013 13:25:41] Link layer topology processed
[28.03.2013 13:25:47] VLAN list successfully retrieved from node
[28.03.2013 13:25:47] Finished topology poll for node Cisco 7609
[28.03.2013 13:25:47] **** Poll completed successfully ****


а при попытке сделать L2 Discovery говорит что  - Node has no support for layer 2 topology discovery.

Как можно это починить ?
#14
Общие вопросы / Netxms rpm
March 28, 2013, 10:21:42 AM
Виктор, у вас есть spec файл для сборки netxms rpm?

Можете поделиться?
#15
Общие вопросы / top высокий wa
March 20, 2013, 11:17:41 AM
Обратил внимание на то что на сервере БД довольно часто подскакивает wa показатель у процессора. Сервер 4х-ядерный Xeon.
База лежит на аппаратном RAID 10.

посмотрел что пик загрузки приходится на момент когда запускается HouseKeeper, который начинает чистить старые значения DCI.

Пробовал играться с housekeeper interval. Но особого облегчения не принесло. Какую стратегию можно выбрать что бы  ненужные значения удалялись, но так что бы HDD не сильно прогибался ?