Проблема с 2.26 (Inconsistent database и т.д.)

Started by Akira, May 05, 2009, 10:19:27 AM

Previous topic - Next topic

Akira

Отапгрейдился на 2.26, полезли при старте ошибки.

Event Type:   Error
Event Source:   NetXMSCore
Event Category:   None
Event ID:   59
Date:      05.05.2009
Time:      11:14:23
User:      N/A
Computer:   ANTIVIR
Description:
Inconsistent database: container object 344 has reference to non-existing child object 223

Event Type:   Error
Event Source:   NetXMSCore
Event Category:   None
Event ID:   67
Date:      05.05.2009
Time:      11:14:23
User:      N/A
Computer:   ANTIVIR
Description:
Inconsistent database: template object 656 has reference to non-existing node object 649

Event Type:   Error
Event Source:   NetXMSCore
Event Category:   None
Event ID:   16
Date:      05.05.2009
Time:      11:14:22
User:      N/A
Computer:   ANTIVIR
Description:
Failed to load interface object with id 346 from database

Event Type:   Error
Event Source:   NetXMSCore
Event Category:   None
Event ID:   22
Date:      05.05.2009
Time:      11:14:22
User:      N/A
Computer:   ANTIVIR
Description:
Inconsistent database: interface 346 linked to non-existing node 196


Проверка проходит без ошибок

C:\NetXMS\bin>nxdbmgr.exe check
NetXMS Database Manager Version 0.2.26

Configuration file OK
Checking database:
* Checking node objects...                                            [PASSED]
* Checking interface objects...                                       [PASSED]
* Checking network service objects...                                 [PASSED]
* Checking cluster objects...                                         [PASSED]
* Checking template to node mapping...                                [PASSED]
* Checking object properties...                                       [PASSED]
* Checking event processing policy...                                 [PASSED]
* Checking collected data...                                          [PASSED]
Database doesn't contain any errors
Database check completed


------------------------
Updated - база умерла.
Пропала куча серверов из контейнеров

Victor Kirhenshtein

A kakaja baza? i chto pishet server v svoem loge? Skoree vsego tam budud "failed SQL query".

Akira

Quote from: Victor Kirhenshtein on May 05, 2009, 11:43:59 AM
A kakaja baza? i chto pishet server v svoem loge? Skoree vsego tam budud "failed SQL query".


MSSQL2005
В самом SQL ошибок нет.

Видимо это у меня совпала перезагрузка сервера с упаданием базы.

Нашел в бэкапах живую базу от 28 апреля (29 апреля - 5 мая все бэкапы были уже с ошибками)
Откатился на 2.25
Работает, все сервера есть.

НО!

Начинаю забивать кучу всего, что с 28-го апреля добавил, перегружаю Core - у база дохнет с этими ошибками и пропаданием серверов
Не могу отловить из-за чего :(

Victor Kirhenshtein

Очень странная проблема. Похоже что все-таки не проходят какие-то SQL запросы. А какой драйвер используется - mssql.ddr или odbc.ddr?

Еще один вариант - в 0.2.25 появился экспорт бызы, если проблема конфиденциальности данных не стоит слишком остро, то можно отослать мне базу с ошибками, я попробую по базе определить, что пошло не так.


Akira

mssql.ddr

Данные вроде внес с третьего раза.
Сейчас стоит 2.26
Но. Теперь новая проблема.
Каждые 2-5 часов падает сервис.
19:19:11, 21:59:20, 3:26:04, 8:46:55

Event Type:   Error
Event Source:   Service Control Manager
Event Category:   None
Event ID:                7031
Date:      07.05.2009
Time:      8:46:55
User:      N/A
Computer:   ANTIVIR
Description:
The NetXMS Core service terminated unexpectedly.  It has done this 1 time(s).  The following corrective action will be taken in 0 milliseconds: Restart the service.

For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.

Alex

Quote from: Victor Kirhenshtein on May 05, 2009, 10:14:24 PM
Еще один вариант - в 0.2.25 появился экспорт бызы
А можно подробности? Где чего и как?

Спасибо заранее.

Victor Kirhenshtein

Quote from: Alex on May 07, 2009, 08:42:29 AM
Quote from: Victor Kirhenshtein on May 05, 2009, 10:14:24 PM
Еще один вариант - в 0.2.25 появился экспорт бызы
А можно подробности? Где чего и как?

Все делается через nxdbmgr. И при импорте, и при экспорте сервер должен быть остановлен.

Для экспорта базы надо запустить


nxdbmgr export <file>


nxdbmgr создаст файл, в котором будет содержаться вся информация из базы.


Для импорта надо запустить


nxdbmgr import <file>


nxdbmgr очистит существующую базу и зальет информацию из файла.

Версии форматов при импорте и экспорте должны совпадать, а сами базы могут быть разными, т.е. импорт/экспорт базы можно использовать для миграции, скажем, с MySQL на Oracle.

Akira

А мне то можно ответить?
У меня и на 2.25 и на 2.26 сервис падает каждые 2-5 часов.
Анноит.  >:(

Victor Kirhenshtein

Sorry, zabegalsja :( Dobav'te pozalujsta parametri


CreateCrashDumps = yes
DumpDirectory = <some_dir>


v netxmsd.conf. Kogda on sledujuschij raz upadet, v kataloge ukazannom kak DumpDirectory pojavjatsja faili .mdmp i .info - prishlite ih na [email protected]. Budu razbiratsja.


Alex Kirhenshtein

Очень интересный креш, деление на ноль в глубине WinSock (при том, что в socket() сложно передать некорректные данные):

[WS2HELP:71BF17F4]: WahInsertHandleContext
  [mswsock:71B24A16]: (function-name not available)
  [mswsock:71B24608]: (function-name not available)
  [WS2_32:71C03FD5]: WSASocketW
  [WS2_32:71C0416E]: socket
...


А за железом, на котором сервер работает, никаких странностей не наблюдалось?

Quote from: Akira on May 10, 2009, 06:25:49 AM
У меня и на 2.25 и на 2.26 сервис падает каждые 2-5 часов.

А была ли версия, которая не падала?
Если да — я попробую поймать проблему, просмотрев изменениях между версиями.

Akira

Проблему локализовал косвенно.

Падения начались как только я поставил на мониторинг SNMP две циски 2811 не напрямую с сервера, а через SNMP Proxy агента.
Как сделал напрямую с Netxmx сервера, уже три дня ни одного падения.

Alex Kirhenshtein

Ага, замечательно. Будем смотреть.

Quote from: Akira on May 17, 2009, 04:45:20 PM
Проблему локализовал косвенно.