Страница 1 из 2

CONNMGR.NLM

СообщениеДобавлено: 07 дек 2006, 15:13
Орлов Алексей
Добрый день. Сегодня сервер упал в 44 abends. Причина:
Novell Netware, V6.5 Support Pack 5 - CPR Release
PVER: 6.50.05

Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0060 DS = 007B ES = 007B FS = 007B GS = 007B SS = 0068
EAX = 442AA640 EBX = A9FE1260 ECX = A88E4CB4 EDX = 8CC63352
ESI = A88E4CC0 EDI = A88E4B3E EBP = 000001B9 ESP = A88E4B0C
EIP = 87D9ECD7 FLAGS = 00010286
87D9ECD7 8B00 MOV EAX, [EAX]=?
EIP in CONNMGR.NLM at code start +0000DCD7h
Access Location: 0x442AA640

The violation occurred while processing the following instruction:
87D9ECD7 8B00 MOV EAX, [EAX]
87D9ECD9 8906 MOV [ESI], EAX
87D9ECDB 83C30C ADD EBX, 0000000C
87D9ECDE 53 PUSH EBX
87D9ECDF E8CC283778 CALL LOADER.NLM|atomic_dec
87D9ECE4 83C404 ADD ESP, 00000004
87D9ECE7 31C0 XOR EAX, EAX
87D9ECE9 5D POP EBP
87D9ECEA 5F POP EDI
87D9ECEB 5E POP ESI



Running process: Server 01:77 Process
Thread Owned by NLM: SERVER.NLM
Stack pointer: A88E4F60
OS Stack limit: A88DD020
Scheduling priority: 67371008
Wait state: 50500F0 Waiting for work
Stack: --8CC63352 ?
--A88E4B30 ?
--8CC63352 ?
--8CC62E40 ?
8C7C781F (NCP.NLM|Case23+1563)
--000001B9 (LOADER.NLM|KernelAddressSpace+1B9)
--A88E4B30 ?
--A88E4CB4 ?
--A88E4CC0 ?
--6D6F4B0D ?
--61737369 ?
--61766F72 ?
--0000495F (LOADER.NLM|KernelAddressSpace+495F)
--87580164 ?
--87580164 ?
--00000002 (LOADER.NLM|KernelAddressSpace+2)
--875801A8 ?
8D8485BC (TCPIP.NLM|IPSendWithRoute+3DC)
--87580164 ?
--8F079D50 ?
--875801A8 ?
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--8F079EBC ?
--87580164 ?
--875801A8 ?
8D848303 (TCPIP.NLM|IPSendWithRoute+123)
--87580164 ?
--8F079EBC ?
--87580164 ?
--875801D0 ?
--8F079EBC ?
--8F070050 ?
8EF6EDF2 (TCP.NLM|TCPAnyAddrCheck+56C6)
--87580164 ?
--8F079EBC ?
--875801D0 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--0FA31EB6 ?
--8F079D50 ?
8EF6E001 (TCP.NLM|TCPAnyAddrCheck+48D5)
--8F079D50 ?
--A88E4BB8 ?
--184D1050 ?
--BB4B255D ?
--FFFFFF42 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--875801E6 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
-00040000 (LOADER.NLM|BIOSDriveCount+BD0)
--A88E4C64 ?
--8F079D50 ?
8EF6C1CE (TCP.NLM|TCPAnyAddrCheck+2AA2)
--8F079D50 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--00000046 (LOADER.NLM|KernelAddressSpace+46)
--0FA41DF7 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--8F079D50 ?
--A88E4C64 ?
8EF6B24C (TCP.NLM|TCPAnyAddrCheck+1B20)
--8F079D50 ?
--A88E4C64 ?
--0FA41DF7 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--3FFFFFFF ?
--8F079D50 ?
--00000001 (LOADER.NLM|KernelAddressSpace+1)
--A88E4C64 ?
8EF6AE70 (TCP.NLM|TCPAnyAddrCheck+1744)
--8F079D50 ?
--A88E4C64 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--8F079D50 ?
--A88E4C64 ?
8EF6A878 (TCP.NLM|TCPAnyAddrCheck+114C)
--8F079D50 ?
--A88E4C64 ?
8EF7389C (TCP.NLM|TCPMPUnsafeConnectionLookup+5B0)
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--8F079D50 ?
--00000004 (LOADER.NLM|KernelAddressSpace+4)
--8F079D50 ?
8EF6981A (TCP.NLM|TCPAnyAddrCheck+EE)
--8F079D50 ?
--A88E4C64 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--A88E4C90 ?
--A88E4CA0 ?
--5D254B9D ?
--0FA31EB6 ?
--5D254BBA ?
--0000001E (LOADER.NLM|KernelAddressSpace+1E)
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--FFFF0018 ?
--0000FFFF (LOADER.NLM|KernelAddressSpace+FFFF)
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--0C020210 ?
--FC8BA8C0 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)

Additional Information:
The CPU encountered a problem executing code in CONNMGR.NLM. The problem may be in that module or in data passed to that module by a process owned by SERVER.NLM.


Да я понимаю что в 6sp был обновлен этот модуль. И до сегодняшнего дня все было хорошо. За что отвечает эта nlm? Спасибо за ответ.

СообщениеДобавлено: 07 дек 2006, 16:04
Музалёв Николай
Если текст модуля посмотреть какой простой смотрелкой( Ф3 в фаре, напр) , то есть вероятность увидеть среди кракозяб в начале файла вменяемую текстовую строку .
В ней порядОШные разработчики обычно пишут назаначение модуля.
Попробуйте...

СообщениеДобавлено: 07 дек 2006, 16:07
Орлов Алексей
The Connecting Manager (CONNMGR.NLM) first contacts NDS, so that CONNMGR.NLM can verify the authenticity of the object. Once the CONNMGR.NLM determines that the object is valid, CONNMGR.NLM makes a request to the NetWare Policy Manager (POLIMGR.NLM) for a license unit.

Но теперь не пойму, что могло быть причиной???

СообщениеДобавлено: 07 дек 2006, 17:17
Музалёв Николай
что могло быть причиной???

Дык что вам важнее: "кто виноват" или "что делать"?

По поводу причины абенда - можно принять за основу сообщ. системы: код или данные модуля CON полезли в область памяти, занятую др. модулем. Обычное дело в неустоявшихся с-паках...

По поводу как победить - тоже обычная метода -
1)искать след. версию проблемного модуля, чтить ТИДы.
2)иностр. форумы. Возможно найдено врем. решение.
3)если пока нету решения, то написать о том супостату и поторопить с новым модулем.
3)если возможен DOWNGRADE, то попробовать этот модуль от младших паков или даже младших версий.
4)в кр. случае - временно съехать назад.

Встречный вопрос: а предыдущие 43 абенда были уже при текущем паке? может, он пока действительно сыроват ?

СообщениеДобавлено: 07 дек 2006, 17:34
Константин Ошмян
Орлов Алексей писал(а):Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)

[...]
Но теперь не пойму, что могло быть причиной???
Причиной 25-го абенда могло стать что угодно, с наибольшей вероятностью - предыдущие 24 абенда. Конструктивнее разбираться в причинах первого.

Re: CONNMGR.NLM

СообщениеДобавлено: 07 дек 2006, 17:40
Владимир Горяев
Орлов Алексей писал(а):Добрый день. Сегодня сервер упал в 44 abends. Причина:
Novell Netware, V6.5 Support Pack 5 - CPR Release
PVER: 6.50.05

Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)
...
Да я понимаю что в 6sp был обновлен этот модуль. И до сегодняшнего дня все было хорошо. За что отвечает эта nlm? Спасибо за ответ.
Abend 25 наверняка вызван предидущими 24-ю. См. Abend 1.

Server-5.70.05 версия server.exe точно от SP5 , выходит микс версий, что с ДОС-разделом?

СообщениеДобавлено: 07 дек 2006, 18:12
Орлов Алексей
Да ничего пока, работает в прежнем режиме. Завтра буду ребутиться, проблема только в том, что после abend один пользователь залочил файл и никак не хочет его отпускать, пользователь и перезагружался и я его пытался с консоли сбросить, но висит тупо, ни на что не реагирует :(

СообщениеДобавлено: 07 дек 2006, 18:43
Владимир Горяев
Продолжу мысль про ДОС раздел. Помнится кто-то накатил SP и после зачем-то из бекапа воостановил досовый раздел, а там ессно старая версия server.exe.

Еще вот недавно был случай.

СообщениеДобавлено: 07 дек 2006, 19:13
Орлов Алексей
все сервак не выдержал :) Сейчас ребутнусь проверю server.exe

СообщениеДобавлено: 07 дек 2006, 19:23
Орлов Алексей
server.exe от 4.11.2006

СообщениеДобавлено: 08 дек 2006, 20:04
Алексей Волков
К сожалению, у нас на нескольких серверах с бешанной нагрузкой до недавнего времени наблюдалась подобная проблема. Причем сервер практически гарантированно после возникновения подобного абенда спустя несколько часов перегружался.

Что мы только не перепробовали, ничего не помогало.
Для нас единсвенным выходом на 5-ом sp стало отключение второго проца на серверах. После того, как сервера стали однопроцессорными, проблема исчезла.

Возможно, в 6-м саппорт паке что-то с этим модулем изменилось, но мне как-то пробовать на боевых серверах, где по 600 человек сидит, не хочется.

СообщениеДобавлено: 11 дек 2006, 13:30
Sergant
Алексей Волков

Если не секрет, а что за сервера используете ? Hyper-Threading (если есть) пробовали выключать ?

СообщениеДобавлено: 11 дек 2006, 20:05
Алексей Волков
Сервера HP.
Hyperthreading, безусловно, отключён!

СообщениеДобавлено: 12 дек 2006, 08:49
Орлов Алексей
В моем случае HP, гипер конечно отключен. Сейчас отключил один процессор, посмотрим.

СообщениеДобавлено: 12 дек 2006, 15:25
Аркадий Глазырин
Орлов Алексей писал(а):В моем случае HP, гипер конечно отключен. Сейчас отключил один процессор, посмотрим.


Эм...эм...
А как выключать второй процесор?

Помимо физического изъятия.