CONNMGR.NLM

Обсуждение технических вопросов по продуктам Novell

CONNMGR.NLM

Сообщение Орлов Алексей » 07 дек 2006, 15:13

Добрый день. Сегодня сервер упал в 44 abends. Причина:
Novell Netware, V6.5 Support Pack 5 - CPR Release
PVER: 6.50.05

Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0060 DS = 007B ES = 007B FS = 007B GS = 007B SS = 0068
EAX = 442AA640 EBX = A9FE1260 ECX = A88E4CB4 EDX = 8CC63352
ESI = A88E4CC0 EDI = A88E4B3E EBP = 000001B9 ESP = A88E4B0C
EIP = 87D9ECD7 FLAGS = 00010286
87D9ECD7 8B00 MOV EAX, [EAX]=?
EIP in CONNMGR.NLM at code start +0000DCD7h
Access Location: 0x442AA640

The violation occurred while processing the following instruction:
87D9ECD7 8B00 MOV EAX, [EAX]
87D9ECD9 8906 MOV [ESI], EAX
87D9ECDB 83C30C ADD EBX, 0000000C
87D9ECDE 53 PUSH EBX
87D9ECDF E8CC283778 CALL LOADER.NLM|atomic_dec
87D9ECE4 83C404 ADD ESP, 00000004
87D9ECE7 31C0 XOR EAX, EAX
87D9ECE9 5D POP EBP
87D9ECEA 5F POP EDI
87D9ECEB 5E POP ESI



Running process: Server 01:77 Process
Thread Owned by NLM: SERVER.NLM
Stack pointer: A88E4F60
OS Stack limit: A88DD020
Scheduling priority: 67371008
Wait state: 50500F0 Waiting for work
Stack: --8CC63352 ?
--A88E4B30 ?
--8CC63352 ?
--8CC62E40 ?
8C7C781F (NCP.NLM|Case23+1563)
--000001B9 (LOADER.NLM|KernelAddressSpace+1B9)
--A88E4B30 ?
--A88E4CB4 ?
--A88E4CC0 ?
--6D6F4B0D ?
--61737369 ?
--61766F72 ?
--0000495F (LOADER.NLM|KernelAddressSpace+495F)
--87580164 ?
--87580164 ?
--00000002 (LOADER.NLM|KernelAddressSpace+2)
--875801A8 ?
8D8485BC (TCPIP.NLM|IPSendWithRoute+3DC)
--87580164 ?
--8F079D50 ?
--875801A8 ?
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--8F079EBC ?
--87580164 ?
--875801A8 ?
8D848303 (TCPIP.NLM|IPSendWithRoute+123)
--87580164 ?
--8F079EBC ?
--87580164 ?
--875801D0 ?
--8F079EBC ?
--8F070050 ?
8EF6EDF2 (TCP.NLM|TCPAnyAddrCheck+56C6)
--87580164 ?
--8F079EBC ?
--875801D0 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--0FA31EB6 ?
--8F079D50 ?
8EF6E001 (TCP.NLM|TCPAnyAddrCheck+48D5)
--8F079D50 ?
--A88E4BB8 ?
--184D1050 ?
--BB4B255D ?
--FFFFFF42 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--875801E6 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
-00040000 (LOADER.NLM|BIOSDriveCount+BD0)
--A88E4C64 ?
--8F079D50 ?
8EF6C1CE (TCP.NLM|TCPAnyAddrCheck+2AA2)
--8F079D50 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--00000046 (LOADER.NLM|KernelAddressSpace+46)
--0FA41DF7 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--8F079D50 ?
--A88E4C64 ?
8EF6B24C (TCP.NLM|TCPAnyAddrCheck+1B20)
--8F079D50 ?
--A88E4C64 ?
--0FA41DF7 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--3FFFFFFF ?
--8F079D50 ?
--00000001 (LOADER.NLM|KernelAddressSpace+1)
--A88E4C64 ?
8EF6AE70 (TCP.NLM|TCPAnyAddrCheck+1744)
--8F079D50 ?
--A88E4C64 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--8F079D50 ?
--A88E4C64 ?
8EF6A878 (TCP.NLM|TCPAnyAddrCheck+114C)
--8F079D50 ?
--A88E4C64 ?
8EF7389C (TCP.NLM|TCPMPUnsafeConnectionLookup+5B0)
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--8F079D50 ?
--00000004 (LOADER.NLM|KernelAddressSpace+4)
--8F079D50 ?
8EF6981A (TCP.NLM|TCPAnyAddrCheck+EE)
--8F079D50 ?
--A88E4C64 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--A88E4C90 ?
--A88E4CA0 ?
--5D254B9D ?
--0FA31EB6 ?
--5D254BBA ?
--0000001E (LOADER.NLM|KernelAddressSpace+1E)
--00000014 (LOADER.NLM|KernelAddressSpace+14)
--FFFF0018 ?
--0000FFFF (LOADER.NLM|KernelAddressSpace+FFFF)
--00000000 (LOADER.NLM|KernelAddressSpace+0)
--0C020210 ?
--FC8BA8C0 ?
--00000000 (LOADER.NLM|KernelAddressSpace+0)

Additional Information:
The CPU encountered a problem executing code in CONNMGR.NLM. The problem may be in that module or in data passed to that module by a process owned by SERVER.NLM.


Да я понимаю что в 6sp был обновлен этот модуль. И до сегодняшнего дня все было хорошо. За что отвечает эта nlm? Спасибо за ответ.
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Музалёв Николай » 07 дек 2006, 16:04

Если текст модуля посмотреть какой простой смотрелкой( Ф3 в фаре, напр) , то есть вероятность увидеть среди кракозяб в начале файла вменяемую текстовую строку .
В ней порядОШные разработчики обычно пишут назаначение модуля.
Попробуйте...
armoracia rusticana (lat.), "блины" и "фиги" всех видов, а также смайлики - крайне не желательны !
Музалёв Николай
 
Сообщения: 3034
Зарегистрирован: 04 июн 2002, 19:58
Откуда: Беларусь. МИНСК.

Сообщение Орлов Алексей » 07 дек 2006, 16:07

The Connecting Manager (CONNMGR.NLM) first contacts NDS, so that CONNMGR.NLM can verify the authenticity of the object. Once the CONNMGR.NLM determines that the object is valid, CONNMGR.NLM makes a request to the NetWare Policy Manager (POLIMGR.NLM) for a license unit.

Но теперь не пойму, что могло быть причиной???
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Музалёв Николай » 07 дек 2006, 17:17

что могло быть причиной???

Дык что вам важнее: "кто виноват" или "что делать"?

По поводу причины абенда - можно принять за основу сообщ. системы: код или данные модуля CON полезли в область памяти, занятую др. модулем. Обычное дело в неустоявшихся с-паках...

По поводу как победить - тоже обычная метода -
1)искать след. версию проблемного модуля, чтить ТИДы.
2)иностр. форумы. Возможно найдено врем. решение.
3)если пока нету решения, то написать о том супостату и поторопить с новым модулем.
3)если возможен DOWNGRADE, то попробовать этот модуль от младших паков или даже младших версий.
4)в кр. случае - временно съехать назад.

Встречный вопрос: а предыдущие 43 абенда были уже при текущем паке? может, он пока действительно сыроват ?
armoracia rusticana (lat.), "блины" и "фиги" всех видов, а также смайлики - крайне не желательны !
Музалёв Николай
 
Сообщения: 3034
Зарегистрирован: 04 июн 2002, 19:58
Откуда: Беларусь. МИНСК.

Сообщение Константин Ошмян » 07 дек 2006, 17:34

Орлов Алексей писал(а):Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)

[...]
Но теперь не пойму, что могло быть причиной???
Причиной 25-го абенда могло стать что угодно, с наибольшей вероятностью - предыдущие 24 абенда. Конструктивнее разбираться в причинах первого.
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: CONNMGR.NLM

Сообщение Владимир Горяев » 07 дек 2006, 17:40

Орлов Алексей писал(а):Добрый день. Сегодня сервер упал в 44 abends. Причина:
Novell Netware, V6.5 Support Pack 5 - CPR Release
PVER: 6.50.05

Server MASTER halted Thursday, 7 December 2006 13:24:32.741
Abend 25 on P01: Server-5.70.05: Page Fault Processor Exception (Error code 00000000)
...
Да я понимаю что в 6sp был обновлен этот модуль. И до сегодняшнего дня все было хорошо. За что отвечает эта nlm? Спасибо за ответ.
Abend 25 наверняка вызван предидущими 24-ю. См. Abend 1.

Server-5.70.05 версия server.exe точно от SP5 , выходит микс версий, что с ДОС-разделом?
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

Сообщение Орлов Алексей » 07 дек 2006, 18:12

Да ничего пока, работает в прежнем режиме. Завтра буду ребутиться, проблема только в том, что после abend один пользователь залочил файл и никак не хочет его отпускать, пользователь и перезагружался и я его пытался с консоли сбросить, но висит тупо, ни на что не реагирует :(
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Владимир Горяев » 07 дек 2006, 18:43

Продолжу мысль про ДОС раздел. Помнится кто-то накатил SP и после зачем-то из бекапа воостановил досовый раздел, а там ессно старая версия server.exe.

Еще вот недавно был случай.
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

Сообщение Орлов Алексей » 07 дек 2006, 19:13

все сервак не выдержал :) Сейчас ребутнусь проверю server.exe
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Орлов Алексей » 07 дек 2006, 19:23

server.exe от 4.11.2006
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Алексей Волков » 08 дек 2006, 20:04

К сожалению, у нас на нескольких серверах с бешанной нагрузкой до недавнего времени наблюдалась подобная проблема. Причем сервер практически гарантированно после возникновения подобного абенда спустя несколько часов перегружался.

Что мы только не перепробовали, ничего не помогало.
Для нас единсвенным выходом на 5-ом sp стало отключение второго проца на серверах. После того, как сервера стали однопроцессорными, проблема исчезла.

Возможно, в 6-м саппорт паке что-то с этим модулем изменилось, но мне как-то пробовать на боевых серверах, где по 600 человек сидит, не хочется.
Алексей Волков
 
Сообщения: 292
Зарегистрирован: 14 окт 2003, 19:21
Откуда: Kiev

Сообщение Sergant » 11 дек 2006, 13:30

Алексей Волков

Если не секрет, а что за сервера используете ? Hyper-Threading (если есть) пробовали выключать ?
Sergant
 
Сообщения: 330
Зарегистрирован: 22 сен 2006, 14:41
Откуда: Москва

Сообщение Алексей Волков » 11 дек 2006, 20:05

Сервера HP.
Hyperthreading, безусловно, отключён!
Алексей Волков
 
Сообщения: 292
Зарегистрирован: 14 окт 2003, 19:21
Откуда: Kiev

Сообщение Орлов Алексей » 12 дек 2006, 08:49

В моем случае HP, гипер конечно отключен. Сейчас отключил один процессор, посмотрим.
Даёшь полный контроль над Юзверем!!!
-------------------------------------------------------
Я еще из тех, кто учился азбуке по букварю, а не по клавиатуре....

Иногда пишу в своем блоге на тему ms Lync, directaccess.
Аватара пользователя
Орлов Алексей
 
Сообщения: 953
Зарегистрирован: 04 июн 2003, 12:43
Откуда: Нижний Новгород

Сообщение Аркадий Глазырин » 12 дек 2006, 15:25

Орлов Алексей писал(а):В моем случае HP, гипер конечно отключен. Сейчас отключил один процессор, посмотрим.


Эм...эм...
А как выключать второй процесор?

Помимо физического изъятия.
Аватара пользователя
Аркадий Глазырин
 
Сообщения: 2762
Зарегистрирован: 16 авг 2002, 09:09
Откуда: Екатеринбург

След.

Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 21

cron