Сервер NetWare 6.5 SP3. Часто падает с critical error.

Обсуждение технических вопросов по продуктам Novell

Сервер NetWare 6.5 SP3. Часто падает с critical error.

Сообщение PashaP » 20 мар 2008, 10:28

Добрый день.
Помогите разобраться со следующей проблемой
Есть 2 сервера. NetWare 6.5 SP3
Последние несколько дней второй сервер стал постоянно падать
с critical error(раз 5 за день)
лог такой:
Novell Netware, V6.5 Support Pack 3 - CPR Release
PVER: 6.50.03

Server vvv halted Thursday, 20 March 2008 9:55:41.110
Abend 1 on P00: Server-5.70.03-0: NCPIP: ReplyDisgard overflowed reply buffer!!

Registers:
CS = 0060 DS = 007B ES = 007B FS = 007B GS = 007B SS = 0068
EAX = 00000002 EBX = 000005EB ECX = 000005E3 EDX = 4B668640
ESI = 000005EB EDI = 00000001 EBP = 00000008 ESP = 4384FF4C
EIP = 4020D2F8 FLAGS = 00000202
4020D2F8 83C404 ADD ESP, 00000004
EIP in NCPIP.NLM at code start +000032F8h

The violation occurred while processing the following instruction:
4020D2F8 83C404 ADD ESP, 00000004
4020D2FB 8B44240C MOV EAX, [ESP+0C]
4020D2FF 6AFE PUSH FE
4020D301 83C00C ADD EAX, 0000000C
4020D304 50 PUSH EAX
4020D305 E8E65CF0BF CALL LOADER.NLM|atomic_and
4020D30A 83C408 ADD ESP, 00000008
4020D30D 8B44240C MOV EAX, [ESP+0C]
4020D311 F6400D01 TEST byte ptr [EAX+0D], 01
4020D315 7451 JZ 4020D368



Running process: Server 00:33 Process
Thread Owned by NLM: SERVER.NLM
Stack pointer: 43850F60
OS Stack limit: 43849020
Scheduling priority: 67371008
Wait state: 50500F0 Waiting for work
Stack: -40221BDC (NCPIP.NLM|(Data Start)+BDC)
--4B6686CE ?
--4B6686CE ?
--4B66871C ?
--4B668640 ?
--43850F00 ?
--4B66871C ?
--4B6686F4 ?
--4B668CFF ?
B224E259 (NWSA.NSS|NSSCase89+459)
--4B6686F4 ?
--00000000 ?
--00000001 ?
--4B66871C ?
--000005E3 ?
--844F1850 ?
--540C8C9D ?
--FFFFFFD6 (LOADER.NLM|KernelTempAliasesEnd+FD6)
--00000000 ?
--99CF4DA6 ?
--B7FF9A98 ?
--99CF4DA6 ?
--00000000 ?
--4B668690 ?
B7CAEDD9 (TCP.NLM|TCPNewSendData+541)
--B7FF9A98 ?
--00000001 ?
--00000019 ?
B7CAEBE8 (TCP.NLM|TCPNewSendData+350)
--B7FF9A98 ?
--00000019 ?
--00000000 ?
--FFFFFFFF (LOADER.NLM|KernelTempAliasesEnd+FFF)
--45A1DA80 ?
--43850B78 ?
--00000B92 ?
--00000000 ?
--00000019 ?
--00000000 ?
--00000019 ?
4020EB03 (NCPIP.NLM|UDPShimSendMessage+17F)
--4B668690 ?
4020EB10 (NCPIP.NLM|UDPShimSendMessage+18C)
-40222624 (NCPIP.NLM|numberOfTCPReplies+0)
--43850038 ?
B42426AE (COMN.NSS|VAUTH_MayIDoThis+2AE)
--43850B78 ?
--4636E1E0 ?
-0049F318 ?
--00000000 ?
--4385001C ?
--00000000 ?
--00000041 ?
--4636E1E0 ?
--00000003 ?
--45A1DA80 ?
--43850B78 ?
-0049F318 ?
--43850958 ?
--43850080 ?
B426F7F6 (COMN.NSS|COMN_Lookup+496)
--43850B78 ?
--4636E1E0 ?
--00000019 ?
--4B668D10 ?
--00000002 ?
B426F43A (COMN.NSS|COMN_Lookup+DA)
--00000000 ?
--0000FFFF ?
--00000000 ?
--43850D0C ?
--4B668640 ?
--00000001 ?
--43850D15 ?
--4B668D50 ?
4020D182 (NCPIP.NLM|ReplyKeep+1EA)
--4B66864C ?
--FDFFFFFF ?
--4B6686CE ?
--4B6686CE ?
--43850D0C ?
--4B668640 ?
--43850CEC ?
--00000009 ?
--43850D0C ?
--00000000 ?
B224DB03 (NWSA.NSS|NSSCase87+40E3)
B3F3863F (NSS.NLM|NSSMPK_UnlockNss+1F)
-B3F85C28 (NSS.NLM|NSSMPK_spinlock+0)
--00000000 ?
--43850CEC ?
B2249B94 (NWSA.NSS|NSSCase87+174)
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?

Additional Information:
The NetWare OS detected a problem with the system while executing a process owned by NCPIP.NLM. It may be the source of the problem or there may have been a memory corruption.


В чем может быть проблема?
PashaP
 
Сообщения: 11
Зарегистрирован: 04 янв 2005, 15:58

Сообщение Иван Левшин aka Ivan L. » 20 мар 2008, 11:28

Как всегда - дежурные вопросы.

1. Сервер только установили или он стоял и работал до начала падений?
2. Что делали до того, как начались падения?
Иван Левшин aka Ivan L.
 
Сообщения: 2592
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.

Сообщение PashaP » 20 мар 2008, 12:06

Сервер стоял и работал уже года 2
Проблем не было
никаких действий перед начало этих падений не было
сервер выступает только как файловый
для полноты картины скажу что в серверной довольно тепло
так как вышел из строя один из кондиционеров
конфигурация сервера - Xeon 3 Ghz, Ram 1 Gb двумя линейками по 512, тип памяти DDR 2100 ECC, RAID 5 из 3 SATA дисков по 250Gb

И еще
убирание 1 линеки памяти немного облегчает ситуацию - сервер после этого может отработать без сбоев часов 12. Затем все повторяется.
Сбои начинают идти почти каждый час. Бывает что сразу после загрузки снова сбой.
PashaP
 
Сообщения: 11
Зарегистрирован: 04 янв 2005, 15:58

Сообщение Иван Левшин aka Ivan L. » 20 мар 2008, 12:31

Ну теперь уже глупый вопрос - а всякие глупости типа тестов памяти и прочего железа - проводились чи шо? Если ничего не делали - стопудово железо.
Иван Левшин aka Ivan L.
 
Сообщения: 2592
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.

Сообщение PashaP » 20 мар 2008, 12:37

Хм
вопрос не глупый но остановить сервак на время тестов не могу
хоть он и валиться но какое то время робит
и остановить долше чем на время перегрузки никто не даст
плюс на память я и сам грешу, но найти такой тип памяти сейчас
проблемотично, уже 3 дня ищем. В нашем городе нет. Обещают привезти под заказ но когда это случиться, не знаю точно. А сервак валиться. Короче засада.
Есть вопрос NCPIP.nlm - это что за зверь? по быстрому так и не понял что это такое.
PashaP
 
Сообщения: 11
Зарегистрирован: 04 янв 2005, 15:58

Сообщение Владимир Горяев » 20 мар 2008, 13:23

Гипертрейдинг не включен? Если вкл., то отключить.

Еще
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

Сообщение PashaP » 20 мар 2008, 13:30

Гипер трейдинг был включен. И с ним все работало без проблем
Соотвественно когда вылезла эта проблема - первым делом гипер трейдинг отключили. Не помогло
http://wiki.novell.com/index.php/Nw65sp ... rver_Abend - это я уже читал.
Но у нас iManager не 2,7 и не Cluster_Server

Вечером хучу накатить SP6
надеюсь поможет.
Правда на первом серваке на Pervasive 2000i крутиться корпоративная база данных. поэтому накатывать туда SP6 как то боязно. Был печальный опыт с Netware 5.1, когда после накатывания SP7 сервак просто не стартовал после перезагрузки.

Отсюда вопрос
как будут работать серваки если на одном останется Netware 6.5 SP3,
а на другом будет Netware 6.5 SP6?
PashaP
 
Сообщения: 11
Зарегистрирован: 04 янв 2005, 15:58

Re: Сервер NetWare 6.5 SP3. Часто падает с critical error.

Сообщение Андрей Тр. aka RH » 20 мар 2008, 14:10

Прикольно ..

Novell Netware, V6.5 Support Pack 3 - CPR Release
PVER: 6.50.03
Server vvv halted Thursday, 20 March 2008 9:55:41.110
Abend 1 on P00: Server-5.70.03-0: NCPIP: ReplyDisgard overflowed reply buffer!!
..
EIP in NCPIP.NLM at code start +000032F8h
Running process: Server 00:33 Process
Thread Owned by NLM: SERVER.NLM

и :
Novell Netware, V6.5 Support Pack 3 - CPR Release
PVER: 6.50.03
Server XXXXX36 halted Tuesday, 4 December 2007 16.09.15.072
Abend 1 on P00: Server-5.70.03-0: NCPIP: ReplyDisgard overflowed reply buffer!!
EIP in NCPIP.NLM at code start +000032F8h
Running process: Server 00:51 Process
Thread Owned by NLM: SERVER.NLM

Как говорится, найдите 10 различий.
After more than a year uptime iManager 2.7 causes Cluster Server Abend

Warning: Do not use iManager 2.7 Volume browse feature on NW6.5 cluster nodes which have an relatively old patch level. In our case SP3

взято с http://wiki.novell.com/index.php/Nw65sp7
Даешь отдельный раздел по ZENworks ... :bad-words: .. и печати !
Аватара пользователя
Андрей Тр. aka RH
 
Сообщения: 3937
Зарегистрирован: 18 июн 2002, 11:27


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8

cron