Прблема с серверами после установки 8.7.3 ;-(( HELP! (+)

Обсуждение технических вопросов по продуктам Novell

Прблема с серверами после установки 8.7.3 ;-(( HELP! (+)

Сообщение Сергей ака godless » 07 июн 2004, 08:51

Прошу помощи/совета как решить возникшую у меня проблему.

Ситуация: два сервера NW 5.1.7 и NW 6.0.3 ... Стояли соответственно NDS 8.0.9 и eDir 8.6.2 ... По мануалу проапгрэйджена на пятёрке ява до 1.3.1, ниси поднят до 2.6.4 на обоих, проапгрэджена схема дерева, проверена на ошибки, поставлена eDir 8.7.3 ... Вроде установилась, по крайней мере по запросу выдаёт версию DS.NLM 10550.98 ... На обоих ...
До этой установки где то месяц ничего не делалось с серверами, 5-ка работала вообще как шлюз только, на шестёрке правда куча всего вертелась, включая NES(+JS_Gateway), Apache, GW 6.0.4 beta, SProtect ну и по мелочи ещё ... Но оба вертелись без вопросов (за исключением PO GW на 6-ке, но оно запущенно в протектед мемори)

Проблема: после установки 8.7.3 оба сервера стали выпадать ночами по ошибке доступа к память. На 5-ке может и мало (для чего???!!!) 128 метров всего и 800метров на SYS, но он как гейт стоял - так и стоит ...
А с 6-й вообще не понятно, гиг оперативки, полтора гига на SYS - и всё равно вываливается ... %-((
Сомптомы похожие, на системной консоли выдаётся ошибочный запрос к памяти, не хватает её типа ... ;-(( К сожалению забыл записать, а то бы привёл.
Отсутствие памяти выбивает оба сервера в абенды ... ;-((

Вопрос: извечный русский ... Что делать ?? Есть ли возможность откатить установку 8.7.3 на предидущие значения и забыть как страшный сон или придётся копать до упора, пытаться запустить ??
Прошу помощи и совета :oops:
"И да будет так ..." - как говаривал король Артур ...
Аватара пользователя
Сергей ака godless
 
Сообщения: 559
Зарегистрирован: 17 сен 2003, 15:38
Откуда: Moscow

Сообщение PavelKHTW » 07 июн 2004, 09:06

А питание у тебя ночью не сбоит? - Посмотри по логам UPS - может твоему UPS пришел конец?
PavelKHTW
 
Сообщения: 1037
Зарегистрирован: 08 окт 2003, 13:02
Откуда: Украина

Сообщение Сергей ака godless » 07 июн 2004, 10:07

PavelKHTW писал(а):А питание у тебя ночью не сбоит? - Посмотри по логам UPS - может твоему UPS пришел конец?


Как это ни странно - UPSы в порядке, полтора месяца назад менялись батареи и две недели назад проверка была с отключением питания ... %-( Арендодатели чего то с сетью мудрили ... ;-(( Так что проверено - работает ...
"И да будет так ..." - как говаривал король Артур ...
Аватара пользователя
Сергей ака godless
 
Сообщения: 559
Зарегистрирован: 17 сен 2003, 15:38
Откуда: Moscow

А можно кусочек abend.log

Сообщение Boris Morozov » 07 июн 2004, 21:38

соответствующий в студию. Может тут edir8.7.3 вообще ни при чем, что скорей всего. Я таких глюков ни у кого не замечал именно с 8.7.3
Boris Morozov
 
Сообщения: 1333
Зарегистрирован: 05 июн 2002, 22:24
Откуда: Минск

Да вот они, если помогут (abend.log's part)

Сообщение Сергей ака godless » 09 июн 2004, 09:26

<b>Да не вопрос, вот кусок abend.log с 5.1SP7 с Java 1.3.1:</b>

Server F02 halted Tuesday, June 8, 2004 6:07:42.907 pm
Abend 4 on P00: Server-5.00k: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0008 DS = 0010 ES = 0010 FS = 0010 GS = 0010 SS = 0010
EAX = 00000000 EBX = D6829140 ECX = D2C15E04 EDX = D2C15E04
ESI = D37840C0 EDI = 00000000 EBP = 00000000 ESP = D0550914
EIP = D250AD3D FLAGS = 00010246
D250AD3D 8B454C MOV EAX,[EBP+4C]=?
EIP in NLMLIB.NLM at code start +00014D3Dh
Access Location: 0x0000004C

The violation occurred while processing the following instruction:
D250AD3D 8B454C MOV EAX,[EBP+4C]
D250AD40 83C404 ADD ESP,00000004
D250AD43 89C6 MOV ESI,EAX
D250AD45 85C0 TEST EAX,EAX
D250AD47 7417 JZ D250AD60
D250AD49 3B5804 CMP EBX,[EAX+04]
D250AD4C 7523 JNZ D250AD71
D250AD4E 39F0 CMP EAX,ESI
D250AD50 7519 JNZ D250AD6B
D250AD52 8B1E MOV EBX,[ESI]



Running process: Console Command Process
Created by: NetWare Application
Thread Owned by NLM: SERVER.NLM
Stack pointer: D0550918
OS Stack limit: D0549040
Scheduling priority: 67371008
Wait state: 3030070 (Yielded CPU)
Stack: --D68290E0 ?
--D3B1A160 ?
--D0550930 ?
--00000000 ?
--D05509B4 ?
D2627BFF (NLSLSP.NLM|(Code Start)+3BFF)
--D68291A0 ?
--D0550950 ?
--00000000 ?
--D3B1A160 ?
--D05509B4 ?
D2624953 (NLSLSP.NLM|(Code Start)+953)
D267C32F ?
--D4D06EC0 (NSPSAP.NLM|NSPInternalNetNumber+28B8)
--D0550968 ?
--D0550968 ?
--00000000 ?
--D3B1A160 ?
--D05509B4 ?
D262538A (NLSLSP.NLM|(Code Start)+138A)
--FFFFFFFF ?
--00000000 ?
--00000000 ?
--D3B1A160 ?
--D05509B4 ?
D24B6FBA (THREADS.NLM|_DestroyCallBackBlock+24E)
--00000000 ?
--FFFFFFFF ?
--D05509E0 ?
--00000000 ?
--00000001 ?
--D34386C0 ?
D24B5591 (THREADS.NLM|__CHK+21)
--D3B1A160 ?
--D05509A0 ?
--00000000 ?
--00000001 ?
--D34386C0 ?
--D05509E0 ?
FC056C68 (SERVER.NLM|EventReport+224)
--00000000 ?
--00000000 ?
--D34386C0 ?
FC042CE8 (SERVER.NLM|InternalStopServer+A4)
--00000001 ?
--D03C9E40 ?
--00000001 ?
FC042CE8 (SERVER.NLM|InternalStopServer+A4)
--D03C9E40 ?
--D0550AC8 ?
--D0007880 ?
--D0550A68 ?
FC042CE8 (SERVER.NLM|InternalStopServer+A4)
--00000081 ?
--00000000 ?
--D0550B58 ?
--000000FF ?
--D0550F19 ?
--00004DFF ?
FC07CE67 (SERVER.NLM|ServerOpen+11B)
--00000000 ?
--00000001 ?
--00000000 ?
--00000000 ?
--D0550A38 ?
--00000004 ?
--00000004 ?
--00000006 ?
--FFFFFFFF ?
--000000A0 ?
--FFFFFFFF ?
--D03C9E40 ?
-FC540564 (SERVER.NLM|eventList+10)
--D03C9E40 ?
--00000000 ?
--00000000 ?
--D0550A74 ?
D76E813C ?
--D7AD7380 ?
--D7AD7380 ?
FC056A15 (SERVER.NLM|EventCheck+ED)
FC057034 (SERVER.NLM|GenericEventOutput+0)
--D03C9E40 ?
--D0550AC8 ?
-FC587408 (SERVER.NLM|scsCommandBuffer+4)
--D0550AA8 ?
FC042BB8 (SERVER.NLM|DownCommandHandler+E0)
-FC54425C (SERVER.NLM|systemConsoleScreenStructure+0)
--00000001 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--000000FF ?
--00000002 ?
--00000001 ?
FC010017 (SERVER.NLM|kGetSemaphoreInfo+EB)
--D0020006 ?
-FC54425C (SERVER.NLM|systemConsoleScreenStructure+0)
--D0FEFE00 ?

Additional Information:
The CPU encountered a problem executing code in NLMLIB.NLM. The problem may be in that module or in data passed to that module by a process owned by SERVER.NLM.

<b>А на 6-ке (6.0.3) их даже два, один по выбиванию GWPOA:</b>

Address space GWPOA removed Sunday, June 6, 2004 12:00:55.097 am
Abend 0 on P01: Server-5.60.03: Page Fault Processor Exception (Error code 00000004)

Registers:
CS = 0053 DS = 005B ES = 005B FS = 005B GS = 005B SS = 005B
EAX = 534E434C EBX = 534E434C ECX = 0000005B EDX = 00000000
ESI = D8C1526C EDI = 00000000 EBP = DA399A1C ESP = DA399A18
EIP = FA515D97 FLAGS = 00010202
FA515D97 8B4302 MOV EAX,[EBX+02]=?
EIP in GWENN3.NLM at code start +0008BD97h
Access Location: 0x534E434E

The violation occurred while processing the following instruction:
FA515D97 8B4302 MOV EAX,[EBX+02]=?
FA515D9A 85C0 TEST EAX,EAX
FA515D9C 7410 JZ FA515DAE
FA515D9E 66833B00 CMP [EBX],0000
FA515DA2 7507 JNZ FA515DAB
FA515DA4 50 PUSH EAX
FA515DA5 E8161B3600 CALL FA8778C0
FA515DAA 59 POP ECX
FA515DAB 66FF03 INC word ptr [EBX]
FA515DAE 8D65FC LEA ESP,[EBP-04]



Running process: Processor 1: IDLE Thread Process
Thread Owned by NLM: SERVER.NLM
Stack pointer: DA399A18
User Space Stack limit: 0
CPU 1 (Thread D0A1D1E0) is in a NO SLEEP state
Scheduling priority: 67371008
Wait state: 3031111 Intermedidate Goto READY
Stack: --D962C04C ?
--DA399A54 ?
FA51AAF2 (GWENN3.NLM|GW3_flmReadLogHeader+112)
--534E434C ?
--00000005 ?
--D8C15365 ?
--000407D4 ?
--0000BC82 ?
--00000000 ?
--40C25EB7 ?
--00000000 ?
--DA399A78 ?
--D962C04C ?
--DA399D2C ?
--DA399D00 ?
--DA399CA0 ?
FA51B65D (GWENN3.NLM|GW3_flmBeginDbTrans+3BD)
--DA399D2C ?
--00000000 ?
--DA399A90 ?
--D962C0A3 ?
--D9AAC702 ?
--00000000 ?
--00000000 ?
--00000000 ?
--DA399B30 ?
--D8C1526C ?
--00000000 ?
--00000000 ?
--00000000 ?
FA4F77EC (GWENN3.NLM|GW3_flmReadAndVerifyHdrInfo+107C)
--00000000 ?
--40C25EB7 ?
--00000000 ?
--D8DDE700 ?
--D8AFFF40 ?
--DA399AC0 ?
--DA399AC0 ?
FA4F73DA (GWENN3.NLM|GW3_flmReadAndVerifyHdrInfo+C6A)
--00000000 ?
--D8AFFF40 ?
--DA399AC8 ?
FA548A74 (GWENN3.NLM|GW3_FSSetChildBlkAddr+D4)
--00000000 ?
--DA399AE4 ?
FA4F736E (GWENN3.NLM|GW3_flmReadAndVerifyHdrInfo+BFE)
-FA3AEF78 (GWENN3.NLM|(Data Start)+CF78)
--00000000 ?
--00000000 ?
--DA390000 ?
--D8AFFF40 ?
--DA399B74 ?
--DA399AFC ?
FA4F6EC4 (GWENN3.NLM|GW3_flmReadAndVerifyHdrInfo+754)
--00000000 ?
--D962C04C ?
--00000000 ?
--DA399B24 ?
FA51A871 (GWENN3.NLM|GW3_flmUnlinkDbFromTrans+A1)
--DA399B74 ?
--00000000 ?
--D8AFFF40 ?
--00000000 ?
--D894764C ?
--00000000 ?
--DA399B74 ?
--D962C092 ?
--DA399B74 ?
--00000000 ?
--DA399B58 ?
--DA399B48 ?
FAAF8C73 (THREADS.NLM|free+F)
--D8947640 ?
FA89C6F3 (GWENN3.NLM|GW3__WpmemFree+13)
--D8947640 ?
--DA399B70 ?
--DA399B60 ?
FA4F8FD5 (GWENN3.NLM|GW3_FlmGetItemName+3B5)
--DA399B58 ?
FA522163 (GWENN3.NLM|GW3_OpcExit+13)
--00000000 ?
--DA399CD0 ?
--5A80010A ?
--3E1F025A ?
--01152324 ?
--025C5A80 ?
--32F8B0CC ?
--58373427 ?
--6E576E47 ?
--11776E67 ?
--5E5A8001 ?
--FCB4CC02 ?
--3322233C ?
--53504356 ?
--5A800115 ?
--B0D40260 ?
--3E2714F8 ?
--42476037 ?
--7E677657 ?
--80010D77 ?

Additional Information:
The CPU encountered a problem executing code in GWENN3.NLM. The problem may be in that module or in data passed to that module by a process owned by SERVER.NLM.

<b>и второй по поводу TCP.NLM вроде:</b>

Server F01 halted Sunday, June 6, 2004 12:01:01.104 am
Abend 1 on P00: Server-5.60.03: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0008 DS = 005B ES = 005B FS = 005B GS = 005B SS = 0010
EAX = C9FE3040 EBX = C9FE3040 ECX = C7FD9680 EDX = 00000004
ESI = C9C1E7E0 EDI = 00000000 EBP = C9C1E830 ESP = D0AB2C5C
EIP = CDF477CF FLAGS = 00010202
CDF477CF 8B8A00020000 MOV ECX,[EDX+00000200]=?
EIP in TCP.NLM at code start +000137CFh
Access Location: 0x00000204

The violation occurred while processing the following instruction:
CDF477CF 8B8A00020000 MOV ECX,[EDX+00000200]
CDF477D5 89D3 MOV EBX,EDX
CDF477D7 85C9 TEST ECX,ECX
CDF477D9 7421 JZ CDF477FC
CDF477DB 8B8300020000 MOV EAX,[EBX+00000200]
CDF477E1 8B6804 MOV EBP,[EAX+04]
CDF477E4 55 PUSH EBP
CDF477E5 8B10 MOV EDX,[EAX]
CDF477E7 52 PUSH EDX
CDF477E8 56 PUSH ESI



Running process: Server 00:6 Process
Thread Owned by NLM: SERVER.NLM
Stack pointer: D0AB1BD4
OS Stack limit: D0AAB040
Scheduling priority: 67371008
Wait state: 5050090 Wait for interrupt
Stack: --C9C1E830 ?
--0000005B ?
--0000005B ?
--C9E49D00 ?
--C9FE3040 ?
C7FD9694 (TCPIP.MPM|MarshalledUDPClientBlockCleanup+14)
--C9FE3040 ?
--C9E49D00 ?
006E53CF (SERVER.NLM|CleanupAddressSpaceMarshalling+87)
--C9FE3040 ?
--D0AB2CA0 ?
--C9C1E830 ?
--C9C1E8F4 ?
--C9C1E7E0 ?
-0012F4DC (LOADER.EXE|OverrunStackDebug+8)
0062215A (SERVER.NLM|Terminator+116)
--C9C1E7E0 ?
--6F6D6552 ?
--20646576 ?
--72646461 ?
--20737365 ?
--63617073 ?
--65622065 ?
--73756163 ?
--666F2065 ?
--6D656D20 ?
--2079726F ?
--746F7270 ?
--69746365 ?
--76206E6F ?
--616C6F69 ?
--6E6F6974 ?
--64410A0D ?
--73657264 ?
--70532073 ?
--3A656361 ?
--47202020 ?
--414F5057 ?
--65520A0D ?
--6E6F7361 ?
--2020203A ?
--20202020 ?
--50202020 ?
--20656761 ?
--6C756146 ?
--41202C74 ?
--6D657474 ?
--74207470 ?
--6572206F ?
--66206461 ?
--206D6F72 ?
--2D6E6F6E ?
--73657270 ?
--20746E65 ?
--65676170 ?
--75520A0D ?
--6E696E6E ?
--68542067 ?
--64616572 ?
--4720203A ?
--4B484357 ?
--726F572D ?
--2072656B ?
--450A0D33 ?
--203A5049 ?
--20202020 ?
--20202020 ?
--20202020 ?
--41467830 ?
--44353135 ?
--28203739 ?
--4E455747 ?
--4E2E334E ?
--2B204D4C ?
--38783020 ?
--37394442 ?
--410A0D29 ?
--73656363 ?
--6F4C2073 ?
--69746163 ?
--203A6E6F ?
--33357830 ?
--33344534 ?
--0A0D4534 ?
--00000000 ?
--00000000 ?
--00000246 ?
--00000046 ?
0061566D (SERVER.NLM|SchedResume+15)
--B9E51120 ?
--00000046 ?
--B9F9CBDC ?
0061CD6A (SERVER.NLM|kWakeUp+A)
--B9E51120 ?
D08ABB3B (MM.NLM|BlockingIOCallback+57)
--B9F9CBEC ?
--C9752040 ?
D088726F (MM.NLM|MM_CompleteMessage+33)
--8A0801EF ?
--B9F9CBDC ?

Additional Information:
The CPU encountered a problem executing code in TCP.NLM. The problem may be in that module or in data passed to that module by a process owned by SERVER.NLM.

<b>Но появилось это всё хозяйство после установки именно 8.7.3 ... Раньше не было ... </b> :evil:

P.S. А какую информацию с абенд лога имеет смысл искать в тидах ?? Ткните пальцем ... :oops:
"И да будет так ..." - как говаривал король Артур ...
Аватара пользователя
Сергей ака godless
 
Сообщения: 559
Зарегистрирован: 17 сен 2003, 15:38
Откуда: Moscow

Сообщение capricious » 09 июн 2004, 10:25

вопрос к экспериментатору

Вам скучно жилось? Зачем начали менять НДС?
Аватара пользователя
capricious
 
Сообщения: 393
Зарегистрирован: 21 апр 2003, 14:36
Откуда: Moscow

Сообщение Сергей ака godless » 09 июн 2004, 12:18

capricious писал(а):вопрос к экспериментатору

Вам скучно жилось? Зачем начали менять НДС?


Хе хе, отвечаю ... Надоело рулить два дерева, нетварьное и виндове, хотелось всё объединить, учитывая что скоро ещё линуха появяться .... Потому и ставил ....
"И да будет так ..." - как говаривал король Артур ...
Аватара пользователя
Сергей ака godless
 
Сообщения: 559
Зарегистрирован: 17 сен 2003, 15:38
Откуда: Moscow

Ну дык а Java-то Вам чем не угодила ?

Сообщение Андрей Троценко » 09 июн 2004, 12:40

М-да, Вы определенно копаете под Java, а судя по логам - она здесь не причем.

По первому абенду - претензия на NLS-модули или NLMLIB. Второй и третий - тоже с джавой за руку не держались.

По обоим абендам: свежайшие хотфиксы ( nwlib5d(содержит NLMLIB), tcp* и FGW605A ) должны помочь.

А если грузить GWPOA в protected, так вообще можно сон улучшить.
Аватара пользователя
Андрей Троценко
 
Сообщения: 529
Зарегистрирован: 31 июл 2002, 13:54
Откуда: Киев, Украина

Re: Ну дык а Java-то Вам чем не угодила ?

Сообщение Сергей ака godless » 09 июн 2004, 13:24

Андрей Троценко писал(а):М-да, Вы определенно копаете под Java, а судя по логам - она здесь не причем.

По первому абенду - претензия на NLS-модули или NLMLIB. Второй и третий - тоже с джавой за руку не держались.

По обоим абендам: свежайшие хотфиксы ( nwlib5d(содержит NLMLIB), tcp* и FGW605A ) должны помочь.

А если грузить GWPOA в protected, так вообще можно сон улучшить.


Хм, а кто же говорит что виновата ява то ?? Я такого не сказал, не правда ваша ... ;-)) Указал что на 5.1 поставил яву 1.3.1 только чтоб показать что соблюдены требования к инсталяции eDir 8.7.3 ...

Если возможно - тыкни носом в постфиксы ... :oops: Я так понимаю там и для 5-ки и для 6-ки ?? На 6-ку надо всё таки ставить 4-й сервис видимо ... ;-(((

P.S. GWPOA работает в протект моде ... Своё адресное пространство и т.д. .... Но тем ни мение результат такой .... Варианты ??
"И да будет так ..." - как говаривал король Артур ...
Аватара пользователя
Сергей ака godless
 
Сообщения: 559
Зарегистрирован: 17 сен 2003, 15:38
Откуда: Moscow

Re: Ну дык а Java-то Вам чем не угодила ?

Сообщение Андрей Троценко » 09 июн 2004, 14:35

Сергей ака godless писал(а):...
Если возможно - тыкни носом в постфиксы ... :oops: Я так понимаю там и для 5-ки и для 6-ки ?? На 6-ку надо всё таки ставить 4-й сервис видимо ... ;-(((
...


<флейм> Нет проблем - 200 баксов ! </флейм>

http://support.novell.com/filefinder/9331/index.html
http://support.novell.com/filefinder/9331/beta.html (NWLIB5D.EXE - в списке 4й сверху, в кепке)

Задание для самостоятельной работы: найти последнее FTF обновление TCP/IP стека для NW 6 :D

Сергей ака godless писал(а):...
GWPOA работает в протект моде ... Но тем ни мение
...


А что из TIDа "Troubleshooting GroupWise abends" Вы УЖЕ делали для устранения абенда ?
Аватара пользователя
Андрей Троценко
 
Сообщения: 529
Зарегистрирован: 31 июл 2002, 13:54
Откуда: Киев, Украина


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 59

cron