Страница 1 из 3

Очень срочных ХЭЛП !! Как определить кто грузит сервер ??

СообщениеДобавлено: 25 мар 2004, 10:45
Сергей ака godless
NW 6.0.3, утилизация 99-100 процентов, как посмотреть какой процесс висит то ??

Что снимать ?? Крутиться хасп, NDPS, групвайз ... Всё остальное, как антивирусник, вебсервисы заглушил уже ...

Что делать ?? Можно перегрузить, но это же не выход !! ;-(((

Re: Очень срочных ХЭЛП !! Как определить кто грузит сервер

СообщениеДобавлено: 25 мар 2004, 10:48
Аркадий Глазырин
Сергей ака godless писал(а):NW 6.0.3, утилизация 99-100 процентов, как посмотреть какой процесс висит то ??

Что снимать ?? Крутиться хасп, NDPS, групвайз ... Всё остальное, как антивирусник, вебсервисы заглушил уже ...

Что делать ?? Можно перегрузить, но это же не выход !! ;-(((


Такое бывает после Abend, когда вместо 28 000 кэш буферов остаётся 400.

Смотреть в мониторе.

ЗЫ А Abend бывает в том числе от использования памяти без ECC и просто "битой" памяти.

Re: Очень срочных ХЭЛП !! Как определить кто грузит сервер

СообщениеДобавлено: 25 мар 2004, 10:57
Сергей ака godless
Аркадий Глазырин писал(а):Такое бывает после Abend, когда вместо 28 000 кэш буферов остаётся 400.

Смотреть в мониторе.

ЗЫ А Abend бывает в том числе от использования памяти без ECC и просто "битой" памяти.


Абенда нет, не совсем же я идиот то, прости господи ... ;-(( Что и удивляет .. Оба камня на серваке загружены под завязку, но не видно чем ...

Хотя есть подозрение что Ентерпрайз дурит, потому как был неделю назад абенд по его поводу и счас его вручную заглушить не могу ....

А в мониторе то куда смотреть ?? "Ты не мудри, ты пальцем покажи ..." (ЦЫ) ... Нет там загрузки процов по задачам .... ;-(((

Re: Очень срочных ХЭЛП !! Как определить кто грузит сервер

СообщениеДобавлено: 25 мар 2004, 11:12
Аркадий Глазырин
Сергей ака godless писал(а):Абенда нет... неделю назад абенд по его поводу и счас его вручную заглушить не могу ....

А в мониторе то куда смотреть ?? "Ты не мудри, ты пальцем покажи ..." (ЦЫ) ... Нет там загрузки процов по задачам .... ;-(((


Значит Abend всё-таки есть.

В мониторе смотрятся кэш буфера. Где именно - подсказывать не буду. "не совсем же идиот то" © :lol:

Кроме этого там смотрится и загрузка сервера по классам.

MONITOR -> SERVER RESOURCES

Удачи!

СообщениеДобавлено: 25 мар 2004, 11:14
Константин Ошмян
А в мониторе то куда смотреть ?? "Ты не мудри, ты пальцем покажи ..." (ЦЫ) ... Нет там загрузки процов по задачам .... ;-(((
Из главного меню -> Kernel -> Busiest Threads -> подождать немного, пока что-нибудь отрисует

СообщениеДобавлено: 25 мар 2004, 11:34
Сергей ака godless
Константин Ошмян писал(а):
А в мониторе то куда смотреть ?? "Ты не мудри, ты пальцем покажи ..." (ЦЫ) ... Нет там загрузки процов по задачам .... ;-(((
Из главного меню -> Kernel -> Busiest Threads -> подождать немного, пока что-нибудь отрисует



Памятуя о советах ранее - смотрел и там. Крайне неинформативное содержимое ...

Две задачи Server00:20 и Server00:7, иногда появляется ещё Server21 ... К сожалению понять что это за задачи не смог ... Вылетел таки сервре по абенду, даже по двум, перегружать пришлось.

Абенды ругаются на GWPOA.NLM (gwenn3.nlm, XIS10.NLM, NSPSLP.NLM)
и второй ругается на NSHTTPD.NLM (NSAPI_RD.NLM, LOADER.EXE, NSHTTPD.NLM) ...

Так что как понимаю всё таки GroupWise и Апач дурака валяют ... Или всё таки java-движок, томкат так называемый .... Только вот не пойму с чего, GW с последним 4-м сервисом, правда ставился когда ещё только бетта его была, но работал без вопросов ...

На сам Апач и на Томкат нету заплат ... Или искать не умею ?? Подскажите чем залечить можно ... Где то недели две незад начались проблемы, после попытки создания виртуального серврера дополнительного и его удаления из Ентерпрайза ...
Это единственное делалось на сервере ... Хэлп, не понимаю чего он хочет .... :evil:

СообщениеДобавлено: 25 мар 2004, 11:47
Владимир Горяев
В подобных случаях обычно надо на support-е искать, SP и постиксы накатывать на NWи службы. В каком-то из последних TCP update for NetWare 6, подобный абенд фиксился.

СообщениеДобавлено: 25 мар 2004, 11:58
Сергей ака godless
Владимир Горяев писал(а):В подобных случаях обычно надо на support-е искать, SP и постиксы накатывать на NWи службы. В каком-то из последних TCP update for NetWare 6, подобный абенд фиксился.


Какой из них ??
Последний фикс по TCP/IP это на версию 6.07 (6.17) и там вроде нет такого ... Основной упор на прокси соединения ...

Не знаю, единственное что осталось - накатить 4-е сервисы на GW и на нетварь саму ... Может поможет ....

Блин, серврер непрерывно больше суток не работает ... ;-(((((

СообщениеДобавлено: 25 мар 2004, 12:17
Аркадий Глазырин
Сергей ака godless писал(а):Блин, серврер непрерывно больше суток не работает ... ;-(((((


Память точно нормальная? А то небось стоит какой-нибуть Hynday PC-2700 Unbuffering и в этом вся проблема.

СообщениеДобавлено: 25 мар 2004, 12:21
Андрей Тр. aka RH
Можно, конечно, и в MONITOR'e, а можно в NRM, по умолчанию это http://server_IP:8008, если не ошибаюсь - смотреть в Health monitor, а еще есть такой health.log ( имеет неприятную привычку расти до безобразия на томе SYS у NW6 SP1, 2 ). Я не понял ( или пропустил ? ), какой именно сервиспак стоит для Netware ?

Был еще в свое время известный глюк с NLSLSP ( как у 5.1, так и у 6 ), когда одним из симптомов была повышенная утилизация .. но не единственным. Не думаю, что это оно.

У меня тут на днях наконец-то упал 6.5, причем так качественно - Multiple abends occuring - system halted. Заметили лишь потому, что определенные сетевые диски не открывались. Но при этом никого из ИТ-народу на работе не оказалось, и человек нажал на Главную Кнопку - сервер благополучно перегрузился ( работает до сих пор ). Так даже в abend.log ничего нет на эту тему ( последнее - инфа 3-месячной давности, но там известна причина ). На сервере ничего особого не крутится, да и сам он работает пока больше для пробы.

СообщениеДобавлено: 25 мар 2004, 13:17
Сергей ака godless
Аркадий Глазырин писал(а):
Сергей ака godless писал(а):Блин, серврер непрерывно больше суток не работает ... ;-(((((


Память точно нормальная? А то небось стоит какой-нибуть Hynday PC-2700 Unbuffering и в этом вся проблема.


Обижаешь, гиг Кингстона с ЕСС, два модуля по 512 ... Причём до этого работал же, причём работает с осени .... Железно ничего не менялось, не считая добавления IDE-вого винта, но это было задолго до того как проблемы начались ..... Вобщем думу думаю ... ;-((

СообщениеДобавлено: 25 мар 2004, 13:21
Сергей ака godless
Андрей Тр. aka RH писал(а): ... Я не понял ( или пропустил ? ), какой именно сервиспак стоит для Netware ?


Видать пропустил, NW 6.0.3, 3-й сервис стоит ...

Сегодня видимо буду четвёртый накатывать, может разрулит проблему ... Но честно сказать - не вижу причины - и соответственно решения для проблемы ...
В абенд.лог есть сообщения об ошибках, а что толку то ? Ни заплат под это дело, ни чего то подобного ... Но самое гадкое - не понять почему ... ;-((((

СообщениеДобавлено: 25 мар 2004, 13:47
Андрей Тр. aka RH
Ага, я так еще подумал, что .3 это, возможно, об SP .. но ни разу не встречал подобного написания. Так есть, значит, абенд.лог ? Ну давай его что ли .. какая-никакая пища для размышлений ( хотя бы его начало ). И еще через веб-интерфейс стоит посмотреть - может, там чего попонятней будет расписано.

И еще я не понял - сервер и после перезагрузки себя точно так же ведет ? То есть утилизация постоянно под 100% и пользоваться сервером нельзя ?

СообщениеДобавлено: 25 мар 2004, 14:10
Сергей ака godless
Андрей Тр. aka RH писал(а): ... но ни разу не встречал подобного написания...

... Так есть, значит, абенд.лог ? Ну давай его что ли .. какая-никакая пища для размышлений ( хотя бы его начало ) ...

... сервер и после перезагрузки себя точно так же ведет ?


Вроде здесь я такое первый раз и увидел ... ;-) Не помню от кого правда ... ;-))

Вот кусочки от абендов, что он мне вывалил сегодня, до перезагрузки:
1.
Server F01 halted Thursday, March 25, 2004 10:06:09.820 am
Abend 1 on P00: Server-5.60.03: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0008 DS = 0010 ES = 0010 FS = 0010 GS = 0010 SS = 0010
EAX = 00000000 EBX = C465D580 ECX = C465D2F8 EDX = 00000297
ESI = B8C89D00 EDI = 00000000 EBP = C465D478 ESP = C465D398
EIP = BB9DF56E FLAGS = 00010246
Address (0xBB9DF56E) exceeds valid memory limit
EIP in UNKNOWN memory area
Access Location: 0xBB9DF56E

The violation occurred while processing the following instruction:



Running process: GWPOA-Worker 4 Process
Thread Owned by NLM: GWPOA.NLM
Stack pointer: C465C3B0
OS Stack limit: C46522A0
Scheduling priority: 67371008
Wait state: 3030070 Yielded CPU
Stack: --B8C89D00 ?
--00000100 ?
--00000001 ?
--00000000 ?
--B8CAF040 ?
--00000001 ?
--00006142 ?
--C7623D00 ?
--C465D580 ?
--BBA07588 ?
--00000000 ?
--C46B1580 ?
--00000000 ?
--BBA03F0C ?
--00000000 ?
--00000000 ?
--00000000 ?
--BBA03F0C ?
--00000000 ?
--00000000 ?
--00000000 ?
-C5C5E163 (XIS10.NLM|??_7XisObject%%6B%+8)
--00000000 ?
--C46B1580 ?
--C465D41C ?
-C5C5E163 (XIS10.NLM|??_7XisObject%%6B%+8)
C6BA631C (GWENN3.NLM|GW3_WpfAddCompleteField+6C)
--00000000 ?
--00000000 ?
-C5C5E163 (XIS10.NLM|??_7XisObject%%6B%+8)
--00000001 ?
--00000000 ?
--C465D4C8 ?
--00000001 ?
--C465D476 ?
--C465D4C8 ?
--C465D45C ?
C6B2A451 (GWENN3.NLM|GW3_WpeGetPackedField+A91)
--C465D444 ?
--B822A100 ?
--C465D476 ?
--00000001 ?
--00000000 ?
--00000000 ?
--00008E07 ?
--C60A0000 ?
--00000000 ?
--00000000 ?
--B8C89D00 ?
C737EB30 ?
--C465D480 ?
C6B297DF (GWENN3.NLM|GW3_WpeCallback+5F)
--C335FEA0 ?
--00000000 ?
--B8C89D00 ?
--C465D580 ?
--C465D4A8 ?
C6B2DFC8 (GWENN3.NLM|GW3_WpeExecuteRulesWCallback+1048)
--B8C89D00 ?
--00006142 ?
--C7623D00 ?
--B8CAF040 ?
--C465D580 ?
--C465D4C8 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--C465D4E0 ?
C6B2DF44 (GWENN3.NLM|GW3_WpeExecuteRulesWCallback+FC4)
--B8C89D00 ?
--00006142 ?
--C7623D00 ?
--B8CAF040 ?
--C465D580 ?
--0000001A ?
--B8CAF040 ?
--C46B1F40 ?
--B8CAF040 ?
--B8792200 ?
--B8792200 ?
--B8C89D00 ?
--C465D598 ?
C6B2D37D (GWENN3.NLM|GW3_WpeExecuteRulesWCallback+3FD)
--B8C89D00 ?
--C7623D00 ?
--00006142 ?
--C78BE7E0 ?
--C465D580 ?
--CA1A9980 (NSPSLP.NLM|gLanguageCode+5E54)
--00000000 ?
--00000005 ?
--00000001 ?
--00000000 ?
--00000001 ?
--00000000 ?
--00000000 ?
--C78BE7E0 ?
--CA1A9F80 (NSPSLP.NLM|gLanguageCode+6454)
--B8792200 ?

Additional Information:
The CPU encountered a problem executing code in SERVER.NLM. The problem may be in that module or in data passed to that module by a process owned by GWPOA.NLM.

2.
Server F01 halted Thursday, March 25, 2004 10:08:22.359 am
Abend 2 on P00: Server-5.60.03: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0008 DS = 0010 ES = 0010 FS = 0010 GS = 0010 SS = 0010
EAX = 00000000 EBX = C4D43B80 ECX = C4C598E0 EDX = B98055C0
ESI = B81E0728 EDI = C5CFDD00 EBP = C606F978 ESP = C606F960
EIP = C512EC6E FLAGS = 00010286
C512EC6E 8B9220200000 MOV EDX,[EDX+00002020]=?
EIP in NSAPI_RD.NLM at code start +00006C6Eh
Access Location: 0xB98075E0

The violation occurred while processing the following instruction:
C512EC6E 8B9220200000 MOV EDX,[EDX+00002020]
C512EC74 8B4508 MOV EAX,[EBP+08]
C512EC77 899020200000 MOV [EAX+00002020],EDX
C512EC7D 8B45EC MOV EAX,[EBP-14]
C512EC80 8B5828 MOV EBX,[EAX+28]
C512EC83 8B45F4 MOV EAX,[EBP-0C]
C512EC86 001483 MOV EDX,[EBX+EAX*4]
C512EC89 C78220200000FF MOV [EDX+00002020],FFFFFFFF
FFFFFF
C512EC93 FF750C PUSH dword ptr [EBP+0C]
C512EC96 8B45EC MOV EAX,[EBP-14]



Running process: NS Web Thread 9 Process
Thread Owned by NLM: NSHTTPD.NLM
Stack pointer: C606F7F4
OS Stack limit: C6060E80
Scheduling priority: 67371008
Wait state: 5050190 Blocked on a kernel CV
Stack: --CCCCCCCC ?
--C4C598E0 ?
--00000001 ?
--00000000 ?
--B81E0728 ?
--C4C59918 ?
--C606F9A8 ?
C512FB64 (NSAPI_RD.NLM|(Code Start)+7B64)
--B81DE700 ?
--C4D43B20 ?
--00000000 ?
--C606F994 ?
--B81DE700 ?
--B81DE71C ?
--B81DE734 ?
--B81DE74C ?
--FFFFFFFF (LOADER.EXE|KernelTempAliasesEnd+FFF)
--00000001 ?
--C6070A98 ?
C51333D8 (NSAPI_RD.NLM|jk_service+1B1)
--B81E0728 ?
--C606FA00 ?
--C4D43B20 ?
--C6070A8C ?
--CCCCCCCC ?
--C4CA1240 ?
--00000000 ?
--C4C59918 ?
--FFFFFFFF (LOADER.EXE|KernelTempAliasesEnd+FFF)
--CCCCCCCC ?
--00001000 ?
--00000030 ?
--C606FA88 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000001 ?
--C4C9F8C0 ?
--B924DF40 ?
--C5A4EA08 ?
--C606F9D8 ?
--C606F9D8 ?
--C5A4EC98 ?
--C5A4ECC8 ?
--C5A4EDB0 ?
--C5A4C958 ?
--00000000 ?
--00000000 ?
--00000000 ?
--C5A4ED08 ?
--C4C8D1C0 ?
--00000050 ?
-C4A69304 (NSHTTPD.NLM|RealmValue+F90)
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--FFFFFFFF (LOADER.EXE|KernelTempAliasesEnd+FFF)
--C606FA88 ?
--C606FAA0 ?
--00000006 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
--00000000 ?
C5132D65 (NSAPI_RD.NLM|(Code Start)+AD65)
C5132E94 (NSAPI_RD.NLM|(Code Start)+AE94)
C5132F91 (NSAPI_RD.NLM|(Code Start)+AF91)
--C5A4FE08 ?
--C5A4FEF0 ?
--C5A4FF20 ?
--C5A4FF88 ?
--C5A4FFC8 ?
-C513A9A4 (NSAPI_RD.NLM|(Data Start)+59A4)
--C5A4EDE8 ?
--C5A4FE38 ?
--C5A4FEF8 ?
--C5A4FF30 ?
--C5A4FF98 ?
-C513A9FC (NSAPI_RD.NLM|(Data Start)+59FC)
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?
--CCCCCCCC ?

Additional Information:
The CPU encountered a problem executing code in NSAPI_RD.NLM. The problem may be in that module or in data passed to that module by a process owned by NSHTTPD.NLM.

Ошибки в хронологическом порядке, сначала одна выскочила, потом вторая ....

После перезагрузки сервер как обычно заработал (3*тьфу) и в течении как минимум суток будет работать, проверено ... Но может допустим завтра вывалиться с теми же симптомами по непонятной мне пока причине .... ;-( Вот так то ...

СообщениеДобавлено: 25 мар 2004, 14:32
Андрей Тр. aka RH
Читал уже ? Если нет - почитай на сон грядущий

How To Troubleshoot GroupWise Abends - Part I - TID10021981
http://support.novell.com/cgi-bin/searc ... 021981.htm

How To Troubleshoot GroupWise Abends - Part II - TID10021982
http://support.novell.com/cgi-bin/searc ... 021982.htm