NW5.1SP5 и ip, помогите уходит в Abend...

Обсуждение технических вопросов по продуктам Novell

NW5.1SP5 и ip, помогите уходит в Abend...

Сообщение RuStn » 07 сен 2003, 13:33

Заметил проблему, сервак HP3000r, RAID5, сеть на своей и 3Com980 (всего 2 карты), поднят DNSDHCP, подсеть 192,168,3,х маска 255,255,255,0 -- с завидной периодичностью валиться. Точнее выдает сообщение о критической ошибке и все, после не работает раздача адресов, после небольшой задержки даже не пингуеться, а точнее второй сервак не может с них синхронизировать время.
Теперь вопрос--какие нужно обновления для нормальной работы этой связки, точнее dhcpsrv, named, tcp/ip и еще что либо. Надоело сильно, лечиться только перегрузкой... :cry:
RuStn
 

Сообщение Савельев Сергей » 08 сен 2003, 10:15

Добрый день!!!
Какой SP стоит???
если нет, то ставь SP 6
Лучше ужасный конец, чем ужас без конца

Главное чтобы свет в конце тоннеля не оказался поездом идущем на встречу.

Изображение
______________________________________
Аватара пользователя
Савельев Сергей
 
Сообщения: 524
Зарегистрирован: 15 ноя 2002, 11:24
Откуда: Моск. обл. г. Железнодорожный

Сообщение Андрей Троценко » 08 сен 2003, 12:22

"...сообщение о критической ошибке..." - кто вызывает ошибку (файл sys:/system/abend.log - приведите строчки относящиеся к аварии) ?
Аватара пользователя
Андрей Троценко
 
Сообщения: 529
Зарегистрирован: 31 июл 2002, 13:54
Откуда: Киев, Украина

Сообщение RuStn » 08 сен 2003, 14:29

Вот вам Абенд:
Server ASU_1 halted Monday, September 8, 2003 8:33:36.767 am
Abend 1 on P00: Server-5.00k: Page Fault Processor Exception (Error code 00000000)

Registers:
CS = 0008 DS = 0010 ES = 0010 FS = 0010 GS = 0010 SS = 0010
EAX = 00001080 EBX = 00000F78 ECX = 00000000 EDX = 00000000
ESI = 00000000 EDI = D0AA88DC EBP = 00000000 ESP = D2CC0468
EIP = D3EE5E3C FLAGS = 00010246
D3EE5E3C 8B4500 MOV EAX,[EBP+00]=?
EIP in DHCPSRVR.NLM at code start +00020E3Ch
Access Location: 0x00000000

The violation occurred while processing the following instruction:
D3EE5E3C 8B4500 MOV EAX,[EBP+00]
D3EE5E3F 89842410080000 MOV [ESP+00000810],EAX
D3EE5E46 89C5 MOV EBP,EAX
D3EE5E48 E90DF6FFFF JMP D3EE545A
D3EE5E4D 31DB XOR EBX,EBX
D3EE5E4F E92AF6FFFF JMP D3EE547E
D3EE5E54 83FB40 CMP EBX,00000040
D3EE5E57 0F8D34F6FFFF JNL D3EE5491
D3EE5E5D E92AF6FFFF JMP D3EE548C
D3EE5E62 7710 JA D3EE5E74



Running process: DHCP Server 2 Process
Created by: NetWare Application
Thread Owned by NLM: DHCPSRVR.NLM
Stack pointer: D2CC0FC8
OS Stack limit: D2CBD060
Scheduling priority: 67371008
Wait state: 5050090 (Wait for interrupt)
Stack: --C0A803A3 ?
--00000000 ?
--00000000 ?
и т.д. --00000000 ?
:cry: :cry:
RuStn
 

Сообщение Андрей Тр. aka RH » 08 сен 2003, 16:50

Глянь на http://support.novell.com/search/kb_index.jsp по abend и dhcpsrvr - кое-что есть почитать.
Даешь отдельный раздел по ZENworks ... :bad-words: .. и печати !
Аватара пользователя
Андрей Тр. aka RH
 
Сообщения: 3937
Зарегистрирован: 18 июн 2002, 11:27

Сообщение RuStn » 09 сен 2003, 17:18

Не помогло замена на версию 3.12С...
Пересоздал зону, точнее все убил, создал все заново, DHCP DNS. DHCPSRVR v3.12с, работало около 6 часов, и сново абенд, помогите, что же еще ему надо? :cry: :cry: :cry:
RuStn
 

Сообщение Андрей Тр. aka RH » 09 сен 2003, 18:56

Грузи DHCP с отладочным ключом, выводом в лог-файл и потом сравнивай их после абендов .. если повезет, и последние события ( если они туда успеют попасть ) будут одинаковыми, будет пища для размышлений.
Даешь отдельный раздел по ZENworks ... :bad-words: .. и печати !
Аватара пользователя
Андрей Тр. aka RH
 
Сообщения: 3937
Зарегистрирован: 18 июн 2002, 11:27

Сообщение RuStn » 10 сен 2003, 09:02

Есть только одна определенность, какой то комп убивает.
Замеченно: 9.09.2003 какой то комп врубился в 7:55 и вышиб dhcpsrvr, выключился в 16:55, что так же и вышибло эту службу. Сегодня т.е. 10.09.2003 комп врубился в 8:04 после чего и последовал абенд. Как его найти? В сети более 250 компов, и разбросанны на давольно таки большой территории. Попробовал на этот период смотниторить Sniffer'ом pro v 4.70.530, но по какому ключю искать его даже не знаю, фильтровал протокол IP, правда надежд нет, т.к. вся сеть на Cajun'ах (маршрутизаторы и коммутаторы), искать по порту 53 (не коммутаторов безусловно) -- (запросы DHCP)??? :cry: :cry: :cry: :cry:
P.S. Такое положение дел мне уж точно не нравиться, убить такую соб...ку надо, чтоб не лаяла...
RuStn
 

Сообщение Андрей Троценко » 10 сен 2003, 11:51

Можно так попробовать: прямо перед абендом, DHCP-сервер успеет (наверное) запротоколировать запрос клиента:
<DHCPREQUEST> packet received from client <0:2:44:31:84:C4>, client requested IP address = <192.168.0.15>.
Если не успеет - дело хуже. Тогда можно включить диагностику TCP/IP:
SET TCP IP DEBUG = 1
и ждать (абенда :( )...
Аватара пользователя
Андрей Троценко
 
Сообщения: 529
Зарегистрирован: 31 июл 2002, 13:54
Откуда: Киев, Украина

Сообщение Андрей Тр. aka RH » 10 сен 2003, 12:18

Если есть такая определенность, что дело в каком-то компе, а в логах оно не обнаруживается, то стоит порыться в dhcp-шной базе. Я не помню, есть там какой-либо поиск или нет, но, наверное, каким-то образом можно отыскать МАС с новейшим выданным / подтвержденным IP .. или искать какое-то несоответствие, если тот IP вообще не получает. Хотя это как иголку в стоге сена.

Или на выходных включать всех по очереди и смотреть, когда рванет. ИМХО проще всего ( ну, из вариантов "по-тупому" ).
Даешь отдельный раздел по ZENworks ... :bad-words: .. и печати !
Аватара пользователя
Андрей Тр. aka RH
 
Сообщения: 3937
Зарегистрирован: 18 июн 2002, 11:27

Сообщение RuStn » 10 сен 2003, 14:04

Все бы ничего, выставил Debug в DHCPSRVR (-d3), буду ждать, но не факт что заметит его, он "не хороший" лог перетирает, его бы вести и вести (до разумных пределов). Ну а параметр set tcp ip debug =1, это сильно. Если его запустить, то добраться до командной строки почти не возможно, сильно загружает сервак, долго соображать начинает.
Буду ловить в DHCPSRVR логе...
RuStn
 

Сообщение RuStn » 10 сен 2003, 15:01

А может кто скинет сюда named, dhcpsrvr и tcp/ip от SP6, rustn@pochtamt.ru
RuStn
 

Сообщение RuStn » 10 сен 2003, 15:23

Так, есть лог, кто поможет разобраться? вылетел в 15:16:45, лог только до 15:16:43, может поможет, часть его приведу:
2003/09/10 15:16:42 <DHCPREQUEST> packet received from client <0:50:22:8D:EF:5>, client requested IP address = <192.168.2.48>.
2003/09/10 15:16:42 DHCP Warning: There is no matching entry configured for client <0:50:22:8D:EF:5>.
Sending reply as a subnet broadcast.
2003/09/10 15:16:42 Sending BOOTP/DHCP reply <DHCPNAK> to <0:50:22:8D:EF:5> as <255.255.255.255>.
2003/09/10 15:16:42 DHCP client <0:50:22:8D:EF:5> did not select this server.
ProcessJob pass IP DN: 192_168_2_48.nksh2.NKSH, no hostname, operation 2
NWDSRemoveObject failed: err = NO_SUCH_ENTRY, objectName used:192_168_2_48.nksh2.NKSH
Get type:4, IPAddr: 0.0.0.0, LeaseTime:0,MacIndx:278,pIP=C0A80378
SubmitJob called with addr=192.168.3.120, leaseExpiration=0, lease=0, operation=2
DetermineLeaseTime: proposed=0, return=259200, pSubnet->leaseTime=259200
AMAGet() exit type=4, err=0, addr=192.168.2.53
2003/09/10 15:16:43 <DHCPDISCOVER> packet received from client <0:80:48:16:30:E0>.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPOFFER> to <0:80:48:16:30:E0> as <192.168.2.53>.
Get type:4, IPAddr: 0.0.0.0, LeaseTime:0,MacIndx:278,pIP=C0A80235
SubmitJob called with addr=192.168.2.53, leaseExpiration=0, lease=0, operation=2
DetermineLeaseTime: proposed=0, return=259200, pSubnet->leaseTime=259200
AMAGet() exit type=4, err=0, addr=192.168.3.127
2003/09/10 15:16:43 <DHCPDISCOVER> packet received from client <0:80:48:16:30:E0>.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPOFFER> to <0:80:48:16:30:E0> as <192.168.3.127>.
ProcessJob pass IP DN: 192_168_3_120.nksh.NKSH, no hostname, operation 2
Get type:3, IPAddr: 192.168.2.53, LeaseTime:0,MacIndx:278,pIP=C0A8037F
AMAGet(): requested IP addr not found. IPAddr found= 192.168.3.127, IPAddr req = 192.168.2.53, type= 3
AMAGet() exit type=3, err=8, addr=192.168.2.53
2003/09/10 15:16:43 <DHCPREQUEST> packet received from client <0:80:48:16:30:E0>, client requested IP address = <192.168.2.53>.
2003/09/10 15:16:43 DHCP Warning: There is no matching entry configured for client <0:80:48:16:30:E0>.
Sending reply as a subnet broadcast.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPNAK> to <0:80:48:16:30:E0> as <255.255.255.255>.
2003/09/10 15:16:43 DHCP client <0:80:48:16:30:E0> did not select this server.
ProcessJob pass IP DN: 192_168_2_53.nksh2.NKSH, no hostname, operation 2
NWDSRemoveObject failed: err = NO_SUCH_ENTRY, objectName used:192_168_2_53.nksh2.NKSH
Get type:4, IPAddr: 0.0.0.0, LeaseTime:0,MacIndx:307,pIP=C0A80377
SubmitJob called with addr=192.168.3.119, leaseExpiration=0, lease=0, operation=2
DetermineLeaseTime: proposed=0, return=259200, pSubnet->leaseTime=259200
AMAGet() exit type=4, err=0, addr=192.168.2.56
2003/09/10 15:16:43 <DHCPDISCOVER> packet received from client <0:50:22:8D:EF:5>.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPOFFER> to <0:50:22:8D:EF:5> as <192.168.2.56>.
Get type:4, IPAddr: 0.0.0.0, LeaseTime:0,MacIndx:307,pIP=C0A80238
SubmitJob called with addr=192.168.2.56, leaseExpiration=0, lease=0, operation=2
DetermineLeaseTime: proposed=0, return=259200, pSubnet->leaseTime=259200
AMAGet() exit type=4, err=0, addr=192.168.3.134
2003/09/10 15:16:43 <DHCPDISCOVER> packet received from client <0:50:22:8D:EF:5>.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPOFFER> to <0:50:22:8D:EF:5> as <192.168.3.134>.
ProcessJob pass IP DN: 192_168_3_119.nksh.NKSH, no hostname, operation 2
2003/09/10 15:16:43 DHCP client <0:50:22:8D:EF:5> did not select this server.
Get type:3, IPAddr: 192.168.3.134, LeaseTime:0,MacIndx:307,pIP=C0A80386
DetermineLeaseTime: proposed=0, return=259200, pSubnet->leaseTime=259200
SubmitJob called with addr=192.168.3.134, leaseExpiration=1063451863, lease=259200, operation=1D
AMAGet() exit type=3, err=0, addr=192.168.3.134
2003/09/10 15:16:43 <DHCPREQUEST> packet received from client <0:50:22:8D:EF:5>, client requested IP address = <192.168.3.134>.
2003/09/10 15:16:43 Sending BOOTP/DHCP reply <DHCPACK> to <0:50:22:8D:EF:5> as <192.168.3.134>.
ProcessJob pass IP DN: 192_168_2_56.nksh2.NKSH, no hostname, operation 2
NWDSRemoveObject failed: err = NO_SUCH_ENTRY, objectName used:192_168_2_56.nksh2.NKSH
ProcessJob pass IP DN: 192_168_3_134.nksh.NKSH, hostname HKKJH, operation 1D
Get type:2, IPAddr: 192.168.3.134, LeaseTime:0,MacIndx:307,pIP=C0A80386
AMAGet() exit type=2, err=0, addr=192.168.3.134
2003/09/10 15:16:43 <DHCPINFORM> packet received from client <0:50:22:8D:EF:5>, IP Address <192.168.3.134>.

P.S. Простите за большое количество сообщений, но проблема требует решения, ip работает, но не раздает, повис на dhcpsrvr (в абенте как обычно dhcpsrvr)...
RuStn
 

Сообщение Андрей Троценко » 10 сен 2003, 15:39

Попробуйте заподозрить последнего - 192.168.3.134... Но это не факт.

Если воспроизведете аварию с ним, то можно продолжить...
Аватара пользователя
Андрей Троценко
 
Сообщения: 529
Зарегистрирован: 31 июл 2002, 13:54
Откуда: Киев, Украина

А другого DHCP-сервера в той же сети нет?

Сообщение Константин Ошмян » 10 сен 2003, 16:19

...а то больно подозрительно, что клиенты постоянно "did not select this server".
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

След.

Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 57

cron