Страница 1 из 1

Падает сервер.

СообщениеДобавлено: 08 июн 2004, 09:59
Ekrysanov
Установлен nw6+sp4. Серевер нормально работает недели две и падает. Сегодня опять выпал и загрузил debugger.
Debug выдал кучу всяких параметров
Например: eax=000004c flags=0000002
В конце была строчка:
86719797 56 push esi.
Кто нибудь подскажите в чем дело.

Re: Падает сервер.

СообщениеДобавлено: 08 июн 2004, 10:09
Аркадий Глазырин
Ekrysanov писал(а):Установлен nw6+sp4. Серевер нормально работает недели две и падает.
Кто нибудь подскажите в чем дело.


NW 6 требует достаточно мощного "железа". А что у Вас?
Celeron-733MHz с обычной нетестированной памятью без ECC.
Вы бы ещё на AMD 5x86-P133 с SIMM-ами поставили. :lol:

СообщениеДобавлено: 08 июн 2004, 10:16
Ekrysanov
У нас IBM eServer x225
Intel Xeon 2,66GHz with Cashe size 512 Kb and Installed Memory 512 Mb.

СообщениеДобавлено: 08 июн 2004, 10:52
Аркадий Глазырин
Ekrysanov писал(а):У нас IBM eServer x225
Intel Xeon 2,66GHz with Cashe size 512 Kb and Installed Memory 512 Mb.


(Вижу намёк понят. :D )

Какие паки стоят? Включен ли HT.
Как именно "падает"?

СообщениеДобавлено: 08 июн 2004, 11:53
Ekrysanov
Сервер примерно раз в две недели отключается от сети. Сама ОС работает, а сети нет. Приходится перезагружать сервер.
Сегодня остановился и вызвал debug.
SP 4. Насчет HT не знаю.

СообщениеДобавлено: 08 июн 2004, 12:18
Аркадий Глазырин
Ekrysanov писал(а):Сервер примерно раз в две недели отключается от сети. Сама ОС работает, а сети нет. Приходится перезагружать сервер.
Сегодня остановился и вызвал debug.
SP 4. Насчет HT не знаю.


Так он весь "валится" или только сетевой интерфейс отключается?

Включение/отключение HT смотрится в BIOS в разделе свойств процессора.
Лучше его выключать.

СообщениеДобавлено: 08 июн 2004, 12:28
Музалёв Николай
Дык
...и падает

или просто
...сети нет..

??

Если последнее, то есть ИМНО, что это проделки сетевой карты.
В следующий раз попробуйте уточнить, что значит нет сети:
- проверьте текущее состояние сетевой подсистемы командой CONFIG с консоли - там что видно?;
- попробуйте "попинговать" сетевой интерфейс серверными утилитами PING или IPXPING - хоть кто видит карту?;
- посмотрите в MONITORe статистику и состояние сетевой подсистемы - нет ли там много ошибок или другого криминала?;
- можно ли восстановиться по команде REINITIALIZE SUSTEM из модуля INETCFG или только перезагрузкой?
В общем - полнее и точнее, пожалуйста...

А пока как первое лекарство - попробуйте заменить сетевой драйвер на новое/старое, и то же и относительно сопутствующих модулей - MSM и т.д.... вплоть до стека протоколов (IP).

СообщениеДобавлено: 08 июн 2004, 12:44
Ekrysanov
Сегодня, пробовал пинговать сервер не отвечал. Также пробовал пинговать второй сервер (WinNT) он тоже не отвечал.

СообщениеДобавлено: 08 июн 2004, 18:18
Влад А.Сокол aka Akina
А сам себя сервер с консоли пингует по адресу сетевого интерфейса? а локалхост? т.е. что отвалилось - карта от стека или стек от ядра... а в логе консоли ничего нет насчет деактивации карты или отвязки протокола?

А посмотрите в Monitor в этот момент в разделе

СообщениеДобавлено: 08 июн 2004, 19:17
Boris Morozov
System Resources -> Lsl Packet Receive Buffers.
Не близко его значение к 10000?
И не стоит ли у вас Netmail случаем на сервере.

Re: А посмотрите в Monitor в этот момент в разделе

СообщениеДобавлено: 09 июн 2004, 06:33
Ekrysanov
Boris Morozov писал(а):System Resources -> Lsl Packet Receive Buffers.
Не близко его значение к 10000?

Какое именно значение? Там 6 параметров и все намного больше 10000. Только cashe movable memory=0
NetMail не установлен.

А надо найти LSL Packet Receive buffers

СообщениеДобавлено: 09 июн 2004, 19:30
Boris Morozov
и Enter надавить. Откроется список модулей, сверху будет тот, кто больше всех отожрал. Обычно это TCPIP. Стать на него и посмотреть Number in Use.

Re: А посмотрите в Monitor в этот момент в разделе

СообщениеДобавлено: 09 июн 2004, 23:06
Сергей aka m0p3e
Boris Morozov писал(а):И не стоит ли у вас Netmail случаем на сервере.


Опс. А что может быть с NetMail-ом? Просто была как раз такая проблема на серве с ним. В чем дело выяснить не удалось. NetMail перенес на другой серв.

Я в принципе разобрался в ситуации и знаю методы борьбы

СообщениеДобавлено: 09 июн 2004, 23:51
Boris Morozov
Ситуация в Новелле известная, о чем можно судить даже по комментарию к патчу на TCPIP, который сегодня положили.
Суть в том, что в некоторых случаях стек TCPIP не может завершить соединение и оно остается в состоянии Finwait2. Соответственно не освобождаются какие-то блоки и растет число этих самых LSL packet receive buffers. Когда оно достигает максимальной границы, сервер перестает отвечать на сетевые запросы.
Я наблюдал такие вещи при работе PROXY агента нетмайла при съеме почты с mail.ru - почему-то только оттуда, с остальными почтовиками все нормально. Причем я смотрел трассу пакетов, по ним видно что бедный сервак отчаянно пытался разорвать соединение, слал всякие страшные команды, но никак. Эти соединения хорошо видны в TCPCON - соответственно я и лечил ситуацию с помощью кнопки Del. Буфера кушаются достаточно медленно, поэтому раз в пару дней, заглянув туда, можно это дело отследить, не доводя до зависона и перезагрузок.
Сейчас на 6.5 + Netmail 3.52 это как-то рассасывается само, хотя буферов все равно около 100~200 все равно висит, что не есть нормально. Оно в принципе более-менее стало работоспособно, начиная с какого-патча и на 6. А тогда я просто фильтром запретил серверу снимать почту с mail.ru.