Господа, помогите!!! Novell 3.12

Обсуждение технических вопросов по продуктам Novell

Сообщение Константин Ошмян » 16 мар 2004, 17:15

Collector писал(а):работает 1,5 часа и падает, причем кто залогинился, у того все папки серверные видны, видна сеть и тп, но если перезагрузиться, такое чувство, что сервак выключен.
Честно говоря, я так и не понял - что за проблема. Можно ещё разочек - что именно происходит? А то кто-то "падает", но "все папки серверные видны, видна сеть и тп" - в чём проблема-то? И побольше информации - хватает ли на сервере лицензий (можно посмотреть на сервере в главном окне MONITOR.NLM), всю ли память видит сервер (команда MEMORY с консоли сервера), какие используются рабочие станции (какие операционки и с какими версиями клиентов), что за SQL-сервер и что за софт на рабочих станциях, который к нему обращается?
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Сообщение Collector » 16 мар 2004, 18:27

Итак, сервер загружается, все работает замечательно, проходит ровно 1,5 часа, и опрубается связь с SQL сервером (сайбейз энивеа 7), на клиентских машинах выпадает сообщение - неверное имя сервера, и невозможно установить коннект через ODBC, хотя при этом сеть доступна, видно все компы в сети, и сетевые диски сервера (т.е. нормальная ситуация), но если перезагрузить клиентскую машину, то она загружается и как будто сервер новел не работает, т.е. залогиниться нельзя, причем остальные юзеры спокойненько сидят, и если и они перезагрузяться то тоже такая же картина...

На клиенских машинах Win98SE, к новелу подключаемся стандартным, поставляемым, клиентом от майкрософта (так всегда подключались) по протоколу IPX

Если перезагрузить сервак все становиться нормальным.
Если не грузить модуль SQl, то такая картина натупает нo часа через 4-5
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Collector » 16 мар 2004, 18:36

Кстати, перестал видеться HASP...
от установлен на другу прогу, которая не используется.
Возможно указываю неправильно параметра при загрузке haspserv.nlm, буду благодарен...

пробывал не грузить модуль haspserv.nlm, на вышеописанную проблему не влияет
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Константин Ошмян » 16 мар 2004, 20:33

Уже яснее. Как я понимаю, из протоколов используется только IPX. Поскольку "обычные" клиенты продолжают работать, но перестают подключаться новые, то похоже на проблемы либо с лицензиями (что MONITOR на сервере показывает - Maximum Connections и Current Connections?), либо с протоколами RIP/SAP (попробуйте в такой ситуации выдать на консоли сервера команду RESET ROUTER - вдруг поможет? На IPX, кстати, тоже патчи были для 3.12). Что ещё... Странно выглядит отваливание от SQL-сервера - возможно, с ним работа идёт по SPX и что-то в этом протоколе нарушается...

Ещё на нехорошие мысли наводит регулярность возникновения проблемы через некоторое время после перезагрузки сервера - видимо, что-то за это время таки происходит. Что с памятью? Команда MEMORY на консоли сервера всю память показывает? Количество кэш-буферов со временем сильно меняется (что показывает MONITOR на консоли сервера - Original Cache Buffers и Total Cache Buffers сразу после перезагрузки, через час и после возникновения проблемы?)?

Ещё мысль - нет ли в сети других серверов, тоже работающих по IPX, но с другим типом фрейма (Ethernet_802.2 - например, аппаратные принт-серверы либо Windows-машины с открытыми "шарами" (Shares))? Можно в порядке эксперимента попробовать на паре рабочих станций в свойствах протокола IPX задать тип фрейма явно - будет ли такая проблема продолжаться и с ними?
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Сообщение Collector » 17 мар 2004, 09:19

Константин Ошмян писал(а):Уже яснее. Как я понимаю, из протоколов используется только IPX. Поскольку "обычные" клиенты продолжают работать, но перестают подключаться новые, то похоже на проблемы либо с лицензиями (что MONITOR на сервере показывает - Maximum Connections и Current Connections?), либо с протоколами RIP/SAP (попробуйте в такой ситуации выдать на консоли сервера команду RESET ROUTER - вдруг поможет? На IPX, кстати, тоже патчи были для 3.12). Что ещё... Странно выглядит отваливание от SQL-сервера - возможно, с ним работа идёт по SPX и что-то в этом протоколе нарушается...

Да, из протоколов только ipx, monitor показывает 100 клиентов, хотя фактически 8,.
Константин Ошмян писал(а):Ещё на нехорошие мысли наводит регулярность возникновения проблемы через некоторое время после перезагрузки сервера - видимо, что-то за это время таки происходит. Что с памятью? Команда MEMORY на консоли сервера всю память показывает? Количество кэш-буферов со временем сильно меняется (что показывает MONITOR на консоли сервера - Original Cache Buffers и Total Cache Buffers сразу после перезагрузки, через час и после возникновения проблемы?)?

Мемори показывает столько сколько физически, тут вроде бы все ок, за буферами прослежу.
Константин Ошмян писал(а):Ещё мысль - нет ли в сети других серверов, тоже работающих по IPX, но с другим типом фрейма (Ethernet_802.2 - например, аппаратные принт-серверы либо Windows-машины с открытыми "шарами" (Shares))? Можно в порядке эксперимента попробовать на паре рабочих станций в свойствах протокола IPX задать тип фрейма явно - будет ли такая проблема продолжаться и с ними?

Кроме этого сервера ничего больше нет...
Благодарю за участие, надеюсь вместе мы его победим!!!
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Collector » 17 мар 2004, 09:25

Reset Router не помог :(
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Владимир Горяев » 17 мар 2004, 10:52

Все ж таки и где логи?
SYS:ETC\CONSOLE.LOG
Сейчас опять могу наврать (забывается уже кое-что), но длжен же быть и SYS:SYSTEM\ABEND.LOG

Итак, сервер загружается, все работает замечательно, проходит ровно 1,5 часа, и опрубается связь с SQL сервером
Он случаем не триальный?
Возможно указываю неправильно параметра при загрузке haspserv.nlm, буду благодарен...
В Поиск.

И CONFIG.NLM тоже вам поможет понять...
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

Сообщение Константин Ошмян » 17 мар 2004, 11:49

Владимир Горяев писал(а):Все ж таки и где логи?
SYS:ETC\CONSOLE.LOG
Сейчас опять могу наврать (забывается уже кое-что), но длжен же быть и SYS:SYSTEM\ABEND.LOG
Да, действительно, CONLOG - штука полезная, я его всегда гружу (в данном случае было бы хорошо его добавить в AUTOEXEC.NCF сразу после REGISTER MEMORY).

Про ABEND.LOG - таки наврал :wink: : во-первых, он появляется лишь после ABEND-ов (а их в данном случае не было), а во-вторых, "автоматом" создаётся лишь начиная с NetWare 4.11 (а тут - 3.12, оно при ABEND-е просто бы остановилось с дампом регистров на консоли сервера).
Collector писал(а):Да, из протоколов только ipx, monitor показывает 100 клиентов, хотя фактически 8.
Вот это уже интересно - такого быть не должно. И кто же эти клиенты?? (в том же MONITOR-е -> Connection Information)
Если там куча NOT-LOGGED-IN висит, то:
1) их можно спокойно поотрубать DELETE-ом (не помню, работает ли в 3.12 клавиша F6, чтобы скинуть их всех сразу) ;
2) была NLM-ка, которая за этим делом следила и чистила неиспользуемые соединения - к сожалению, не помню точно, как она называется (но при необходимости можно найти).

Удалось ли разобраться с патчами (команда PATCHES должна показывать кучу загруженных NLM-ок вида чегото-там-FIX.NLM) ?
Дало ли какие-то результаты явное прописывание типа фрейма на рабочих станциях?
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Сообщение Collector » 17 мар 2004, 12:08

по поводу 100 клиентов, это я имел ввиду на сколько лицензий новел нетваре, с юзерами порядок, с патчами разобрался...

Дело скорее всего в параметре Packet Recive Buffers (при просмотре в Monitor), раньше по умолчанию стояло в сетах 400, вот как доходило значение до этого параметра, так и происходил этот загадочный эффект (вышеописанный), теперь поставил 2000 (это максимум), пока работает, но как я догадываюсь - достигнет значения 2000 и также встанет, как вообще регулируется данная ситуация и что нужно сделать чтоб предотвратить???
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Сергей Дубров » 17 мар 2004, 12:23

Константин Ошмян писал(а):2) была NLM-ка, которая за этим делом следила и чистила неиспользуемые соединения - к сожалению, не помню точно, как она называется (но при необходимости можно найти).

ZZCLEAR.NLM. Начинает "отстрел" NOT-LOGGED-IN соединений, если свободных коннектов остаётся меньше трёх штук.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Сообщение Константин Ошмян » 17 мар 2004, 12:58

Сергей Дубров писал(а):ZZCLEAR.NLM. Начинает "отстрел" NOT-LOGGED-IN соединений, если свободных коннектов остаётся меньше трёх штук.
Нет, я имел в виду NLICLEAR.NLM, штатно входящую в 312PTd.EXE - она "отстреливает" тех NOT-LOGGED-IN, которые висят дольше заданного тайм-аута. Её только надо не забыть загрузить откуда-нибудь типа AUTOEXEC-а.
Collector писал(а):Дело скорее всего в параметре Packet Recive Buffers (при просмотре в Monitor)
Действительно, в 3.12 SET Minimum Packet Receive Buffers может присутствовать только в STARTUP-е, с SET Maximum Packet Receive Buffers полегче - он может присутствовать как в STARTUP-е, так и в AUTOEXEC-е, а может и вообще руками с консоли сервера выдаваться. Т.е. вполне может быть, что у Вас эти параметры находились в прежнем STARTUP.NCF, а после его пересоздания и начались проблемы. Кстати, на косоли сервера никаким подозрительных сообщений не появляется? Например, типа такого: LAN receive buffer limit reached. All buffers are in use. - тогда точно оно.
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Сообщение Collector » 17 мар 2004, 13:07

Константин Ошмян писал(а):
Сергей Дубров писал(а):ZZCLEAR.NLM. Начинает "отстрел" NOT-LOGGED-IN соединений, если свободных коннектов остаётся меньше трёх штук.
Нет, я имел в виду NLICLEAR.NLM, штатно входящую в 312PTd.EXE - она "отстреливает" тех NOT-LOGGED-IN, которые висят дольше заданного тайм-аута. Её только надо не забыть загрузить откуда-нибудь типа AUTOEXEC-а.
Collector писал(а):Дело скорее всего в параметре Packet Recive Buffers (при просмотре в Monitor)
Действительно, в 3.12 SET Minimum Packet Receive Buffers может присутствовать только в STARTUP-е, с SET Maximum Packet Receive Buffers полегче - он может присутствовать как в STARTUP-е, так и в AUTOEXEC-е, а может и вообще руками с консоли сервера выдаваться. Т.е. вполне может быть, что у Вас эти параметры находились в прежнем STARTUP.NCF, а после его пересоздания и начались проблемы. Кстати, на косоли сервера никаким подозрительных сообщений не появляется? Например, типа такого: LAN receive buffer limit reached. All buffers are in use. - тогда точно оно.


нет, сообщений никаких не выдается, но поменяв значение с 400 на 2000 уже работает 4 часа (по сравнению, раньше более 1,5 часа не работал), текущее значение 967, как достигнет 2000 видимо встанет..., можно ли как-то контролировать это число
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Сообщение Сергей Дубров » 17 мар 2004, 13:18

Константин Ошмян писал(а):
Сергей Дубров писал(а):ZZCLEAR.NLM. Начинает "отстрел" NOT-LOGGED-IN соединений, если свободных коннектов остаётся меньше трёх штук.
Нет, я имел в виду NLICLEAR.NLM, штатно входящую в 312PTd.EXE - она "отстреливает" тех NOT-LOGGED-IN, которые висят дольше заданного тайм-аута. Её только надо не забыть загрузить откуда-нибудь типа AUTOEXEC-а.

Не, NLICLEAR в жизни реально хуже, я специально про неё не стал упоминать. Она отстреливает NOT-LOGGED-IN безусловно, даже когда есть свободные коннекты, а это чаще всего не есть гуд - загрузил человек машину, не залогинился, отошёл-пришел - коннекта нет, нужно перегружать станцию.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Сообщение Константин Ошмян » 17 мар 2004, 13:28

Collector писал(а):текущее значение 967, как достигнет 2000 видимо встанет...
Ну зачем же так пессимистично - скорее всего, 2000 оно и не достигнет. Вот то, что текущие 967 больше имевшихся по умолчанию 400 (default для Maximum Packet Receive Buffers - именно 400), и как следствие, их нехватка могла приводить к проблемам - это точно.
Я бы добавил в STARUP.NCF следующие SET-ы для Packet Receive Buffers: минимум - штук 500-800 (по умолчанию - 100), максимум - чуть больше того, что реально используется (т.е. если у Вас в MONITOR-е значение "устаканится" в районе 1000 - то выставить максимум где-то 1100-1200).
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Сообщение Collector » 17 мар 2004, 16:36

Константин Ошмян писал(а):
Collector писал(а):текущее значение 967, как достигнет 2000 видимо встанет...
Ну зачем же так пессимистично - скорее всего, 2000 оно и не достигнет. Вот то, что текущие 967 больше имевшихся по умолчанию 400 (default для Maximum Packet Receive Buffers - именно 400), и как следствие, их нехватка могла приводить к проблемам - это точно.
Я бы добавил в STARUP.NCF следующие SET-ы для Packet Receive Buffers: минимум - штук 500-800 (по умолчанию - 100), максимум - чуть больше того, что реально используется (т.е. если у Вас в MONITOR-е значение "устаканится" в районе 1000 - то выставить максимум где-то 1100-1200).


Уже 1600 и растет постепенно, может оборудование какое глючит, я в выходные один сидел (сервер - свитч - клиент), сидел часов 6 и установки были 400, все работало, а вот 8 юзеров забивают буфер в 400 за 1,5 ровно!!!
Collector
 
Сообщения: 15
Зарегистрирован: 12 мар 2004, 11:22

Пред.

Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 56

cron