Страница 1 из 1

Выручайте, люди !!! Что-то NDS-у плохо сталось ...

СообщениеДобавлено: 01 мар 2004, 14:54
Савельев Дмитрий
Есть сервер SER1 NW51, SP7e, NDS 8.85c с мастер-репликой на борту

В это же дерево устанавливается еще один сервер SER2, на который реплика не помещается, почему то ... Пробуем сделать DSREPAIR (ver. 10250.41) на сервере с мастер-репликой, получаем результат:

Repair process aborted

ошибка при первом запуске dsrepair -a:
ERROR: Operation or update failed with Error: -807

ошибка при повторном запуске dsrepair -a
ERROR: Unable to set: NDT, as the current dib set, error: -732

И еще, при попытке войти в SER1\SYS\PUBLIC\WIN32 ошибка:
There is not enough space on the disk, хотя на томе SYS свободно чуть больше 2 Gb. Кстати, в остальные директории пускает нормально ...
В мониторе параметры Total blocks = 65526 а Free blocks = 24130, что однозначно говорит, что место еще есть точно.

Вопрос, что делать-то? Как полечить?

Re: Выручайте, люди !!! Что-то NDS-у плохо сталось ...

СообщениеДобавлено: 01 мар 2004, 15:19
Андрей Тр. aka RH
Савельев Дмитрий писал(а):В это же дерево устанавливается еще один сервер SER2, на который реплика не помещается, почему то ...
Чуть поподробней можно - что значит "не помещается почему-то" ? В чем именно выражается ?

Для начала на SER1 запустите DSTRACE ( хотя бы на консоль, а не в файл ) и посмотрите ошибки. А то некоторые насоветуют людЯм сразу всяких -a, -xk2 - xk3 и т.п. .. по башке бы таким настучать, извиняюсь.

СообщениеДобавлено: 01 мар 2004, 15:41
Савельев Дмитрий
В логе dstrace присутствует масса ошибок с кодом:
-601
-603
-252

А кстати, что делать чтобы все таки запустился dsrepair на SER1? Он же работать не хочет ...

СообщениеДобавлено: 01 мар 2004, 16:09
Андрей Тр. aka RH
Надо бы выяснить сперва, что именно вызывает эти ошибки. Возможно, "застрял" какой-то объект в дереве - его измененное состояние постоянно сохраняется в базе. Надо бы выяснить, какой объект ( объекты ) порождает эту ситуацию .. дальше действовать по обстановке ( вручную, как правило ). В идеале хорошо бы посмотреть кусочек лога dstrace. А dsrepair вовсе не есть волшебная палочка, которая все сама исправляет - это всего лишь инструмент ( один из ) админа.

СообщениеДобавлено: 01 мар 2004, 18:32
Савельев Дмитрий
Кусочек лога с теми ошибками, кторые возникают ...

BEMU: [2004/03/01 17:15:04] Find Next Object, btmatch=632 (mask=-2147483648), lastobj== ffffffff ) for conn 87
BEMU: [2004/03/01 17:15:04] Done with Find Next Object, returning== 0, type=619) Error=failed, no such object (-252)
AREQ: [2004/03/01 17:15:04] Calling DSAResolveName conn:323 for client .SYT.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:04] DSAResolveName failed, no such entry (-601).
AREQ: [2004/03/01 17:15:04] Calling DSAResolveName conn:323 for client .SYT.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:04] DSAResolveName failed, no such entry (-601).
VCLN: [2004/03/01 17:15:06] DCCreateContext context 000000aa for ca5710a0, taskID d2ce3080, idHandle 00000000
AREQ: [2004/03/01 17:15:06] Calling DSARead conn:0 for client .NEON.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:06] DSARead failed, no such attribute (-603).
VCLN: [2004/03/01 17:15:06] request DSARead by context 170 failed, no such attribute (-603)
VCLN: [2004/03/01 17:15:06] DCFreeContext context 000000aa for ca5710a0, idHandle 00000000, connHandle ffffffff
VCLN: [2004/03/01 17:15:06] DCFreeContext context ffffffff for ca5710a0, idHandle ffffffff, connHandle ffffffff
VCLN: [2004/03/01 17:15:06] DCCreateContext context 000000aa for ca5710a0, taskID d2ce3380, idHandle 00000000
AREQ: [2004/03/01 17:15:06] Calling DSAReadEntryInfo conn:0 for client .NEON.Moscow.Mechel.MECHEL.
VCLN: [2004/03/01 17:15:06] request DSAReadEntryInfo by context 170 succeeded
VCLN: [2004/03/01 17:15:06] DCFreeContext context 000000aa for ca5710a0, idHandle 00000000, connHandle ffffffff
AREQ: [2004/03/01 17:15:06] 1 GlobalCheckManagement.

Вот такая вот петрушка ... Подскажите, кде копать, куда лезть?

СообщениеДобавлено: 01 мар 2004, 21:14
alexp_mac
Трудно сказать заочно, ну есть строчки где один сервер не может зарезолвить другой.
Вообще, сперва начните с того, что сервера друг друга видят, по IP скажем, т.к. если у Вас один сервер видит другой через ip, а этот другой видит третий через ipx, то синхронизация будет очень долгой и нудной. Поэтому сперва проверьте, что сервера друг-друга видят и время на ни х синхронизировано.
Выложите сюда кусок лога dsreapair time synchronization and server status information. Чтобы было ясно видно сосотояние каждго сервера. Лучше это сделать на мастере.

СообщениеДобавлено: 02 мар 2004, 07:52
Андрей Тр. aka RH
Лично я бы сосредоточился на -252 - выяснить, для какого именно object оно failed ( ИМХО это делается настройками dstrace, вкл. повышенной детализации сообщений - конкретные ключи надо смотреть в доке или хелпе по ней ). -601 и -603 могут изредка возникать при нормальной работе, а вот -252 по идее быть не должно. Посмотреть, что в тот момент ( выдачи этой ошибки ) висит на коннекшене 87 ( в строке непосредственно перед ошибкой ).

Алексей Подгорчук

Как я понял, до работы с двумя репликами там дело не доходит .. раз второй сервер не ставится в дерево. Вся ситуация пока что крутится вокруг мастера, из сказанного ИМХО у них просто проблемы в дереве и вторую реплику нормально не добавить в кольцо. По крайней мере мне так кажется .. на сей момент. Разумеется, могу быть неправ :?

СообщениеДобавлено: 02 мар 2004, 08:58
Струин Олег
Странная ошибка:
И еще, при попытке войти в SER1\SYS\PUBLIC\WIN32 ошибка:
There is not enough space on the disk, хотя на томе SYS свободно чуть больше 2 Gb. Кстати, в остальные директории пускает нормально ...

Может попробовать vrepair запустить

СообщениеДобавлено: 02 мар 2004, 10:17
Савельев Дмитрий
Шаманские танцы по приведению сервера и дерева в рабочее состояние закончились нашей полной победой.

Проблема заключалась в следующем:
после очередного запуска DSREPAIR он как обычно создал temp-овые файлы базы NDS NDT*.* а переименовать их обратно не смог, так как съехавшая крыша у FILESYS не видела свободного места на томе SYS.
Вылечилось следующим образом:
- была выгружена DS.NLM
- с помощью СС были переименованы файлы NDT*.* в NDS*.* в каталоге _NETWARE
- сервер был перезагружен и сделан VREPAIR на томе SYS
- после запуска DSREPAIR -a удалились неверные файлы *.NDT
и все заработало ...

Теперь бы еще с ошибками -601 и -603 разобраться ...

СообщениеДобавлено: 02 мар 2004, 10:24
Андрей Тр. aka RH
Поздравляю :) Еще можно было попробовать грузить server -ndb и дальше чинить том, но это детали. Насчет -601 -603 особо не бери в голову .. Понаблюдать за деревом в dstrace какое-то время не помешает, впрочем.

СообщениеДобавлено: 02 мар 2004, 10:34
alexp_mac
съехавшая крыша у FILESYS не видела свободного места на томе SYS.

А ставили сервер-то с какого дистрибутива? Без суппорт паков или с оверлея?

СообщениеДобавлено: 02 мар 2004, 10:55
Савельев Дмитрий
Да вся проблема-то в том, что эти сервера ствил не я. Я только в них разбираться начал (в смысле не первый раз увидел - а сменил место работы). Так что откуда они ставились, как они ставились я сказать ничего не могу ...

СообщениеДобавлено: 02 мар 2004, 12:05
alexp_mac
[quote="Савельев Дмитрий"]Да вся проблема-то в том, что эти сервера ствил не я. Я только в них разбираться начал (в смысле не первый раз увидел - а сменил место работы). Так что откуда они ставились, как они ставились я сказать ничего не могу ...[/quote]

Значит концов не найдешь. Заработало и хорошо.

dsaresolvername...

СообщениеДобавлено: 19 ноя 2004, 12:03
Lab
А кто может подсказать по сути 601 ошибки ?