Страница 1 из 1
Выручайте, люди !!! Что-то NDS-у плохо сталось ...
Добавлено:
01 мар 2004, 14:54
Савельев Дмитрий
Есть сервер SER1 NW51, SP7e, NDS 8.85c с мастер-репликой на борту
В это же дерево устанавливается еще один сервер SER2, на который реплика не помещается, почему то ... Пробуем сделать DSREPAIR (ver. 10250.41) на сервере с мастер-репликой, получаем результат:
Repair process aborted
ошибка при первом запуске dsrepair -a:
ERROR: Operation or update failed with Error: -807
ошибка при повторном запуске dsrepair -a
ERROR: Unable to set: NDT, as the current dib set, error: -732
И еще, при попытке войти в SER1\SYS\PUBLIC\WIN32 ошибка:
There is not enough space on the disk, хотя на томе SYS свободно чуть больше 2 Gb. Кстати, в остальные директории пускает нормально ...
В мониторе параметры Total blocks = 65526 а Free blocks = 24130, что однозначно говорит, что место еще есть точно.
Вопрос, что делать-то? Как полечить?
Re: Выручайте, люди !!! Что-то NDS-у плохо сталось ...
Добавлено:
01 мар 2004, 15:19
Андрей Тр. aka RH
Савельев Дмитрий писал(а):В это же дерево устанавливается еще один сервер SER2, на который реплика не помещается, почему то ...
Чуть поподробней можно - что значит "не помещается почему-то" ? В чем именно выражается ?
Для начала на SER1 запустите DSTRACE ( хотя бы на консоль, а не в файл ) и посмотрите ошибки. А то некоторые насоветуют людЯм сразу всяких -a, -xk2 - xk3 и т.п. .. по башке бы таким настучать, извиняюсь.
Добавлено:
01 мар 2004, 15:41
Савельев Дмитрий
В логе dstrace присутствует масса ошибок с кодом:
-601
-603
-252
А кстати, что делать чтобы все таки запустился dsrepair на SER1? Он же работать не хочет ...
Добавлено:
01 мар 2004, 16:09
Андрей Тр. aka RH
Надо бы выяснить сперва, что именно вызывает эти ошибки. Возможно, "застрял" какой-то объект в дереве - его измененное состояние постоянно сохраняется в базе. Надо бы выяснить, какой объект ( объекты ) порождает эту ситуацию .. дальше действовать по обстановке ( вручную, как правило ). В идеале хорошо бы посмотреть кусочек лога dstrace. А dsrepair вовсе не есть волшебная палочка, которая все сама исправляет - это всего лишь инструмент ( один из ) админа.
Добавлено:
01 мар 2004, 18:32
Савельев Дмитрий
Кусочек лога с теми ошибками, кторые возникают ...
BEMU: [2004/03/01 17:15:04] Find Next Object, btmatch=632 (mask=-2147483648), lastobj== ffffffff ) for conn 87
BEMU: [2004/03/01 17:15:04] Done with Find Next Object, returning== 0, type=619) Error=failed, no such object (-252)
AREQ: [2004/03/01 17:15:04] Calling DSAResolveName conn:323 for client .SYT.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:04] DSAResolveName failed, no such entry (-601).
AREQ: [2004/03/01 17:15:04] Calling DSAResolveName conn:323 for client .SYT.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:04] DSAResolveName failed, no such entry (-601).
VCLN: [2004/03/01 17:15:06] DCCreateContext context 000000aa for ca5710a0, taskID d2ce3080, idHandle 00000000
AREQ: [2004/03/01 17:15:06] Calling DSARead conn:0 for client .NEON.Moscow.Mechel.MECHEL.
AREQ: [2004/03/01 17:15:06] DSARead failed, no such attribute (-603).
VCLN: [2004/03/01 17:15:06] request DSARead by context 170 failed, no such attribute (-603)
VCLN: [2004/03/01 17:15:06] DCFreeContext context 000000aa for ca5710a0, idHandle 00000000, connHandle ffffffff
VCLN: [2004/03/01 17:15:06] DCFreeContext context ffffffff for ca5710a0, idHandle ffffffff, connHandle ffffffff
VCLN: [2004/03/01 17:15:06] DCCreateContext context 000000aa for ca5710a0, taskID d2ce3380, idHandle 00000000
AREQ: [2004/03/01 17:15:06] Calling DSAReadEntryInfo conn:0 for client .NEON.Moscow.Mechel.MECHEL.
VCLN: [2004/03/01 17:15:06] request DSAReadEntryInfo by context 170 succeeded
VCLN: [2004/03/01 17:15:06] DCFreeContext context 000000aa for ca5710a0, idHandle 00000000, connHandle ffffffff
AREQ: [2004/03/01 17:15:06] 1 GlobalCheckManagement.
Вот такая вот петрушка ... Подскажите, кде копать, куда лезть?
Добавлено:
01 мар 2004, 21:14
alexp_mac
Трудно сказать заочно, ну есть строчки где один сервер не может зарезолвить другой.
Вообще, сперва начните с того, что сервера друг друга видят, по IP скажем, т.к. если у Вас один сервер видит другой через ip, а этот другой видит третий через ipx, то синхронизация будет очень долгой и нудной. Поэтому сперва проверьте, что сервера друг-друга видят и время на ни х синхронизировано.
Выложите сюда кусок лога dsreapair time synchronization and server status information. Чтобы было ясно видно сосотояние каждго сервера. Лучше это сделать на мастере.
Добавлено:
02 мар 2004, 07:52
Андрей Тр. aka RH
Лично я бы сосредоточился на -252 - выяснить, для какого именно object оно failed ( ИМХО это делается настройками dstrace, вкл. повышенной детализации сообщений - конкретные ключи надо смотреть в доке или хелпе по ней ). -601 и -603 могут изредка возникать при нормальной работе, а вот -252 по идее быть не должно. Посмотреть, что в тот момент ( выдачи этой ошибки ) висит на коннекшене 87 ( в строке непосредственно перед ошибкой ).
Алексей Подгорчук
Как я понял, до работы с
двумя репликами там дело не доходит .. раз второй сервер не ставится в дерево. Вся ситуация пока что крутится вокруг мастера, из сказанного ИМХО у них просто проблемы в дереве и вторую реплику нормально не добавить в кольцо. По крайней мере мне так кажется .. на сей момент. Разумеется, могу быть неправ
Добавлено:
02 мар 2004, 08:58
Струин Олег
Странная ошибка:
И еще, при попытке войти в SER1\SYS\PUBLIC\WIN32 ошибка:
There is not enough space on the disk, хотя на томе SYS свободно чуть больше 2 Gb. Кстати, в остальные директории пускает нормально ...
Может попробовать vrepair запустить
Добавлено:
02 мар 2004, 10:17
Савельев Дмитрий
Шаманские танцы по приведению сервера и дерева в рабочее состояние закончились нашей полной победой.
Проблема заключалась в следующем:
после очередного запуска DSREPAIR он как обычно создал temp-овые файлы базы NDS NDT*.* а переименовать их обратно не смог, так как съехавшая крыша у FILESYS не видела свободного места на томе SYS.
Вылечилось следующим образом:
- была выгружена DS.NLM
- с помощью СС были переименованы файлы NDT*.* в NDS*.* в каталоге _NETWARE
- сервер был перезагружен и сделан VREPAIR на томе SYS
- после запуска DSREPAIR -a удалились неверные файлы *.NDT
и все заработало ...
Теперь бы еще с ошибками -601 и -603 разобраться ...
Добавлено:
02 мар 2004, 10:24
Андрей Тр. aka RH
Поздравляю
Еще можно было попробовать грузить server -ndb и дальше чинить том, но это детали. Насчет -601 -603 особо не бери в голову .. Понаблюдать за деревом в dstrace какое-то время не помешает, впрочем.
Добавлено:
02 мар 2004, 10:34
alexp_mac
съехавшая крыша у FILESYS не видела свободного места на томе SYS.
А ставили сервер-то с какого дистрибутива? Без суппорт паков или с оверлея?
Добавлено:
02 мар 2004, 10:55
Савельев Дмитрий
Да вся проблема-то в том, что эти сервера ствил не я. Я только в них разбираться начал (в смысле не первый раз увидел - а сменил место работы). Так что откуда они ставились, как они ставились я сказать ничего не могу ...
Добавлено:
02 мар 2004, 12:05
alexp_mac
[quote="Савельев Дмитрий"]Да вся проблема-то в том, что эти сервера ствил не я. Я только в них разбираться начал (в смысле не первый раз увидел - а сменил место работы). Так что откуда они ставились, как они ставились я сказать ничего не могу ...[/quote]
Значит концов не найдешь. Заработало и хорошо.
dsaresolvername...
Добавлено:
19 ноя 2004, 12:03
Lab
А кто может подсказать по сути 601 ошибки ?