Страница 1 из 4
Несколько серверов в состоянии New несколько дней

Добавлено:
21 май 2007, 12:31
DeadMan
Добрый день, всем!
Подскажите, пожалуйста, что можно сделать в данной ситуации.
Уже несколько дней 2 сервера находятся в состоянии new.
На одном из этих серверов постоянно появляется в DSTRACE ошибка: <Sync> failed, replica not on (-673). В <> появляются различные сообщения. Такжу вылазят сообщение вида : Error =failed, not such object (-252).
В Novell Support смотрел, вроде бы как это нормальная ситуация, типа реплики обновляются. Может быть я и ошибаюсь.
В состояние new я их загнал, когда с мастер сервера послал обновления. Сделал это потому, что несколько дней были проблемы с коммуникациями к этим серверам.

Добавлено:
21 май 2007, 12:46
Савельев Сергей
попробуйте поискать ответ здесь
http://www.novell.com/support/search.do ... ct%20(-252)&document=DT_TID_1_1&cmd=search&contextType=gs

Добавлено:
21 май 2007, 12:54
DeadMan
Мне кажется, что мессага not such obect следствие того, что сервер находится в состоянии new. Но почему так долго?
Может я и не правильно ситуацию понимаю.

Добавлено:
21 май 2007, 13:21
Савельев Сергей
а что у Вас с синхронизацией????
что пишет в ответ на команду TIME???

Добавлено:
21 май 2007, 13:23
DeadMan
Не подскажите ли вот еще:
DSTRACE выкидывает периодически блоки в 16-разрядном виде. Это прием/получение объектов NDS?

Добавлено:
21 май 2007, 13:28
DeadMan
Time пишет: Time synchronization is active
time is synchronized to the network

Добавлено:
21 май 2007, 13:51
Савельев Сергей
посмотрел по первому номеру ошибки и нашёл вот это
http://www.novell.com/support/search.do ... 2036186712
проверте, не ваше

Добавлено:
21 май 2007, 17:10
Radik
В состояние new я их загнал, когда с мастер сервера послал обновления. Сделал это потому, что несколько дней были проблемы с коммуникациями к этим серверам.
В случае проблемм с коммуникациями важно, чтобы была правильно настроена времменная синхронизация (Primary, Secondary и указать источник сихронизации), и при восстановлении связи сервера получат все обновления. У нас была подобная ситуация. Насильно послылать обновления не рекомендую.
Что можно еще сделать, запустить dsrepair на проблеммном сервере, зайти в меню Advanced options menu - Replica and partition operations - выбрать раздел - View replica ring - выбрать сервер - Synchronize the replica on the selected server или Receive all objects for this replica или dsrepair на сервере с мастер репликой в режиме Unattended full repair.

Добавлено:
22 май 2007, 09:10
DeadMan
Receive all objects for this replica на проблемном сервере выкидывает ошибку. Unattended full repair на master показывает 6 ошибок.
Вот что выдает DSREPAIR:
Schema Attribute Definition, Object ID: 36000403, RDN: auxClassCompatibility
Unknown operational attribute definition was not checked
Schema Class Definition, Object ID: 0100033A, RDN: Tree Root
Unknown operational class definition was found
Generating Schema Cache
Master : SWL
Total Objects = 557, UNKNOWN class objects = 2, Total Values = 26217
Deleting unused property: 00061A00, "Synchronized Up To" for replica: 0x0184
Partition root ID: 010000B6, DN: SWL
EXTERNAL REFERENCES
Total Objects = 0, UNKNOWN class objects = 0, Total Values = 0
Total External References in this database = 0, Not backlinked = 0
INITIAL STATES
Checking mail directories
Checking stream syntax files
Repair process completed, total errors found = 0
Finish: Tuesday, May 22, 2007 9:04:48 am Local Time
Total repair time: 0:00:11
** Automated Repair Mode **
Repairing server network addresses
Start: Tuesday, May 22, 2007 9:04:48 am Local Time
Checking server: PERSONAL.SWLIFE
Found a network address property on the server object:
Address Type= (IPX), data[12]= 09B97EE60000000000010451
Checking server address in Replica ID: 4, [Root]
Checking server: DC_NN.SWLIFE
Found a network address property on the server object:
Address Type= (IPX), data[12]= 0BC694D90000000000010451
Checking server address in Replica ID: 4, [Root]
Checking server: UNITED.SWLIFE
Found a network address property on the server object:
Address Type= (IPX), data[12]= 075654B50000000000010451
Checking server address in Replica ID: 4, [Root]
Checking server: OSB.SWLIFE
Found a network address property on the server object:
Address Type= (IPX), data[12]= 3A35BE1F0000000000010451
Checking server address in Replica ID: 4, [Root]
Checking server: THIRD.SWLIFE
Found a network address property on the server object:
Address Type= (IPX), data[12]= 333333330000000000010451
Checking server address in Replica ID: 4, [Root]
** Automated Repair Mode **
Verifying / Repairing the remote server ID list
Start: Tuesday, May 22, 2007 9:04:48 am Local Time
Server ID: 09000452, This server's ID on the remote server: 0000800C
Warning: remote DN for the remote ID is: CN=THIRD.O=SWLIFE.T=SWL.
OK, authenticated to server: PERSONAL.SWLIFE
Server ID: 040001D7, This server's ID on the remote server: 0000805C
Warning: remote DN for the remote ID is: CN=THIRD.O=SWLIFE.T=SWL.
OK, authenticated to server: DC_NN.SWLIFE
Server ID: 0E000227, This server's ID on the remote server: 0100015E
OK, authenticated to server: OSB.SWLIFE
Server ID: 22000377, This server's ID on the remote server: 0000806F
Warning: remote DN for the remote ID is: CN=THIRD.O=SWLIFE.T=SWL.
OK, authenticated to server: UNITED.SWLIFE
** Automated Repair Mode **
Repairing replica ring
Start: Tuesday, May 22, 2007 9:04:49 am Local Time
Replica Ring for replica: [Root]
Remote server's local ID: 010000B8
Remote server's replica root ID: 010000B6
Remote server name is: THIRD.SWLIFE
OK - Authenticated to server
Remote server's local ID: 0E000227
Remote server's replica root ID: 010000B6
Remote server name is: OSB.SWLIFE
OK - Authenticated to server
Remote server's local ID: 22000377
Remote server's replica root ID: 00008043
Remote server name is: UNITED.SWLIFE
Warning - Remote DN for this partition is: T=SWL.
OK - Authenticated to server
Remote server's local ID: 040001D7
Remote server's replica root ID: 00008059
Remote server name is: DC_NN.SWLIFE
Warning - Remote DN for this partition is: T=SWL.
OK - Authenticated to server
Remote server's local ID: 09000452
Remote server's replica root ID: 00008009
Remote server name is: PERSONAL.SWLIFE
Warning - Remote DN for this partition is: T=SWL.
OK - Authenticated to server
** Automated Repair Mode **
Volume Object and Trustee Check
Start: Tuesday, May 22, 2007 9:04:49 am Local Time
Volume: SYS, object ID: 0100019E, CN=THIRD_SYS.O=SWLIFE.SWL
Checking trustees on volume: SYS
Volume: FIRST, object ID: 030000FE, CN=THIRD_FIRST.O=SWLIFE.SWL
Checking trustees on volume: FIRST
Volume: SECOND, object ID: 0400010B, CN=THIRD_SECOND.O=SWLIFE.SWL
Checking trustees on volume: SECOND
Volume: THIRD, object ID: BC0001D3, CN=THIRD_THIRD.O=SWLIFE.SWL
Checking trustees on volume: THIRD
Volumes checked: 4
** Automated Repair Mode **
Finish: Tuesday, May 22, 2007 9:05:36 am Local Time
Total repair time: 0:00:59

Добавлено:
22 май 2007, 09:40
DeadMan
Вот, что показывает на проблемном сервере:
UpdateLocalTransitiveVector failed, replica not on (-673).
DCFreeContext context 0000000b for c89514e0, idHandle 00000500, connHandle 00000
900
SkulkPartition for .SWL. failed, replica not on (-673).
Sync - Partition .SWL. failed, replica not on (-673).
Calling DSAResolveName conn:173 for client .UNITED.SWLIFE.SWL.
2007/05/22 12:36:10 Start partition sync .SWL. state:[1], type:[1].
DCCreateContext context 0000000b for c89514e0, taskID d1cc43e0, idHandle 0000000
0
UpdateLocalTransitiveVector failed, replica not on (-673).
DCFreeContext context 0000000b for c89514e0, idHandle 00000500, connHandle 00000
900
SkulkPartition for .SWL. failed, replica not on (-673).
Sync - Partition .SWL. failed, replica not on (-673).

Добавлено:
22 май 2007, 10:52
Radik
Тогда dsrepair на сервере с мастер репликой, зайти
в меню Advanced options menu - Replica and partition operations -
выбрать раздел - View replica ring - выбрать сервер с мастер репликой -
Send all objects to every replica in the ring

Добавлено:
22 май 2007, 10:58
DeadMan
А сервера не перейдут в состояние new?

Добавлено:
22 май 2007, 11:03
DeadMan
Попробовал "Send all object..."
Вылезла ошибка: An error occurred scheduling the operation, error -673
Program execution cannot continue normally.
вопросы

Добавлено:
22 май 2007, 11:07
skoltogyan
1. Время на серверах синхронизировано ?
2. дорога между серверами есть ?
(с консоли каждого сервера подключаются к другому в таком виде:
tel xx.xx.xx.xx 524
?)
3. попробуйте в /etc/hosts каждого из серверов прописать:
1.1.1.1 srv.firma.ru SERVER1
2.2.2.2 srv2.firma.ru SEVRER2
где SERVER1 и SERVER2.. - НАЗВАНИЯ ВАШИХ серверов.
Ну и перезагрузите все это хозяйство

Добавлено:
22 май 2007, 11:12
DeadMan
На сетевухах включен только IPX