Страница 1 из 1

NW6SP2, NSS, RAID-5, крах винта и .......

СообщениеДобавлено: 01 фев 2003, 01:01
Кирилл Крюков
Предмет разговора
NW6SP2+nss2b
Сервер HP LC2000 1х600М RAM=2G, IBM ServerRaid4M 2x9(зеркало, NSS, pool SYS) +3x36 (RAID-5, NSS, pool DATA)

Происшествие
Один 36Г выпадает в дефанк.
Сервер халтится и умирает (хотя наверное не должен?)
Ставлю другой такой же - том ребилдится.

Загружаюсь.
SYS конечно же монтируется, DATA - нет (хотя очень хотелось) состояние пула DATA - deactivated
nss /poolverify на SYS идет замечательно, на DATA дает
"can't load system beasts, can't continue"

/poolrebuild - ну не знаю сейчас кажется не вариант
Portlock - не пробовал

Есть ли варианты?
Чего не написал - sorry - в голове раздрай....

СообщениеДобавлено: 01 фев 2003, 15:10
Aleksey Matveets aka GAL
Ну если стоит 5 райд на 3х дисках, то для того чтобы система вообще ничего не заметила нуна 4-й диск в HOT SWAP, тогда все подхватится автоматом, после замены неисправного РАЙД все вернет обратно.
Если же нет хот свапа, то сервак будя работать до тех пор, пока не обратяться к данным кот. физически находились на мертвом диске. Потому и хальт.

А poolrebuild это последний довод королей, если боле ничего не помогает. Если том не монтируется и не проверяется, то хуже ужо не будет.

SOS SOS SOS SOS SOS SOS SOS

СообщениеДобавлено: 01 фев 2003, 17:57
Кирилл Крюков
Дополнительно (Что плохо)
Замена выпавшего винта на другой такой-же рабочий, ничего не дала.

Меня больше всего страшат следующие факты
1) Повторюсь
nss /poolverify на SYS идет замечательно, на DATA дает
"can't load system beasts, can't continue"

не знаю, что за звери (по Новлу - это объекты), но если он не находит их (и они системные) в проверке то и ребилд вряд ли чего хорошего принесет

2) portlock stormanager дает при Pool->Check на блоках 71017567-
71017574 ошибку 256 и все кончается приблизительно тем же "Pool Beasts Tree Failed to verify"

************************************
Поэтому - нужны телефоны контор, восстанавливающих информацию, но знающих про NSS, RAID-5 в HotSwap винтах и в _корзине_, ....
************************************

ПОДСКАЖИТЕ
SOS (в прямом смысле этого слова.)

СообщениеДобавлено: 03 фев 2003, 11:59
Aleksey Matveets aka GAL
Если усе так серьезно и денег не жалко, да еще к тому же бакапа нет, то попытайся обратиться сюды

Novell Professional Services
929-9025

Никитин Алексей
Давыдов Александр
Греков Андрей

В пр-пе poolrebuild и занимается перестроением дерева, но спрос не бьет в нос

СообщениеДобавлено: 03 фев 2003, 13:51
Vladimir Kozak
Aleksey Matveets aka GAL писал(а):Ну если стоит 5 райд на 3х дисках, то для того чтобы система вообще ничего не заметила нуна 4-й диск в HOT SWAP, тогда все подхватится автоматом, после замены неисправного РАЙД все вернет обратно.
Если же нет хот свапа, то сервак будя работать до тех пор, пока не обратяться к данным кот. физически находились на мертвом диске. Потому и хальт.


Я извиняюсь, но ерунда какая-то. Хот-свап - это хорошо, но при чем тут хальт при вылете одного винта рэйда? Вы неправы, такого не бывает.

Согласен

СообщениеДобавлено: 03 фев 2003, 15:36
Oleg Martynov
3 диска это необходимый минимум для 5-го RAID-а. Т.е. при вылете одного диска RAID должен сказать, что мол реденденси кончилось срочно вставьте другой диск, НО при этом ДАННЫЕ потеряться не должны. Может все-таки не один диск гавкнулся или не диск а контроллер? А сам софт RAID-а чего говорит?

ServeRaid

СообщениеДобавлено: 03 фев 2003, 20:11
Кирилл Крюков
Итак что говорит софт -
когда вышел из строя диск -
one hard disk defunc
one logical disk critical

когда подсунули ему на место старого новый и хороший
rebuilding array................................................success

сейчас в ПОСТе фигня какая-то типа
2 stripe disks CRC errors
- не понимаю я этого (то есть из этих слов выходит что на одном - на новом что-ли диске CRC зашибись, а вот на других - не очень. А как же тогда rebuild success) Можно конечно вынуть диск, объявив эго defunc-om обратно вставить пересоздать массив и и посмотреть что будет.

Фишка для тех кто не трогал этот Serveraid 4H - большая часть функционала построения сетов вынесена на сидюк с которого грузится по линухом гуи с программулиной. В ПОСТе только мини-функционал - типа показать сообщения и как диски рассованы по id.

Так вот она - ничего не видит, кроме того что диски выпущено более года назад и как-бы просроченные.