NW6SP2, NSS, RAID-5, крах винта и .......

Обсуждение технических вопросов по продуктам Novell

NW6SP2, NSS, RAID-5, крах винта и .......

Сообщение Кирилл Крюков » 01 фев 2003, 01:01

Предмет разговора
NW6SP2+nss2b
Сервер HP LC2000 1х600М RAM=2G, IBM ServerRaid4M 2x9(зеркало, NSS, pool SYS) +3x36 (RAID-5, NSS, pool DATA)

Происшествие
Один 36Г выпадает в дефанк.
Сервер халтится и умирает (хотя наверное не должен?)
Ставлю другой такой же - том ребилдится.

Загружаюсь.
SYS конечно же монтируется, DATA - нет (хотя очень хотелось) состояние пула DATA - deactivated
nss /poolverify на SYS идет замечательно, на DATA дает
"can't load system beasts, can't continue"

/poolrebuild - ну не знаю сейчас кажется не вариант
Portlock - не пробовал

Есть ли варианты?
Чего не написал - sorry - в голове раздрай....
Кирилл Крюков
 
Сообщения: 3
Зарегистрирован: 01 фев 2003, 00:28
Откуда: Москва

Сообщение Aleksey Matveets aka GAL » 01 фев 2003, 15:10

Ну если стоит 5 райд на 3х дисках, то для того чтобы система вообще ничего не заметила нуна 4-й диск в HOT SWAP, тогда все подхватится автоматом, после замены неисправного РАЙД все вернет обратно.
Если же нет хот свапа, то сервак будя работать до тех пор, пока не обратяться к данным кот. физически находились на мертвом диске. Потому и хальт.

А poolrebuild это последний довод королей, если боле ничего не помогает. Если том не монтируется и не проверяется, то хуже ужо не будет.
CNE/CLE, OCP/MOL, LPIC1

И это пройдет .....
Aleksey Matveets aka GAL
 
Сообщения: 109
Зарегистрирован: 25 авг 2002, 18:14
Откуда: Moscow

SOS SOS SOS SOS SOS SOS SOS

Сообщение Кирилл Крюков » 01 фев 2003, 17:57

Дополнительно (Что плохо)
Замена выпавшего винта на другой такой-же рабочий, ничего не дала.

Меня больше всего страшат следующие факты
1) Повторюсь
nss /poolverify на SYS идет замечательно, на DATA дает
"can't load system beasts, can't continue"

не знаю, что за звери (по Новлу - это объекты), но если он не находит их (и они системные) в проверке то и ребилд вряд ли чего хорошего принесет

2) portlock stormanager дает при Pool->Check на блоках 71017567-
71017574 ошибку 256 и все кончается приблизительно тем же "Pool Beasts Tree Failed to verify"

************************************
Поэтому - нужны телефоны контор, восстанавливающих информацию, но знающих про NSS, RAID-5 в HotSwap винтах и в _корзине_, ....
************************************

ПОДСКАЖИТЕ
SOS (в прямом смысле этого слова.)
Кирилл Крюков
 
Сообщения: 3
Зарегистрирован: 01 фев 2003, 00:28
Откуда: Москва

Сообщение Aleksey Matveets aka GAL » 03 фев 2003, 11:59

Если усе так серьезно и денег не жалко, да еще к тому же бакапа нет, то попытайся обратиться сюды

Novell Professional Services
929-9025

Никитин Алексей
Давыдов Александр
Греков Андрей

В пр-пе poolrebuild и занимается перестроением дерева, но спрос не бьет в нос
CNE/CLE, OCP/MOL, LPIC1

И это пройдет .....
Aleksey Matveets aka GAL
 
Сообщения: 109
Зарегистрирован: 25 авг 2002, 18:14
Откуда: Moscow

Сообщение Vladimir Kozak » 03 фев 2003, 13:51

Aleksey Matveets aka GAL писал(а):Ну если стоит 5 райд на 3х дисках, то для того чтобы система вообще ничего не заметила нуна 4-й диск в HOT SWAP, тогда все подхватится автоматом, после замены неисправного РАЙД все вернет обратно.
Если же нет хот свапа, то сервак будя работать до тех пор, пока не обратяться к данным кот. физически находились на мертвом диске. Потому и хальт.


Я извиняюсь, но ерунда какая-то. Хот-свап - это хорошо, но при чем тут хальт при вылете одного винта рэйда? Вы неправы, такого не бывает.
Аватара пользователя
Vladimir Kozak
 
Сообщения: 762
Зарегистрирован: 30 янв 2003, 15:13

Согласен

Сообщение Oleg Martynov » 03 фев 2003, 15:36

3 диска это необходимый минимум для 5-го RAID-а. Т.е. при вылете одного диска RAID должен сказать, что мол реденденси кончилось срочно вставьте другой диск, НО при этом ДАННЫЕ потеряться не должны. Может все-таки не один диск гавкнулся или не диск а контроллер? А сам софт RAID-а чего говорит?
Аватара пользователя
Oleg Martynov
 
Сообщения: 63
Зарегистрирован: 20 авг 2002, 19:57
Откуда: Moscow, Russia

ServeRaid

Сообщение Кирилл Крюков » 03 фев 2003, 20:11

Итак что говорит софт -
когда вышел из строя диск -
one hard disk defunc
one logical disk critical

когда подсунули ему на место старого новый и хороший
rebuilding array................................................success

сейчас в ПОСТе фигня какая-то типа
2 stripe disks CRC errors
- не понимаю я этого (то есть из этих слов выходит что на одном - на новом что-ли диске CRC зашибись, а вот на других - не очень. А как же тогда rebuild success) Можно конечно вынуть диск, объявив эго defunc-om обратно вставить пересоздать массив и и посмотреть что будет.

Фишка для тех кто не трогал этот Serveraid 4H - большая часть функционала построения сетов вынесена на сидюк с которого грузится по линухом гуи с программулиной. В ПОСТе только мини-функционал - типа показать сообщения и как диски рассованы по id.

Так вот она - ничего не видит, кроме того что диски выпущено более года назад и как-бы просроченные.
Кирилл Крюков
 
Сообщения: 3
Зарегистрирован: 01 фев 2003, 00:28
Откуда: Москва


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: Yahoo [Bot] и гости: 2

cron