Как организовать RAID на новом HP380?

Обсуждение технических вопросов по продуктам Novell

Сообщение Аркадий Глазырин » 26 авг 2005, 08:37

Владимир Занадворов писал(а):Может я что-то путаю, но spare drive ни электричества не ест, ни шпинделем не крутит, иначе какой в нём эротический смысл, если он свой ресурс так же как и остальные вырабатывает?


У меня в июле проблема на одном объекте была.
Там я без HotSpare собрал.
Два винта разом в OFF LINE вышли. Точнее, неизвестно. Может и не разом. Может с разрывом в сутки. Но был бы HOTSPARE так не было бы потери данных. Бакапа у местного админа ума не хватило сделать.
Вообще ни одного.
Он на RAID надеялся.
Причина онкологий - иммунодефицит. Он вызывается загаром, нервотрёпкой, прививками от гриппа, генномодифицированными дрожжами, например "Саф-Момент", приёмом наркотиков, особенно героиновой группы. + Грибы и паразиты.
Аватара пользователя
Аркадий Глазырин
 
Сообщения: 2762
Зарегистрирован: 16 авг 2002, 09:09
Откуда: Екатеринбург

Сообщение Timur Kazimirov » 26 авг 2005, 08:42

Предлагаю ввести в обиход поговорку "На RAID надейся, но ленточки в сейф складывай" :)
Timur Kazimirov
 
Сообщения: 1153
Зарегистрирован: 10 фев 2004, 09:56
Откуда: Южно-Сахалинск

Сообщение Сергей Каретин » 26 авг 2005, 10:04

ИМХО, том SYS надо располагать на отдельном физическом носителе.
Сергей Каретин
 
Сообщения: 201
Зарегистрирован: 05 июн 2002, 08:21
Откуда: Ярославль

Сообщение Андрей Старков » 26 авг 2005, 10:11

у меня например есть сервер в Intellовском SC5000 шасси и с мамкой STL2
у такой конфигурации есть известный баг - при большой нагрузке на дисковую подсистему плата "горячей корзины" выводит один из дисков в OFF-LINE. лечится перепрошивкой платы корзины, но имея STL2 перепрошить нельзя. У меня уже даже есть сервер с более новой платой, но в тот момент когда он появился не было времени, а сейчас выводить 2 боевых сервера в офф-лайн и перепрошивать :-(
так и мирюсь, слежу просто, если бы из 5 дисков один не был хотом, было бы плохо. Один единственный раз, помощник работал еще недавно а я на неделю уехал, не проследили, вылетело 2 диска с разниыей в 5 дней. И бэкап был, но восстановили рейд утилитами от интела. так было быстрее.

Так что если есть возможность, я за хотсвап (+ в тумбочке :-)
Андрей Старков
 
Сообщения: 473
Зарегистрирован: 21 июн 2002, 13:57
Откуда: г. Ноябрьск, ЯНАО

Сообщение Аркадий Глазырин » 26 авг 2005, 11:12

Андрей Старков писал(а):Так что если есть возможность, я за хотсвап (+ в тумбочке :-)


Не за ХОТСВАП, а ХОТСПЭА. Наверное.
Аватара пользователя
Аркадий Глазырин
 
Сообщения: 2762
Зарегистрирован: 16 авг 2002, 09:09
Откуда: Екатеринбург

Сообщение Андрей Старков » 26 авг 2005, 12:37

2А. Глазырин: ты прав! ошибка вышла, но думаю меня поняли :-)
Андрей Старков
 
Сообщения: 473
Зарегистрирован: 21 июн 2002, 13:57
Откуда: г. Ноябрьск, ЯНАО

Сообщение Владимир Занадворов » 26 авг 2005, 13:09

PavelKHTW писал(а): И какую же он (6-й диск) будет нести полезную нагрузку? Разве что спасет от одновременного выхода из строй 2-х дисков RAID? На вашей практике такое часто случалось?


За крайние два года - один раз видел своими глазами и ещё раза 3-4 по рассказам знакомых. На мой взгляд, достаточно для того, чтобы при возможность hotspare использовать.
--
Аватара пользователя
Владимир Занадворов
 
Сообщения: 167
Зарегистрирован: 09 фев 2005, 13:28
Откуда: Москва

Сообщение PavelKHTW » 26 авг 2005, 13:41

Владимир Занадворов писал(а):
PavelKHTW писал(а): И какую же он (6-й диск) будет нести полезную нагрузку? Разве что спасет от одновременного выхода из строй 2-х дисков RAID? На вашей практике такое часто случалось?


За крайние два года - один раз видел своими глазами и ещё раза 3-4 по рассказам знакомых. На мой взгляд, достаточно для того, чтобы при возможность hotspare использовать.

- Вы меня не так поняли, я ЗА диск горячей замены, я задал вопрос Николаю - чем лучше RAID6 по сравнению с RAID5+горячая замена? Вылет одновременно двух дисков был ли такой случай у кого в практике?


ps У самого уже не раз летели диски в серверах HP - горячая замена очень была к стати, пока сервис HP привезет диск - я уверен что у меня все будет работать.
PavelKHTW
 
Сообщения: 1037
Зарегистрирован: 08 окт 2003, 13:02
Откуда: Украина

И я пару слов вставлю

Сообщение Павел Гарбар » 26 авг 2005, 13:59

К сожалению диски теперь пошли не очень хорошие, даже сказевые и от приличных производителей. Срок жизни моделей очень короток...
Поэтому предлагаю при набивке корзин нового сервера сразу брать 1-2 штуки для положения их на полку.
Компаковский ADG (Advanced Date Guarding), то что некотоорые называют RAID-6, действительно спасает от порчи двух дисков. Но теперь для массива нужно минимум 4 диска, а не 3, как для RAID-5.
Горячий резерв полезен для серверов непрерывного цикла действия. А в те, которые могут до утра подождать админа, я бы hot-spare не втыкал - пусть лучше на полке лежит, а админ придет и воткнет. Был у меня случай, когда Mylex'овый RADI контроллер при подхватывании hot-spare вообще рассыпал массив и начисто его забывал. При перезагрузке приходилось конфигурить его заново.
Ну и не забывайте, что RAID - это средство повышения отказоуйстойчивости, а никак не замена резервной копии.
Павел Гарбар
 
Сообщения: 710
Зарегистрирован: 05 июн 2002, 09:36
Откуда: Санкт-Петербург

Сообщение Музалёв Николай » 26 авг 2005, 14:03

...какую будет нести полезную нагрузку? [(6-й раид)]

Предполагается - защищать данные пользователей от потери, а мою [сторона, противоположная переднице] - от наказаний.

Коллеги!
Тут вопрос чисто философский: я двумя руками за "автоматический бакап", но что касается "автоматического восстановления"- тут уж извините! А наличие диска горячего резерва - это именно "автовосстановление".
Сначала надо подумать, от чего сбой и безопасно ли вводить новый диск в раид, и только потом - чиниться, ИМНО...
Поэтому я для себя считаю правильным увеличить надежность хранения данных именно таким способом - RAID6 + диск в ЗИПе.

По поводу "лучше-хуже".
Насколько я могу судить в соотв. со своими незнаниями - RAID6 готов и всегда работает, а состояние "RAID5+1диск" предполагает, что в не самый счастливый день [для раида и его админа] начнется автоматическая инициализация диска (десятки минут), а затем начнется автоматический рестриппинг (пересчет данных и заполнение ими включенного диска (сотни минут, часы)).

Мне это не очень уютно: пришлось на собственном опыте убедиться, что это не всегда нормально срабатывает: диск отправился в дальний полет, но задержался в лифте. Внешне это выглядело примено так: диск выдает сбой, адаптер вздыхает и начинает процедуру ввода горячего резерва. Примерно на середине процедуры подохший диск вроде приходит в себя и процедура прекращается. Затем по зрелому размышлению подохший диск снова признает , что он помре, и восстановление снова начинается. И так не знаю сколько раз за ночь они кувыркались...
Мало того, что это занимало 60-70 % процессора, дык еще и данные могли запросто так напересчитываться, что и байтиков не собрал бы...
С тех пор я "не верю в электричество..."

2 Павел Гарбар
когда Mylex'овый RADI ... при подхватывании hot-spare вообще рассыпал массив и начисто его забывал

Во-во... всё вышеописанное - про Mylex DAC960PL
armoracia rusticana (lat.), "блины" и "фиги" всех видов, а также смайлики - крайне не желательны !
Музалёв Николай
 
Сообщения: 3034
Зарегистрирован: 04 июн 2002, 19:58
Откуда: Беларусь. МИНСК.

Сообщение PavelKHTW » 26 авг 2005, 22:06

Музалёв Николай писал(а):Мало того, что это занимало 60-70 % процессора, дык еще и данные могли запросто так напересчитываться, что и байтиков не собрал бы...
С тех пор я "не верю в электричество..."

Не понял, а причем тут процессор(я так понимаю имеется ввиду процессор сервера?) - мне всегда казалось что пересчет идет в "недрах железки" RAID.
PavelKHTW
 
Сообщения: 1037
Зарегистрирован: 08 окт 2003, 13:02
Откуда: Украина

Сообщение IlyaK » 29 авг 2005, 10:41

Т.е. получается, что процесс переноса данных на новый винт интеллектуальный? Он может начаться и в процессе воссоздания структуры данных на spare-винте внезапно прекратиться? Тогда действительно лучше spare не использовать.. Очень уж это непонятно как-то работает... К тому-же у нас практически всегда есть возможность заменить вышедший из строя винт.. Вот только как оперативно отмониторить выход из строя одного из винтов? И как происходит процесс замены? Просто вытаскиваешь проблемный винт и вставляешь новый, или какой софт надо запускать?
IlyaK
 
Сообщения: 72
Зарегистрирован: 08 дек 2003, 22:44

Сообщение Аркадий Глазырин » 29 авг 2005, 10:42

PavelKHTW писал(а):Вылет одновременно двух дисков был ли такой случай у кого в практике?


Да, был. И если бы я использовал HotSpare, то не получил бы потери данных.
Причина онкологий - иммунодефицит. Он вызывается загаром, нервотрёпкой, прививками от гриппа, генномодифицированными дрожжами, например "Саф-Момент", приёмом наркотиков, особенно героиновой группы. + Грибы и паразиты.
Аватара пользователя
Аркадий Глазырин
 
Сообщения: 2762
Зарегистрирован: 16 авг 2002, 09:09
Откуда: Екатеринбург

Сообщение Timur Kazimirov » 29 авг 2005, 10:54

IlyaK писал(а):Т.е. получается, что процесс переноса данных на новый винт интеллектуальный? Он может начаться и в процессе воссоздания структуры данных на spare-винте внезапно прекратиться? Тогда действительно лучше spare не использовать.. Очень уж это непонятно как-то работает... К тому-же у нас практически всегда есть возможность заменить вышедший из строя винт.. Вот только как оперативно отмониторить выход из строя одного из винтов? И как происходит процесс замены? Просто вытаскиваешь проблемный винт и вставляешь новый, или какой софт надо запускать?

При использовании RAID'а действительно "размазывание" данных по винтам производится математикой адаптера RAID (иначе какой в нем смысл?). От математики тут очень многое зависит, и у каждого производителя она своя. Проблем со spare-винтами у меня, по крайней мере, не было, а вот выходы из строя "боевых" винтов RAID'а - были, и неоднократно. И автоматическое подключение spare-винта в этих случаях спасало ситуацию.
Замена винта в RAID'е - да, банальное вытаскивание "убитого", и втыкание на его места "живого", но... Опять-таки, зависит от адаптера. Не исключено, что вечерком или ночью придется передернуть машину и проинициализировать новый винт (но это самый тяжелый расклад, современные адаптеры этого не требуют).
Что касается мониторинга состояния винтов в RAID'е, то вы наверняка найдете на прилагающемся к контроллеру сидюке соответствующий софт. Там и отправка SNMP-трапа, и почтовое, или еще какое уведомление наверняка будет. Поройтесь, не пожалеете!
Timur Kazimirov
 
Сообщения: 1153
Зарегистрирован: 10 фев 2004, 09:56
Откуда: Южно-Сахалинск

Сообщение Сергей Дубров » 29 авг 2005, 11:00

IlyaK писал(а):Т.е. получается, что процесс переноса данных на новый винт интеллектуальный? Он может начаться и в процессе воссоздания структуры данных на spare-винте внезапно прекратиться?

Нет, мне такого, во всяком случае, видеть не приходилось - операция ребилда массива, уж коли начала использовать hot spare диск, использует его до самого упора, не обращая на "моргающий" статус ранее умершего диска. Я это наблюдал (и моделировал) воочию как минимум на четырёх RAID-контроллерах разных производителей. Если бы процедура ребилда прекращалась каждый раз, когда "покойник" снова оживал - это было бы очень странно. Нормальный контроллер при первом же отказе помечает вышедший из строя диск как failed и больше ему уже "не верит".

IlyaK писал(а):Вот только как оперативно отмониторить выход из строя одного из винтов? И как происходит процесс замены? Просто вытаскиваешь проблемный винт и вставляешь новый, или какой софт надо запускать?

Зависит от конкретного софта и настроек. Можно сделать и автоматический запуск ребилда после вставки нового диска, можно руками.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Пред.След.

Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и гости: 30

cron