Что есть:
NW6.0SP4, назначение - ФС, режим работы практически 24/7, стоит на Intel'ом железе. Все партиции размещаются на RAID1 собранных аппаратно на SRCU42L (отдельный диск для тома SYS, еще один под рабочий том data).
За последний месяц, видимо, стали "сыпаться" винты из массива рабочего тома data. При этом процесс выглядит так:
Adapter 0, SCSI-B, ID 2: last status 0x4800700B. Sense code: ABORTED COMMAND, INITIATOR DETECTED ERROR MESSAGE RECEIVED
Adapter 0, Array Drive 1: FAIL state entered
Adapter 0, Host Drive 1 not ready
NSS-3.00-5001: Pool SNW1/PSCSI1 is being deactivated.
Т.е. в результате временного отказа одного из винтов отваливается устройство и том с ним. После перегрузки сервера том нормально монтируется и работает (состояния массива - FAIL разумеется). Может можно и без перезагрузки сервера его "вернуть к жизни", но это не принц-но, так как важен сам факт - при сбое одного из дисков массив перестает работать и без внешнего вмешательства не восстанавливается... Что, очень мягко говоря, вызывает трудности у всей организации и меня лично...
Из всего этого родилась след. мысль (т.к. менять глобально ничего не хочется - железо, ОС и пр.) - добавить в сервер пару-тройку новых винтов, проиниц. их по отдельности через RAID-контр. 1 физ. винт - 1 лог. устройство. И путем зеркалирования партиций смигрировать сущ. том на прогр. RAID1 средствами NW. Т.к. особого опыта в исп. подобных схем для работы у меня нет (я пробовал с парой ATA дисков на тестовом сервере), хочется услышать мнение тех, кто использует подобную схему.
Вопросы такие:
1. Стоит ли менять? Основная цель - сервер должен продолжать работать если отказывает один из дисков. Вопрос мощности сервера не стоит, с загрузкой ЦП, шины SCSI проблем не будет.
2. При отказе одного из дисков - партиция (и тома на ней) остаются в раб. состоянии?
3. Насколько прогр. RAID снижает произв. системы + насколько он вообще соотв. RAID1 (т.е. в теории скорость чтения R1=скорость диска*на их число, записи = запись на диск1+disk2+...).
4. Если в п.3. формулы верны, есть ли смысл делать прогр. RAID1 из 3 дисков (соотн. операций чтение:запись - 20:1) + повышается отказоустойчивость. (нужные скорости передачи данных, как я понимаю, SCSI-шина обеспечит, узким местом является сеть).
Интересуют мнения по практическому применению.