Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Обсуждение технических вопросов по продуктам Novell

Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Сообщение Сергей Дубров » 14 янв 2011, 20:04

Почти три года отработали два практически одинаковых по конфигурации сервера с RAID Adaptec ASR-2130SLP (RAID5) под Netware 6.5SP5+postfixes (переход на SP8 для меня пока невозможен по некоторым причинам). В последнее время заметил, что есть проблемы с записью - если попытаться скопировать на сервер большой файл (~500МБ и больше), то наблюдается следующая картина: сначала скорость копирование бодро прыгает в район 35-38МБайт/сек, потом (видимо, когда заканчивается кеш) скорость падает до просто неприличных величин, типа килобайт в секунду. В мониторе счётчик "Current disk requests" рывком прыгает примерно до 1016-1026 и держится на этой величине не только, пока идёт копирование, но и ПОСЛЕ окончания. Если файл очень большой, то доводилось видеть "залипшие" "Current disk requests" по минуте и более. Повторю, это ПОСЛЕ того, как копирование было закончено.

Если смотреть при этом на диски, то по лампочкам особой активности не видно. Загрузка процессора тоже никакая, типа 3-6%. По прошествии минуты-другой счётчик "Current disk requests" сбрасывается скачком до нуля, без промежуточных цифр.

При таком же копировании на другой сервер, н-р, с HostRAID-ом на базе AIC-7902 (драйвер A320RAID.HAM) всё нормально - и скорость записи повыше и "Current disk requests" не "замерзает", а меняется в процессе копирования и ПОСЛЕ окончания копирования практически мгновенно скидывается в ноль.

Скрость линейного чтения с проблемного ASR-2130SLP в норме, где-то ~140-150Мбайт/сек, проблема именно с записью. Игрища с set-ами типа "set maximum concurrent disk cache writes" ситуацию не улучшили. Сейчас вернулся к дефолтным значениям.

Что непонятно - когда я эти сервера оживлял ~три года назад, я тестировал их дисковую подсистему и на чтение и на запись - всё было в норме, скорость записи держалась в районе 100-110Мбайт/сек. Что произошло сейчас - не понимаю. Самое противное - запись не просто тормозит, а может в итоге даже вызвать ошибку на клиенте, типа "диск недоступен", т.е. большие файлы вообще не удаётся скопировать на сервер!

Что ещё - когда поднимал эти сервера, последние доступные на тот момент версии драйвера AACRAID.HAM (кажется 5.00) у меня не пошли - как-то очень странно себя вели (н-р, при линейном чтении массива моргали лампочки только у трёх дисков из пяти). Немного поэкпериментировав, я остановился на версии 4.10 (с 4.20 тоже что-то не так было) от марта 2004.

Помнится, что в начале 2006 года Адаптек выпустил новую фирмварь для 2130SLP, в которой от дисков отгрызалось больше места под метаданные по сравнению с предыдущими версиями:

"
http://www.adaptec.com/en-us/speed/epro ... 32_exe.htm

Question
Using a drive of the exact same make and model as all the others in the array after flashing the card BIOS/firmware to build 8832 or later, it appears to not have enough space on the drive. What has happened?


This information applies to the following Operating System(s):
- This information is not operating system specific
Answer
With the addition of the Advanced Data Protection Suite of features which includes the additional RAID levels 1E, 5EE & 6 the metadata size has increased from previous versions. There are certain conditions in which this may require you to use a special procedure.

When adding a new drive as a replacement or to be used as a hot spare that is the same make, model and size as those already in the array and if the original array was initialized under firmware prior to build 8832 you will receive an error. This error will state that there is not enough space on the drive to be assigned as a spare. This is due entirely to the increase in metadata size.

The only current work around is one of the following:

1. Use a drive larger than the current drives

2. Revert the card to previous firmware and initialize the new drive there. When it is initialized and added as a hot spare or replacement drive then re-flash to the current firmware version.

3. Backup the array, then reinitialize all drives, recreate the array and restore the data. A backup is important because initializing the drives will delete all data!"


И я точно помню, что обновлялся на новую фирмварь, пересобрав массив (вариант 3), сервера тогда ещё были не в работе. Какая сейчас версия фирмвари - убей бог, не помню, кажется 9xxx какая-то.

Теперь вопросы:

Можно ли пробовать новые версии AACRAID.HAM а) не обновляя фирмварь контроллера; б) не поднимая версию SP на Netware выше текущей 5-ой? У меня есть версии драйверов 4.20, 4.21 (не помню где нарыл), 5.00, 5.10 (две различающиеся по дате и по размеру!) и вот недавно найденная по наводке 5.20.

Почему не хочу менять фирмварь - долго, сервера самые что ни на есть боевые, если вдруг что-то пойдёт не так - меня убьют на месте в течении пары минут :) (у меня был неприятный опыт, когда после перепрошивки RAID-контроллера он не увидел массив и, что самое хреновое - не увидел его после отката прошивки обратно. Поэтому эксперименировать на живом не хочу). Всё, что хочу - попробовать сменить драйвер, перегрузить сервер и проверить ситуацию с записью. Вполне возможно, что смена фирмвари всё же обязательна, но ведь с этой прошивкой и с этим драйвером три года назад запись была в норме. Что случилось сразу на двух одинаковых железяках? В совпадения я не верю... Один из серверов недавно перезагружался (30-го декабря у него выпал из RAID-а диск, я делал ребилд, заходил в BIOS, но версию фирмвари глянуть забыл), второй сервер работает без перезагрузки год без малого. Так что версия "накопившейся усталости" тоже не проходит :).

UPD: Блин, нашёл себя же, пятилетней давности, с этой же темой, где написано, что версии драйверов 4.20 и 5.00 просто не работали: viewtopic.php?f=1&t=6651&p=44251&hilit=AACRAID.HAM#p44251 - засада.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Сообщение Константин Ошмян » 14 янв 2011, 20:24

Сергей, а что с батарейкой на кэш в этих контроллерах?
На тех серверах, с которыми я имел дело (IBM-овские), при сдыхании батарейки на контроллере режим записи автоматически переключается с write-back на write-through (с симптомами, похожими на твои).
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Сообщение Сергей Дубров » 14 янв 2011, 20:42

Константин Ошмян писал(а):Сергей, а что с батарейкой на кэш в этих контроллерах?

Не поверишь, но я не помню, были ли BBU на этих контроллерах вообще - давно дело было, NW развращает - включил - забыл :). Хотя ты, похоже, действительно подсказал верное направление поиска - если три года назад запись была норм, а сейчас жутко тормозит - действительно, дело может оказаться в сдохшей батарейке. В понедельник попробую подлезть к серверу в стойку и на ходу глянуть на батарейку RAID-а.

Константин Ошмян писал(а):На тех серверах, с которыми я имел дело (IBM-овские), при сдыхании батарейки на контроллере режим записи автоматически переключается с write-back на write-through (с симптомами, похожими на твои).

Да, так себя ведут все приличные контроллеры. LSI вообще прячет пункты включения write-back, если BBU отсутствует.

Самое обидное, что никакого мониторирующего софта на NW я не ставил - посмотрел на адаптековского java-монстрика, который шёл на CD к контроллеру - и решил без него обойтись. Поэтому на ходу посмотреть статус батарейки не могу. А 30-го декабря, когда массив ребилдил - вообще не до того было, даже версию фирмвари не посмотрел - вот-вот новый год наступит, а у меня массивы помирать решили :).

Кстати, я что-то вообще не припомню где в BIOS-е 2130SLP посмотреть про кэш/BBU.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Сообщение Dimerson » 15 янв 2011, 07:18

Сергей помните я давал диски для 2130 - у меня с тех же лет 2 шт трудятся (сейчас под Lenny - железный RAID1). Батареек нет - проблем нет .
Аватара пользователя
Dimerson
 
Сообщения: 2966
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Проблемы с AACRAID.HAM (контроллер ASR-2130SLP)?

Сообщение Сергей Дубров » 15 янв 2011, 15:19

Dimerson писал(а):Сергей помните я давал диски для 2130 - у меня с тех же лет 2 шт трудятся (сейчас под Lenny - железный RAID1). Батареек нет - проблем нет .

Да, помню конечно - диск я использовал, удобный полезный софт. Но вот почему у меня тогда запись была быстрая, а сейчас тормозит - непонятно. Константин всё-таки похоже прав - проблемы с батарейкой.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4