NW65 на Intel7501BR2+ASR2130SLP = плохо!

Обсуждение технических вопросов по продуктам Novell

NW65 на Intel7501BR2+ASR2130SLP = плохо!

Сообщение Сергей Дубров » 27 окт 2005, 13:13

Имеем железо Intel7501BR2 (два 3.06 Xeon-а, HT выключен), ОЗУ 2Гиг, RAID контроллер Adaptec 2130SLP, собран массив RAD5 из трёх 73Гиг фуджиков, stripe=64K.

Установлен OES (NW6.5+SP3). Создан единственный (пока) том SYS под систему.

Проблема - для измерения скорости работы массива запускаю портлоковскую DSKTEST, выбираю sequential verify, блоки по 128 секторов (64K). Скорость вполне приличная, 62-63 мбайт/сек, но через некоторое время (1-3 минуты) тест останавливается, после долгого (~5 мин) таймаута DSKTEST сообщает про read error, на консоль начинают лезть ошибки про поломанный NSS и вылезает строка (не дословно) device queue frozen, указующая на ASR3210.

Что было предпринято - пробовались драйверы трёх версий - 4.10, 4.20 (последний с сайта адаптека), 5.00 (с сайта новела). Пробовался NWPA.HAM от SP4a. BIOS машины переписан на последний - v.20 r.82. Сменил firmware у адаптековского RAID-а, с 7348 на последнюю 8205. Переставил плату RAID-контроллера в другой слот - 2 (segment C, PCI-X 64-bit/133MHz если одна плата), до этого он стоял в слоте 3 (segment B, PCI-X 64-bit/100MHz) - БЕСПОЛЕЗНО! Всё, чего удалось "добиться" - зависать после начала теста стало чаще в районе 3-ей минуты, вместо первой, как было изначально.

Как всегда вопрос: к кому стучаться, кого пинать? Тут неприятный момент в том, что с выходом ASR3120 у него были серьёзные проблемы с интеловскими серверными платами, которые они - интел и адаптек долго, кивая друг на друга - преодолевали. Летом, когда мы выбирался RAID-контроллер, нас заверили, что проблемы решены. Но очень пожоже, что не совсем. Надо было, конечно, брать LSI-320-1, но адаптек был выбран из некоторых соображений, которые, правда, сейчас стали неактуальны (т.е., сейчас бы мы уже взяли LSI). Но что делать с 3120? Пинать саппорты? Чьи? Дело небыстрое, а планируемый апгрейд затягивается на непонятное время.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: NW65 на Intel7501BR2+ASR2130SLP = плохо!

Сообщение Аркадий Глазырин » 27 окт 2005, 13:52

Сергей Дубров писал(а):Как всегда вопрос: к кому стучаться, кого пинать? Тут неприятный момент в том, что с выходом ASR3120 у него были серьёзные проблемы с интеловскими серверными платами, которые они - интел и адаптек долго, кивая друг на друга - преодолевали. Летом, когда мы выбирался RAID-контроллер, нас заверили, что проблемы решены. Но очень пожоже, что не совсем. Надо было, конечно, брать LSI-320-1, но адаптек был выбран из некоторых соображений, которые, правда, сейчас стали неактуальны (т.е., сейчас бы мы уже взяли LSI). Но что делать с 3120? Пинать саппорты? Чьи? Дело небыстрое, а планируемый апгрейд затягивается на непонятное время.


Это кто Вам в Intel посоветовал так совмещать?
Кто Вас заверил?
Фамилию в ЛС пожалуйста.

Adaptec и LSI в одном сервере как минимум не рекомендуются.
Причина онкологий - иммунодефицит. Он вызывается загаром, нервотрёпкой, прививками от гриппа, генномодифицированными дрожжами, например "Саф-Момент", приёмом наркотиков, особенно героиновой группы. + Грибы и паразиты.
Аватара пользователя
Аркадий Глазырин
 
Сообщения: 2762
Зарегистрирован: 16 авг 2002, 09:09
Откуда: Екатеринбург

Re: NW65 на Intel7501BR2+ASR2130SLP = плохо!

Сообщение Сергей Дубров » 27 окт 2005, 15:04

Аркадий Глазырин писал(а):
Сергей Дубров писал(а):Как всегда вопрос: к кому стучаться, кого пинать? Тут неприятный момент в том, что с выходом ASR3120 у него были серьёзные проблемы с интеловскими серверными платами, которые они - интел и адаптек долго, кивая друг на друга - преодолевали. Летом, когда мы выбирался RAID-контроллер, нас заверили, что проблемы решены. Но очень пожоже, что не совсем. Надо было, конечно, брать LSI-320-1, но адаптек был выбран из некоторых соображений, которые, правда, сейчас стали неактуальны (т.е., сейчас бы мы уже взяли LSI). Но что делать с 3120? Пинать саппорты? Чьи? Дело небыстрое, а планируемый апгрейд затягивается на непонятное время.


Это кто Вам в Intel посоветовал так совмещать?
Кто Вас заверил?
Фамилию в ЛС пожалуйста.

Фамилию я вам не скажу, но человек этот в Интеле не последний. Кроме того, было официальное заявление от адаптека по вопросу плохой совместимости их контроллеров с интеловскими MB, в котором заверяли об успешном совместном преодолении всех проблем.

Аркадий Глазырин писал(а):Adaptec и LSI в одном сервере как минимум не рекомендуются.

Вот это как раз ерунда. Потому как встроенный адаптек в 7501BR2 наличествует (7899) и прекрасно с LSI, вставленным в эту же машину, сосуществует. Это я могу подтвердить личным многократным опытом.

P.S. Проблему я всё-таки решил, по крайней мере тест идёт уже второй проход. Подробности завтра, а то на служебный автобус опоздаю :lol:
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: NW65 на Intel7501BR2+ASR2130SLP = плохо!

Сообщение Dimerson » 27 окт 2005, 20:34

Маленько не в тему но я в данный момент также имею * с Adaptec 2130SLP [правда не под NetWare а под Линухами [конкретно истязаются SLES9 и Дебианы - stable & testing ]]. Ну с драйверами еще так себе.

А вот про саму железку у меня весьма противоречивые впечатления.
Это первая железка , виденная мной, Firmware которой падает в кору при входе в свой Биос через CTRL-A . В этот момент он имел 1 или более фоновых задач которые никак не отстреливались ни из Биоса [coredump фирмвари !!!! ] ни из RaidManager c CD - типа ничего не могу сделать ТК контроллер занят выполнением Background Tasks.

Также он странно себя ведет в ситуации когда допустим в зеркале отсох 1 жесткий диск и мы ставим совершенно чистый в замен [пусть и с тем же ID]. Он его без вопроса начинает Ребилдить - хотя бы спросил что-ли перед началом этой процедуры.

А от залипших Background Tasks избавился путем искусственного удаления 1 диск из зеркала и сохранения конфигурации . Все задачи естественно в /dev/null.

В общем хочется всем сказать - не гонитесь за дешевизной , а берите лучше бывшие Ami, Mylex а ныне LSI.
Аватара пользователя
Dimerson
 
Сообщения: 2966
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Сообщение Владимир Горяев » 27 окт 2005, 21:09

Глупый вопрос: - не корзина?
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

еще пару слов

Сообщение Павел Гарбар » 27 окт 2005, 21:37

попробуй поиграть с версиями SCSIHD.CDM
почему-то в SP4 было сказано,что могут быть проблемы и рекомендовали откатить на предыдущую версию, а в SP4a вроде как должны были усе это пофиксить.
Может тебе как раз наоборот самую последнюю поставить от 4а?
Ну или от SP2 :-)
Не знаю как в SP3, а в 4 для корзин новый модуль - bakplane.cdm....
Павел Гарбар
 
Сообщения: 710
Зарегистрирован: 05 июн 2002, 09:36
Откуда: Санкт-Петербург

Re: еще пару слов

Сообщение Владимир Горяев » 27 окт 2005, 22:06

Павел Гарбар писал(а):Не знаю как в SP3, а в 4 для корзин новый модуль - bakplane.cdm....
в SP3 вроде не было. Во всяком случае оверлей истальный не орпределял.
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск

Re: еще пару слов

Сообщение Сергей Дубров » 28 окт 2005, 08:43

Владимир Горяев писал(а):
Павел Гарбар писал(а):Не знаю как в SP3, а в 4 для корзин новый модуль - bakplane.cdm....
в SP3 вроде не было. Во всяком случае оверлей истальный не орпределял.

Есть в sp3 backplane.cdm, оверлейный инсталлятор его определил и в startup.ncf вписал.

Теперь на тему, как я победил адаптека - Паша Гарбар правильно про SCSIHD.CDM упомянул, т.к. с версией 3.03 (из sp4) есть проблемы. У меня стоИт 3.02 из sp3 - с ней всё в порядке.

Но не SCSIHD.CDM были причной зависонов на дисковом тесте, а драйвер RAID-а - aacraid.ham. Версия с адаптековского сидюка совпадет с версией на сайте адаптека - 4.20. С ней тест зависал минуты через две-три, причём тем быстрее, чем большее кол-во блоков указывалось для Read Size. Т.к. страйп я сделал по 64К, то тест для начала пустил с Read Size = 128 секторов (64к). Зависал примерно через три минуты. При увеличении до 256 или 512 секторов (максимум) - меньше минуты.

Ещё хуже себя повёл драйвер aacraid.ham v5.00, взятый с новеловского сайта девелоперов - его "рекорд" на Read Size = 512 секторов - 2 секунды!

Сейчас установлен драйвер версии 4.10 (взят тоже с Новела), с ним проблем с Read Size = 128 секторов нет совершенно, тест заканчивает уже 6-ой проход. Скорость чуть-чуть гуляет в районе 58-63 мбайт/сек. И интересное отличие этой версии драйвера от более новых 4.20 и 5.00 - при попытке выбрать в dsktest read size больше 128 секторов выскакивает окошко, что контроллер и драйвер не поддерживают обменов с такими размерами, но на ваш страх и риск тест может быть запущен с такими параметрами. Я пустил на пробу с read size = 512 секторов, подождал пару минут и остановил тест, сейчас гоняю на 128 секторах. С бОльшими размерами поиграю попозже.
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: еще пару слов

Сообщение Владимир Горяев » 30 окт 2005, 01:23

Сергей Дубров писал(а): Есть в sp3 backplane.cdm, оверлейный инсталлятор его определил и в startup.ncf вписал.
Мои извинения. Видимо тогда у меня был или другой дистр , или стенд :oops: (нет сейчас заметок под рукой).
Еще раз сорь.
Бардак автоматизировать невозможно!!!
_________________
Аватара пользователя
Владимир Горяев
 
Сообщения: 3473
Зарегистрирован: 05 июн 2002, 13:37
Откуда: Смоленск


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 27

cron