Ситуация 1. Сервер IBM x Series 3650, пара 4Gb FC-адаптеров IBM QLE2460 (OEM QLogic QLA2432), внешний дисковый массив IBM DS6800, подключенный через два FC-свитча. Для multipathing-а используется IBM-овский драйвер SDD (позволяющий делать распределение нагрузки по разным путям). Аппаратная конфигурация эксплуатировалась несколько лет с NetWare 5.1(sp6-sp8), затем - на NetWare 6.5sp8 (в состав которого входит драйвер QL2X00.HAM v7.00a). Тестирование мультипасинга методом выдёргивания кабеля из сервера проходит отлично. Из дискового массива кабели не дёргали (а напрасно, как оказалось), т.к. на нём работает ещё несколько критичных систем.
А вот в реальной жизни - сгорел GBIC на свитче, причём тот, в который был воткнут провод от дискового массива. Следствие: выход из строя GBIC-а был обработан корректно (соответствующие пути отключились), а вот после замены джибика вместо восстановления путей получили ABEND, причём довольно неприятный - с порчей данных на томе.
Ситуация 2. Аналогичной конфигурации сервер, но внешний массив - NetApp FAS2040. Поскольку драйвер SDD работает только с IBM-овским "железом", то с нетапом он работать отказывается. Пробуем использовать штатный новелловский мультпасинг, те же тесты с выдёргиванием кабеля из сервера проходят на ура. Пока не запустили в эксплуатацию, пробуем усложнить эксперимент: кабель от FC-адаптера до свитча оставляем целым, но обрубаем соединение дальше (например, играясь с зонами на FC-свитче, либо просто переводя FAS на другой интерфейс). Результат: на сервере NetWare 6.5sp8 получаем стабильный ABEND (все остальные подключенные тестовые серверы - винды и солярисы - продолжают работать совершенно без проблем).
По итогам разбирательства (был открыт инцидент в Novell, высланы конфиги, логи и коредампы) было выяснено следующее (цитирую инженера техподдержки Novell) :
Мораль: взять с сайта QLogic драйвер версии 7.00d (проверено, с ней таких неприятностей нет) и обновить драйвер, не дожидаясь неприятностей.Jay Don Gray писал(а):The server abends in the NetWareAlert routine while attempting to parse an error message that was sent to us by the QL2x00.HAM driver. The message appears to be the text "Port Timeout". Some how our pointer to the message is now null which causes the abend. It appears that a non-null pointer should have been passed in, but would have still been invalid.
I talked with development who indicated that there is a newer QL2X00.HAM driver that will address this issue.
Кстати, на сайтах замечательных производителей ещё небольшая засада (как будто бы я не проверял версии драйверов первым делом!). Сайт IBM после нескольких телодвижений просто отсылает на сайт QLogic-а - дескать, идите там в раздел "OEM", там найдёте. А на сайте QLogic-а, если идти этим путём (закладка "Downloads", там "OEM Models" -> "IBM", затем "IBM System x" -> Fibre Channel Host Bus Adapters"), то для NetWare есть только драйвер версии 6.90o.
На самом деле надо идти другим путём: на закладке "Downloads" сразу идём вниз, в последней секции выбираем "by Operating Systems", затем - последовательно "Fiber Channel Adapters" -> "NetWare" -> "NetWare 6.5", и уже тогда получаем искомое - драйвер 7.00d.