OES11 + ISCSI

Обсуждение технических вопросов по продуктам Novell под Linux, а также *nix систем

OES11 + ISCSI

Сообщение Сумин Евгений » 28 май 2015, 17:02

Здравствуйте!
Использую подключение дисков по ISCSI. После того, как перешел с NW6.5 на OES11 столкнулся с такой проблемой:
- в случае отвала диска и последующего его восстановления примонтировать том (NCP) нельзя. При этом попытка запустить nssmu и зайти в раздел пулов или томов приводит к зависанию nssmu. Убить такой процесс в самом линуксе не получается, равно как и "по хорошему" перезагрузить / выключить сервер. Восстановить работу отвалившегося диска возможно только путем перезагрузки. Сам сервер (остальные его ресурсы) при этом работают нормально.

Подскажите куда копать:
- как заново примонтировать ISCSI диск (NSS),
- как вывести сервак из такого положения (заставить хотябы корректно лечь..)?
Сумин Евгений
 
Сообщения: 153
Зарегистрирован: 06 июл 2002, 15:53
Откуда: Киев

Re: OES11 + ISCSI

Сообщение Ковалев Артем » 28 май 2015, 17:56

Что сделали мы.
Все iSCSI диски настраиваются в режиме "auto". То есть сервер их пингует и когда они доступны - цепляет именно как устройства. Дальше написан скрипт, который проверяет наличие каталога внутри диска и при его отсутствии командами nss /poolactivate и nss /volumeactivate цепляет том обратно.
Еще могу посоветовать штатный скриптик rescan-scsi-bus.sh, он позволяет пересканировать шину и найти добавившиеся устройства.
Правда, иногда он зависает и спасает тогда только перезагрузка сервера.
берем картину мироздания и тупо смотрим - что к чему...
Аватара пользователя
Ковалев Артем
 
Сообщения: 924
Зарегистрирован: 29 мар 2004, 11:44
Откуда: Москва

Re: OES11 + ISCSI

Сообщение Сумин Евгений » 29 май 2015, 12:06

Дело в том что у меня как раз nss /poolactivate=[том] приводит к зависанию выполнения. Сами диски в линуксе я вижу, а вот дальше... Фактически висит сам NCP-сервер как я понимаю в какой-то блокировке, при этом все его остальные ф-ции продолжают выполняться...
Сумин Евгений
 
Сообщения: 153
Зарегистрирован: 06 июл 2002, 15:53
Откуда: Киев

Re: OES11 + ISCSI

Сообщение Ковалев Артем » 29 май 2015, 12:14

SUSE Linux Enterprise Server 11 (x86_64)
VERSION = 11
PATCHLEVEL = 2
LSB_VERSION="core-2.0-noarch:core-3.2-noarch:core-4.0-noarch:core-2.0-x86_64:core-3.2-x86_64:core-4.0-x86_64"
Novell Open Enterprise Server 11 (x86_64)
VERSION = 11.1
PATCHLEVEL = 1

На такой конфигурации вашей проблемы с iSCSI у нас нет. Хотя это бакапный сервер, к которому по iSCSI прицеплено чуть меньше, чем дофига, дисков с разных NAS.
Все патчи на нём стоят, он up-to-date.
Стоит версия open-iscsi-2.0.873-0.6.3.1
берем картину мироздания и тупо смотрим - что к чему...
Аватара пользователя
Ковалев Артем
 
Сообщения: 924
Зарегистрирован: 29 мар 2004, 11:44
Откуда: Москва

Re: OES11 + ISCSI

Сообщение Сумин Евгений » 29 май 2015, 13:31

У меня конфигурация такая же...

Вот еще обратил внимание, что в процессах весит один "nss" с состоянием "неприрываемый" и действительно убить его нельзя ни из системного монитора, ни kill-ом.

Может кто знает - что это за состояние такое у процесса? Можно ли его как-то убить при этом?
Сумин Евгений
 
Сообщения: 153
Зарегистрирован: 06 июл 2002, 15:53
Откуда: Киев

Re: OES11 + ISCSI

Сообщение URRY » 29 май 2015, 16:43

а multipath у тебя запущен ?
URRY
 
Сообщения: 202
Зарегистрирован: 13 май 2012, 22:40

Re: OES11 + ISCSI

Сообщение Сумин Евгений » 29 май 2015, 17:17

Нет.
Сумин Евгений
 
Сообщения: 153
Зарегистрирован: 06 июл 2002, 15:53
Откуда: Киев

Re: OES11 + ISCSI

Сообщение Иван Левшин aka Ivan L. » 04 июн 2015, 13:07

iSCSI Initiator умеет сам автоматом цеплять устройства с iSCSI Target. Тома перемонтировать надо так, как написал Артем - для NSS это WAD (Working As Designed) и меняться это поведение не будет. Наблюдаемые зависания же лечатся обновлением OES11, NSS регулярно патчится. У меня под наблюдением система аналогичной конфигурации - описываемой проблемы не наблюдается, после перемонтирования устройства тома активируются совершенно спокойно что скриптом, что через nssmu.
Состояние - вероятно, Zombie (нет ли там в выводе top буковки Z рядом с висящим процессом?). Убить такое нельзя, только ребут.
Иван Левшин aka Ivan L.
 
Сообщения: 2579
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.


Вернуться в *nix

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2

cron