Мониторинг дисковой подсистемы в OES

**Доменика** » 18 ноя 2014, 12:19

Мониторинг дисковой подсистемы в OES на предмет как увидеть или точнее узнать, что один из дисков вышел из строя.

Ранее на NetWare при появление проблем с RAID-массивом на консоле появлялось сообщение о деградации рейда, как минимум на таких контроллерах как LSI и Adaptec - точно было.
В работе HP DL370G6 на нем OES2sp3, только визуальный контакт выявил проблему с рейдом при рестарте сервера.
Есть ли решения мониторинга? Кто и как выходит из такой ситуации.

**Ковалев Артем** » 18 ноя 2014, 15:00

Доменика писал(а):Мониторинг дисковой подсистемы в OES на предмет как увидеть или точнее узнать, что один из дисков вышел из строя.

Ранее на NetWare при появление проблем с RAID-массивом на консоле появлялось сообщение о деградации рейда, как минимум на таких контроллерах как LSI и Adaptec - точно было.
В работе HP DL370G6 на нем OES2sp3, только визуальный контакт выявил проблему с рейдом при рестарте сервера.
Есть ли решения мониторинга? Кто и как выходит из такой ситуации.

В серверах HP есть iLO, оно умеет рассылать snmp-сообщения о приключившейся беде. Надо поднять либо HP SIM, либо любую другую систему (могу посоветовать nagios), способную принимать snmp-trapы и направить их туда. А далее система мониторинга может рисовать картинку, слать почту или смс - как настроите.

Любой SNMP-мониторинг (тот же нагиос, согласен с Артемом). Кроме того, у Novell есть Sentinel Log Manager - официально бесплатен с лицензией в 250 EPS (Events Per Second). Там много мониторинга (и для NSS, и для ОС), отчеты.

**skoltogyan** » 19 ноя 2014, 22:06

как вариант
- смотреть название рейда
- в инете зайти на сайт производителя.
- у производителя кроме драйверов идут , обычно, и утилиты администрирования рейда под разные ос.
бывают и графические и текстовые. выбирать в качестве OS тот sles, кторый у вс в oes

**Доменика** » 20 ноя 2014, 18:20

Ковалев Артем писал(а):
Доменика писал(а):Мониторинг дисковой подсистемы в OES на предмет как увидеть или точнее узнать, что один из дисков вышел из строя.

Ранее на NetWare при появление проблем с RAID-массивом на консоле появлялось сообщение о деградации рейда, как минимум на таких контроллерах как LSI и Adaptec - точно было.
В работе HP DL370G6 на нем OES2sp3, только визуальный контакт выявил проблему с рейдом при рестарте сервера.
Есть ли решения мониторинга? Кто и как выходит из такой ситуации.

В серверах HP есть iLO, оно умеет рассылать snmp-сообщения о приключившейся беде. Надо поднять либо HP SIM, либо любую другую систему (могу посоветовать nagios), способную принимать snmp-trapы и направить их туда. А далее система мониторинга может рисовать картинку, слать почту или смс - как настроите.

То что iLO - вещь нужная, слов нет - мечта админа. Но железка стоит у клиента, у которого ни человека нет ни даже статики IP, чтоб подключиться. Считается что Инет и так будет, а сервисы на хостинг.
К тому же и контроллер оказался молчаливым и "выход" одного диска ни кто не заметил. У нас с ними договор в котором ежеквартально должны делать диагностику, вот и выяснилось при личной встрече с сервером.

Не помню, когда но было обсуждение о такой задаче как получить информацию от дискового котроллера в Linux о его состоянии по почте, т.е. идея красивая, чтоб либо по событию отрабатывал скрипт, либо ежедневный опрос котроллера и сообщение по почте. В винде для Adaptec точнее есть такое.
Вот и была попытка - может кто-то решил или видел решение.

**Dimerson** » 21 ноя 2014, 09:58

Ну если очень хочется то пускаем по крону megacli/storcli etc (сборки в виде ELF x86/x86-64 есть всегда как и NLM были ранее) парсим вывод если OPTIMAL -> DEGRADED то шлем СМС e-mail поднимаем королевскую рать итд итп.

Сирены на раид контрллере сейчас нет совсем ? на старых добрых lsi scsi вой был слышен всей бухгалтерии если раид охромел на 1 диск к примеру.

**Ковалев Артем** » 21 ноя 2014, 11:14

Доменика писал(а):.

Так поставьте nagios (или cacti) на тот же сервер, он будет от iLo принимать трапы и по почте через инет слать вам весточки.

**Доменика** » 24 ноя 2014, 21:39

Dimerson писал(а):Ну если очень хочется то пускаем по крону megacli/storcli etc (сборки в виде ELF x86/x86-64 есть всегда как и NLM были ранее) парсим вывод если OPTIMAL -> DEGRADED то шлем СМС e-mail поднимаем королевскую рать итд итп.

Сирены на раид контрллере сейчас нет совсем ? на старых добрых lsi scsi вой был слышен всей бухгалтерии если раид охромел на 1 диск к примеру.

Уже читаю доку от LSI, если заработает, то это что доктор прописал.

Мониторинг дисковой подсистемы в OES

Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Re: Мониторинг дисковой подсистемы в OES

Кто сейчас на конференции