Ковалев Артем писал(а):Доменика писал(а):Мониторинг дисковой подсистемы в OES на предмет как увидеть или точнее узнать, что один из дисков вышел из строя.
Ранее на NetWare при появление проблем с RAID-массивом на консоле появлялось сообщение о деградации рейда, как минимум на таких контроллерах как LSI и Adaptec - точно было.
В работе HP DL370G6 на нем OES2sp3, только визуальный контакт выявил проблему с рейдом при рестарте сервера.
Есть ли решения мониторинга? Кто и как выходит из такой ситуации.
В серверах HP есть iLO, оно умеет рассылать snmp-сообщения о приключившейся беде. Надо поднять либо HP SIM, либо любую другую систему (могу посоветовать nagios), способную принимать snmp-trapы и направить их туда. А далее система мониторинга может рисовать картинку, слать почту или смс - как настроите.
То что iLO - вещь нужная, слов нет - мечта админа. Но железка стоит у клиента, у которого ни человека нет ни даже статики IP, чтоб подключиться. Считается что Инет и так будет, а сервисы на хостинг.
К тому же и контроллер оказался молчаливым и "выход" одного диска ни кто не заметил. У нас с ними договор в котором ежеквартально должны делать диагностику, вот и выяснилось при личной встрече с сервером.
Не помню, когда но было обсуждение о такой задаче как получить информацию от дискового котроллера в Linux о его состоянии по почте, т.е. идея красивая, чтоб либо по событию отрабатывал скрипт, либо ежедневный опрос котроллера и сообщение по почте. В винде для Adaptec точнее есть такое.
Вот и была попытка - может кто-то решил или видел решение.