Надёжность NSS. Снапшоты. Перспективы

Обсуждение технических вопросов по продуктам Novell

Надёжность NSS. Снапшоты. Перспективы

Сообщение Константин Ошмян » 02 июн 2010, 16:03

Ввиду проблем с бэкапом файловой системы на NetWare возник резонный вопрос об альтернативах. После чтения документации было решено опробовать снапшоты средствами операционки. На тестовом сервере эксперименты прошли успешно: по CRON-у по ночам вызывался скрипт, который делал ротацию старых снапшотов и создавал новый. Впечатления от технологии были самые приятные.

Однако под реальной нагрузкой (терабайтный кластерный том, заполненный на треть, плюс ещё треть занята непропурженными файлами) мы продержались неделю: сервер начал выдавать на консоли сообщения о нехватке памяти (при том, что в статистике отображалось, что больше всего памяти отъедает модуль NSS - около 100 МБ, остальные - по мелочи, а в сервере полтора гига), стал подтормаживать, а после перезагрузки не смог активировать пул (который несколько минут назад без проблем перешёл на другую ноду кластера). Причём сервер не выдавал ошибок, а просто при активировании пула (которое обычно проходило за пару секунд) тихо зависал. Наверное, он при этом что-то делал, но внешне это никак не проявлялось: консоль недоступна, на экране логгера - сообщение о начале активации пула, между консолями переключаться можно, в мониторе - нагрузка процессора почти нулевая, при попытке как-то "потрогать" тома или пулы (посмотреть в MONITOR-е список томов, запустить NSSMU, ввести команду VOLUMES или NSS /POOLS с дополнительной консоли и т.п.) соответствующий экран тоже просто зависал. После нескольких перезагрузок в попытках понять, что же происходит, наконец-то получили хоть какое-то сообщение об ошибке:
Код: Выделить всё
Activating pool "VOL1"...
  ** Pool layout v43.02
  ** Processing journal
     ** 1 uncommitted transaction(s)
!!!  Error allocating a free snapshot block.
!!!  Warning All snapshots on pool VOL1 are being deleted.
     ** 78 Redo(s), 1 Undo(s), 1 Logical Undo(s)
  ** System verification completed
  ** Loading system objects
  ** Processing volume purge log
  ** ...
  ** Processing pool purge log
  ** .
Однако пул так и не активировался, причём на попытку его проверить/починить (NSS /poolverify или NSS /poolrebuild) выдавалось страшно "информативное" сообщение:
Код: Выделить всё
     Could not change pool VOL1 to the ACTIVE state.
Status=20810 zfsPool.c[1872].
Use 'NSS /ErrorCode=20810' to obtain more information.
В свою очередь, в ответ на эту команду говорилось:
Код: Выделить всё
Error=zERR_VOLUME_SHOULD_NOT_ACTIVATE
На новелловском сайте нашёл упоминания об ошибке "Error allocating a free snapshot block" лишь в случаях нехватки места в пуле и ошибке в модуле MM.NLM. И то, и другое - не мой случай: места свободного было навалом (даже с учётом непропурженных файлов), патчи стоят распоследние - NW65sp8, N65NSS8b и даже MM65SP8A.

Кончилось тем, что удалось загрузить сервер с помощью не-очень-документированного ключика /NOSNAP и только после этого от-rebuild-ить пул (потеряв несколько часов, пару файлов и все снапшоты).
После этого снова включать снапшоты как-то боязно.

Народ, поделитесь, пожалуйста, мнениями:

1) Использует ли кто-нибудь упомянутые снапшоты средствами NSS? На какой платформе (NetWare/Linux)? Какова у вас статистика (как часто делаются снапшоты, сколько их хранится, давно ли живёт у вас эта технология, были ли проблемы)?

2) Поскольку NetWare дальше не развивается - насколько обоснованны надежды, что реализация NSS в Linux-е более толковая? С одной стороны - понятно, что это та же NSS, портированная с NetWare. С другой стороны - реализация всё-таки отличается (например, те же снапшоты делаются по-другому). С третьей стороны - не все возможности, которые были в NetWare, пока ещё реализованы в Linux-е (кластерные тома, например, снапшотить пока нельзя). С четвёртой стороны - вроде бы, Linux-реализация худо-бедно, но развивается (чего не скажешь о NetWare).

3) А может, плюнуть на это дело и перейти в принципе на другую платформу? Всякие там NAS-ы, тот же NetApp у нас есть и производит приятное впечатление...
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: Надёжность NSS. Снапшоты. Перспективы

Сообщение Константин Ошмян » 11 июн 2010, 11:33

Что-то никто не отвечает... Видимо, то ли никто не пользуется, то ли вопросы были слишком философскими. Попробую конкретизировать.

1) Народ, использует ли кто-нибудь NSS на платформе Linux? Как впечатления?

2) Пользуетесь ли NSS-снапшотами? Как впечатления?

Заранее спасибо.
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: Надёжность NSS. Снапшоты. Перспективы

Сообщение Ковалев Артем » 11 июн 2010, 11:52

Константин Ошмян писал(а):Что-то никто не отвечает... Видимо, то ли никто не пользуется, то ли вопросы были слишком философскими. Попробую конкретизировать.

1) Народ, использует ли кто-нибудь NSS на платформе Linux? Как впечатления?

Я! Работает. По скорости не сильно уступает Netware. В принципе, использовать можно (в отсутсвии гербовой пишут на простой). Испортить NSS окончательно Novell пока не смог.

2) Пользуетесь ли NSS-снапшотами? Как впечатления?

Нет. А что это? :idea:
берем картину мироздания и тупо смотрим - что к чему...
Аватара пользователя
Ковалев Артем
 
Сообщения: 924
Зарегистрирован: 29 мар 2004, 11:44
Откуда: Москва

Re: Надёжность NSS. Снапшоты. Перспективы

Сообщение Константин Ошмян » 11 июн 2010, 12:16

Спасибо, Артём!
Ковалев Артем писал(а):
Константин Ошмян писал(а):1) Народ, использует ли кто-нибудь NSS на платформе Linux? Как впечатления?
Я! Работает. По скорости не сильно уступает Netware. В принципе, использовать можно (в отсутствие гербовой пишут на простой). Испортить NSS окончательно Novell пока не смог.
Т.е. всё-таки какие-то нарекания есть (раз хотелось "гербовой")? Какие именно - скорость (которая не сильно, но всё же "уступает")? Или что-то ещё? Какие объёмы, нагрузка? Расскажите поподробнее, пожалуйста!
Ковалев Артем писал(а):
2) Пользуетесь ли NSS-снапшотами? Как впечатления?
Нет. А что это? :idea:
Я давал ссылку. В теории - очень удобная вещь, позволяет сделать "моментальный снимок" пула NSS и держать его какое-то время. Может использоваться в сочетании с обычным бэкапом (сделали снапшот - и далее спокойно копируем данные с этого снапшота, не опасаясь, что какие-то файлы будут заблокированы или поменяются в процессе бэкапа), а может - даже вместо традиционного бэкапа (если место позволяет - сделали снапшот, и при необходимости сможем вернуть данные с этого снапшота). В отличие от традиционного бэкапа (когда данные копируются на отдельный носитель), не подстраховывает от сбоя самого дискового устройства и файловой системы на нём (поскольку реально данные продолжают оставаться на месте).
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: Надёжность NSS. Снапшоты. Перспективы

Сообщение Ковалев Артем » 11 июн 2010, 12:31

Константин Ошмян писал(а):Спасибо, Артём!
Ковалев Артем писал(а):
Константин Ошмян писал(а):1) Народ, использует ли кто-нибудь NSS на платформе Linux? Как впечатления?
Я! Работает. По скорости не сильно уступает Netware. В принципе, использовать можно (в отсутствие гербовой пишут на простой). Испортить NSS окончательно Novell пока не смог.
Т.е. всё-таки какие-то нарекания есть (раз хотелось "гербовой")? Какие именно - скорость (которая не сильно, но всё же "уступает")? Или что-то ещё? Какие объёмы, нагрузка? Расскажите поподробнее, пожалуйста!

Объёмы - тома по 500-1500 Гиг, до 300 юзеров на томе. Машинка - HP Proliant DL380 G4 и G6. Из нареканий - система сильно более прожорлива к памяти. На NW такие тома с такой нагрузкой за милую душу живут на машинке с 512 Мег ОЗУ, для OES 2 гига подавай. Скорость вполне, просадок нет, но на более "толстом" железе (больше памяти, более новые контроллеры). Сравнить на равно железе возможности нет. Использовать - можно, хотя я бы по прежнему рекомендовал NW.

Константин Ошмян писал(а):Я давал ссылку. В теории - очень удобная вещь, позволяет сделать "моментальный снимок" пула NSS и держать его какое-то время. Может использоваться в сочетании с обычным бэкапом (сделали снапшот - и далее спокойно копируем данные с этого снапшота, не опасаясь, что какие-то файлы будут заблокированы или поменяются в процессе бэкапа), а может - даже вместо традиционного бэкапа (если место позволяет - сделали снапшот, и при необходимости сможем вернуть данные с этого снапшота). В отличие от традиционного бэкапа (когда данные копируются на отдельный носитель), не подстраховывает от сбоя самого дискового устройства и файловой системы на нём (поскольку реально данные продолжают оставаться на месте).

Это я читал, просто кроме того, ничего больше никогда ни от кого (включая инженеров новелла, навроде Грекова :D ) - не слышал.
берем картину мироздания и тупо смотрим - что к чему...
Аватара пользователя
Ковалев Артем
 
Сообщения: 924
Зарегистрирован: 29 мар 2004, 11:44
Откуда: Москва

Re: Надёжность NSS. Снапшоты. Перспективы

Сообщение Sergant » 11 июн 2010, 13:58

Впечатления по nss на Linux: на одном из серверов NW65SP8 больше 3-х месяцев назад поменял на OES2 SP2 Linux. Сервер Proliant ML370 G3 с 4 GB памяти, структура nss-томов не изменилась. Пользователей сервера не много - около 35, данные - периодическое цветное издание с высокой пиковой нагрузкой в конце каждого номера. В результате пользователи разницы не заметили.
Sergant
 
Сообщения: 330
Зарегистрирован: 22 сен 2006, 14:41
Откуда: Москва


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4