Страница 1 из 1

Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 28 апр 2012, 13:51
Михаил Цветаев
Пришло новое оборудование HP DL380G7. В списках на данный сервер присутствуют SuSE 10....11.
Памяти 32Gb + 8 ядер.

Ставиться на ура в дерево вписался. Так мне кажется, клиники ни какой не было. Но ...
1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

В работе имеется OES2sp2 и таких засад не было. У кого в работе OES11 имеется и всё ли хорошо?

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 28 апр 2012, 13:59
Ковалев Артем
Не понятно, что стоит на сервере? SUSE? Какая? NW? Какая? Напрямую или через vmware?

У меня ситуация с "жизнь замирает" бывает на серверах nw, стоящих в vmware. Правда, не на минуты, а на секунды.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 28 апр 2012, 14:11
Михаил Цветаев
Ковалев Артем писал(а):Не понятно, что стоит на сервере? SUSE? Какая? NW? Какая? Напрямую или через vmware?

У меня ситуация с "жизнь замирает" бывает на серверах nw, стоящих в vmware. Правда, не на минуты, а на секунды.

Ни какого VMWare и другой виртуализации. OES11 ставиться в прямую на железку. Дисковая подсистема родная от HP. Диски SAS 15к. RAID5 на 8 дисках.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 28 апр 2012, 15:07
Dimerson
ksoftirqd/3 это обработчик прерывания от железки в ядре (сеть или дисковый контроллер)

на совершенно том же железе OES2SP3 (лучше на SLES10SP4) ведет себя нормально ?

было бы интересно проверить поведение с воткнутым в PCI-Ex нового сервера гиговым езером и другим контроллером (каконить там LSI или 3ware или там адаптек SAS раидом ) ... хотя времени такие эксперименты знимаю изрядно.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 29 апр 2012, 09:02
Андрей Тр. aka RH
Михаил Цветаев писал(а):1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

Может, это связано с сетевой ? тогда объясним и п.1. Когда "жизнь замирает", с сервером связь не прерывается ? или при этом с другого тома все работает ( ну хотя бы iManager открывается ) ? Я собираюсь пробовать OES11, хотя до конца еще не определился .. либо пока что все же ставить OES2SP3.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 29 апр 2012, 18:08
Dimerson
поглядел свой домашний рутер. у него 4 потока (2 ядра) при этом 4 шт ksoftirqd/0- ksoftirqd/3
то есть они каждый для своего процессора
помню до этого был дома рутер на броадкомоском SOC, и так как я переписывал его фирмварь регулярно ему заглядывал под шкуру
там самый загруженный процесс всегда был ksoftirqd/0
если что полезно глядеть cat /proc/interrupts
и глядеть кто ест проц

у меня например
Код: Выделить всё
cat /proc/interrupts
           CPU0       CPU1       CPU2       CPU3
  0:        770        726        677        776   IO-APIC-edge      timer
  1:          1          1          1          0   IO-APIC-edge      i8042
  7:          0          0          0          0   IO-APIC-edge      parport0
  8:          1          0          0          0   IO-APIC-edge      rtc0
  9:          0          0          0          0   IO-APIC-fasteoi   acpi
12:          1          0          1          2   IO-APIC-edge      i8042
16:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb5
17:   10430341   10455102   10429957   10447467   IO-APIC-fasteoi   ath9k
18:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb4
19:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb3
21:    2850847    2845823    2850856    2845249   IO-APIC-fasteoi   eth1
23:          0          0          0          0   IO-APIC-fasteoi   ehci_hcd:usb1, uhci_hcd:usb2
44:  119384977  119370987  119389288  119379020   PCI-MSI-edge      eth0
45:    4298059    4292320    4294180    4292425   PCI-MSI-edge      ahci
46:         67         67         69         68   PCI-MSI-edge      snd_hda_intel
47:          0          0          0          0   PCI-MSI-edge      i915
NMI:      50266      50274      50059      50059   Non-maskable interrupts
LOC:   39948707   31957083   33408727   31102081   Local timer interrupts
SPU:          0          0          0          0   Spurious interrupts
PMI:      50266      50274      50059      50059   Performance monitoring interrupts
IWI:          0          0          0          0   IRQ work interrupts
RES:     539129     665322     532048     543479   Rescheduling interrupts
CAL:    4376059       1013    4384294        883   Function call interrupts
TLB:     313489     316597     317244     342379   TLB shootdowns
TRM:          0          0          0          0   Thermal event interrupts
THR:          0          0          0          0   Threshold APIC interrupts
MCE:          0          0          0          0   Machine check exceptions
MCP:       2907       2907       2907       2907   Machine check polls
ERR:          0
MIS:          0

из железок жрут
eth0 (гигабитный рилтек онбоард на прова)
ath9k - понятно что - wifi под управлением hostapd
eth1 (гигабитник внутри - но там поприличнее железо - марвелл таки)
ну и ahci контроллер диска

в общем гада надо выловить и пофиксить (заменить)
проблемы бывают разные - вдруг жрет какойнить usb там кривой . в общем ловить.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 29 апр 2012, 23:08
Михаил Цветаев
Андрей Тр. aka RH писал(а):
Михаил Цветаев писал(а):1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

Может, это связано с сетевой ? тогда объясним и п.1. Когда "жизнь замирает", с сервером связь не прерывается ? или при этом с другого тома все работает ( ну хотя бы iManager открывается ) ? Я собираюсь пробовать OES11, хотя до конца еще не определился .. либо пока что все же ставить OES2SP3.

Замирает всё что касаемо NSS. Если смотреть в монитор, то видно что в начале файловых операций на NSS в топ-лидерах по загрузке выдвигается ndsd. Если смотреть далее, то видишь - пропал в лидерах активности ndsd. И это сигнал, что у пользователей начались проблемы с файловым доступом.
Есть одна странность - если копировать файл фаром и появился облом, и если сказать продолжить, то в идеале и по науке должен начать фар копировать файл сначала. Ан, нет начинает копировать с того же места и при этом указывает безумную скорость копирования.

SSH конектиться без проблем. VNC работает. Именно в те моменты, когда появляются проблемы. Т.е. другие сервисы как бы работают без проблем.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 30 апр 2012, 08:13
Dimerson
в логах все чисто ? в смыле ругани от демонов итд ?

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 30 апр 2012, 22:35
skoltogyan
а если с консоли сервера из mc копировать в приделах NSS - подобное замирание получаете ?

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 01 май 2012, 12:56
capricious
надеюсь на 380g7 последнее firmware поставили? если нет бегом ставить, там критическое обновление для биоса .

oes 11 работает на ура на ml100 g7

на 380g7 я все же влепел oes2sp3 64 bit, так как непонятно как бы повел себя Linuxshield 1.7

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 01 май 2012, 21:57
Михаил Цветаев
Dimerson писал(а):в логах все чисто ? в смыле ругани от демонов итд ?


Вот бы знать на чём акцентировать внимание и где смотреть. Если /var/opt/novell/log/oes/ncp, то ничего криминального, вообще. Или где еще? В /var/opt/nss только dat.

Прфиксил OES11 все рекомендованные обновления и для SuSE так и для OES. Проблема осталась. Но одно ушло это стоящие с 10-15% в утилизации сервисы ksoftirqd/xx. Стало тихо и спокойно. Ничего не делается - ни какой активности в top.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 01 май 2012, 23:19
Михаил Цветаев
skoltogyan писал(а):а если с консоли сервера из mc копировать в приделах NSS - подобное замирание получаете ?


Берем MC и копируем с любого раздела linux на том. Проблема - есть.
Берем MC и копируем с любого раздела linux на раздел Linux. Проблем - нет.


Начал по этому поводу честь репу. Отличие - это OES2 которые имеются в производстве - это я не использовал никогда ни evms ни lvm. В OES11 появилось такое благо как разбиение/использование под тома lvm для томов NSS. И без лишнего гемора экономить место на дисковых массивах не выделяя отдельно диски. Да evms умер этак 6 лет назад, но так и не использовал я его никогда. А тут все как-то отработало гладко и красиво сделал том NSS - радовался.
В конфиге по lvm включил логирование. Странно не создаётся! Будем искать. Может и в другом причина ступора для томов NSS.

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 02 май 2012, 05:33
Dimerson
вышли вот патчи для оес11 ... может полегчает ?

Re: Пробный старт OES11. Есть вопросы

СообщениеДобавлено: 02 май 2012, 10:57
Михаил Цветаев
Dimerson писал(а):вышли вот патчи для оес11 ... может полегчает ?


Обновлялся 01.05.2012. Всё что было рекомендовано установил.

О результатах уже доложил. Может чего не заметил?


P.S. Имеется ли у кого-то OES11 в работе и имеются ли проблемы?