Пробный старт OES11. Есть вопросы

Обсуждение технических вопросов по продуктам Novell под Linux, а также *nix систем

Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 28 апр 2012, 13:51

Пришло новое оборудование HP DL380G7. В списках на данный сервер присутствуют SuSE 10....11.
Памяти 32Gb + 8 ядер.

Ставиться на ура в дерево вписался. Так мне кажется, клиники ни какой не было. Но ...
1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

В работе имеется OES2sp2 и таких засад не было. У кого в работе OES11 имеется и всё ли хорошо?
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31

Re: Пробный старт OES11. Есть вопросы

Сообщение Ковалев Артем » 28 апр 2012, 13:59

Не понятно, что стоит на сервере? SUSE? Какая? NW? Какая? Напрямую или через vmware?

У меня ситуация с "жизнь замирает" бывает на серверах nw, стоящих в vmware. Правда, не на минуты, а на секунды.
берем картину мироздания и тупо смотрим - что к чему...
Аватара пользователя
Ковалев Артем
 
Сообщения: 924
Зарегистрирован: 29 мар 2004, 11:44
Откуда: Москва

Re: Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 28 апр 2012, 14:11

Ковалев Артем писал(а):Не понятно, что стоит на сервере? SUSE? Какая? NW? Какая? Напрямую или через vmware?

У меня ситуация с "жизнь замирает" бывает на серверах nw, стоящих в vmware. Правда, не на минуты, а на секунды.

Ни какого VMWare и другой виртуализации. OES11 ставиться в прямую на железку. Дисковая подсистема родная от HP. Диски SAS 15к. RAID5 на 8 дисках.
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31

Re: Пробный старт OES11. Есть вопросы

Сообщение Dimerson » 28 апр 2012, 15:07

ksoftirqd/3 это обработчик прерывания от железки в ядре (сеть или дисковый контроллер)

на совершенно том же железе OES2SP3 (лучше на SLES10SP4) ведет себя нормально ?

было бы интересно проверить поведение с воткнутым в PCI-Ex нового сервера гиговым езером и другим контроллером (каконить там LSI или 3ware или там адаптек SAS раидом ) ... хотя времени такие эксперименты знимаю изрядно.
Аватара пользователя
Dimerson
 
Сообщения: 2959
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Пробный старт OES11. Есть вопросы

Сообщение Андрей Тр. aka RH » 29 апр 2012, 09:02

Михаил Цветаев писал(а):1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

Может, это связано с сетевой ? тогда объясним и п.1. Когда "жизнь замирает", с сервером связь не прерывается ? или при этом с другого тома все работает ( ну хотя бы iManager открывается ) ? Я собираюсь пробовать OES11, хотя до конца еще не определился .. либо пока что все же ставить OES2SP3.
Даешь отдельный раздел по ZENworks ... :bad-words: .. и печати !
Аватара пользователя
Андрей Тр. aka RH
 
Сообщения: 3937
Зарегистрирован: 18 июн 2002, 11:27

Re: Пробный старт OES11. Есть вопросы

Сообщение Dimerson » 29 апр 2012, 18:08

поглядел свой домашний рутер. у него 4 потока (2 ядра) при этом 4 шт ksoftirqd/0- ksoftirqd/3
то есть они каждый для своего процессора
помню до этого был дома рутер на броадкомоском SOC, и так как я переписывал его фирмварь регулярно ему заглядывал под шкуру
там самый загруженный процесс всегда был ksoftirqd/0
если что полезно глядеть cat /proc/interrupts
и глядеть кто ест проц

у меня например
Код: Выделить всё
cat /proc/interrupts
           CPU0       CPU1       CPU2       CPU3
  0:        770        726        677        776   IO-APIC-edge      timer
  1:          1          1          1          0   IO-APIC-edge      i8042
  7:          0          0          0          0   IO-APIC-edge      parport0
  8:          1          0          0          0   IO-APIC-edge      rtc0
  9:          0          0          0          0   IO-APIC-fasteoi   acpi
12:          1          0          1          2   IO-APIC-edge      i8042
16:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb5
17:   10430341   10455102   10429957   10447467   IO-APIC-fasteoi   ath9k
18:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb4
19:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb3
21:    2850847    2845823    2850856    2845249   IO-APIC-fasteoi   eth1
23:          0          0          0          0   IO-APIC-fasteoi   ehci_hcd:usb1, uhci_hcd:usb2
44:  119384977  119370987  119389288  119379020   PCI-MSI-edge      eth0
45:    4298059    4292320    4294180    4292425   PCI-MSI-edge      ahci
46:         67         67         69         68   PCI-MSI-edge      snd_hda_intel
47:          0          0          0          0   PCI-MSI-edge      i915
NMI:      50266      50274      50059      50059   Non-maskable interrupts
LOC:   39948707   31957083   33408727   31102081   Local timer interrupts
SPU:          0          0          0          0   Spurious interrupts
PMI:      50266      50274      50059      50059   Performance monitoring interrupts
IWI:          0          0          0          0   IRQ work interrupts
RES:     539129     665322     532048     543479   Rescheduling interrupts
CAL:    4376059       1013    4384294        883   Function call interrupts
TLB:     313489     316597     317244     342379   TLB shootdowns
TRM:          0          0          0          0   Thermal event interrupts
THR:          0          0          0          0   Threshold APIC interrupts
MCE:          0          0          0          0   Machine check exceptions
MCP:       2907       2907       2907       2907   Machine check polls
ERR:          0
MIS:          0

из железок жрут
eth0 (гигабитный рилтек онбоард на прова)
ath9k - понятно что - wifi под управлением hostapd
eth1 (гигабитник внутри - но там поприличнее железо - марвелл таки)
ну и ahci контроллер диска

в общем гада надо выловить и пофиксить (заменить)
проблемы бывают разные - вдруг жрет какойнить usb там кривой . в общем ловить.
Аватара пользователя
Dimerson
 
Сообщения: 2959
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 29 апр 2012, 23:08

Андрей Тр. aka RH писал(а):
Михаил Цветаев писал(а):1. Систематически на серверах NetWare в свойствах в dsrepair на сервер на OES11 пишет что Down. Лечиться. Но не приятно. И не смертельно.
2. Но вот вторая проблема с NSS напрягла не по детски. А именно произвольно, при копировании или считывании информации с тома на OES11 жизнь замирает. Т.е. копирование останавливается и ждем.....с. И много ждем...с. несколько минут. Апосля все продолжается. И повторяется. Бывает и хуже - пишет том не существует.

При этом в мониторе тишь. Ничего не шкалит. Т.е. наибольшая загрузка 10-15% на странном сервисе ksoftirqd/3 и причём всегда. Вместо 3 может быть и другие числа.

Может, это связано с сетевой ? тогда объясним и п.1. Когда "жизнь замирает", с сервером связь не прерывается ? или при этом с другого тома все работает ( ну хотя бы iManager открывается ) ? Я собираюсь пробовать OES11, хотя до конца еще не определился .. либо пока что все же ставить OES2SP3.

Замирает всё что касаемо NSS. Если смотреть в монитор, то видно что в начале файловых операций на NSS в топ-лидерах по загрузке выдвигается ndsd. Если смотреть далее, то видишь - пропал в лидерах активности ndsd. И это сигнал, что у пользователей начались проблемы с файловым доступом.
Есть одна странность - если копировать файл фаром и появился облом, и если сказать продолжить, то в идеале и по науке должен начать фар копировать файл сначала. Ан, нет начинает копировать с того же места и при этом указывает безумную скорость копирования.

SSH конектиться без проблем. VNC работает. Именно в те моменты, когда появляются проблемы. Т.е. другие сервисы как бы работают без проблем.
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31

Re: Пробный старт OES11. Есть вопросы

Сообщение Dimerson » 30 апр 2012, 08:13

в логах все чисто ? в смыле ругани от демонов итд ?
Аватара пользователя
Dimerson
 
Сообщения: 2959
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Пробный старт OES11. Есть вопросы

Сообщение skoltogyan » 30 апр 2012, 22:35

а если с консоли сервера из mc копировать в приделах NSS - подобное замирание получаете ?
skoltogyan
 
Сообщения: 2043
Зарегистрирован: 12 июл 2002, 19:39
Откуда: Украина, Донецк

Re: Пробный старт OES11. Есть вопросы

Сообщение capricious » 01 май 2012, 12:56

надеюсь на 380g7 последнее firmware поставили? если нет бегом ставить, там критическое обновление для биоса .

oes 11 работает на ура на ml100 g7

на 380g7 я все же влепел oes2sp3 64 bit, так как непонятно как бы повел себя Linuxshield 1.7
Аватара пользователя
capricious
 
Сообщения: 393
Зарегистрирован: 21 апр 2003, 14:36
Откуда: Moscow

Re: Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 01 май 2012, 21:57

Dimerson писал(а):в логах все чисто ? в смыле ругани от демонов итд ?


Вот бы знать на чём акцентировать внимание и где смотреть. Если /var/opt/novell/log/oes/ncp, то ничего криминального, вообще. Или где еще? В /var/opt/nss только dat.

Прфиксил OES11 все рекомендованные обновления и для SuSE так и для OES. Проблема осталась. Но одно ушло это стоящие с 10-15% в утилизации сервисы ksoftirqd/xx. Стало тихо и спокойно. Ничего не делается - ни какой активности в top.
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31

Re: Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 01 май 2012, 23:19

skoltogyan писал(а):а если с консоли сервера из mc копировать в приделах NSS - подобное замирание получаете ?


Берем MC и копируем с любого раздела linux на том. Проблема - есть.
Берем MC и копируем с любого раздела linux на раздел Linux. Проблем - нет.


Начал по этому поводу честь репу. Отличие - это OES2 которые имеются в производстве - это я не использовал никогда ни evms ни lvm. В OES11 появилось такое благо как разбиение/использование под тома lvm для томов NSS. И без лишнего гемора экономить место на дисковых массивах не выделяя отдельно диски. Да evms умер этак 6 лет назад, но так и не использовал я его никогда. А тут все как-то отработало гладко и красиво сделал том NSS - радовался.
В конфиге по lvm включил логирование. Странно не создаётся! Будем искать. Может и в другом причина ступора для томов NSS.
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31

Re: Пробный старт OES11. Есть вопросы

Сообщение Dimerson » 02 май 2012, 05:33

вышли вот патчи для оес11 ... может полегчает ?
Аватара пользователя
Dimerson
 
Сообщения: 2959
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Пробный старт OES11. Есть вопросы

Сообщение Михаил Цветаев » 02 май 2012, 10:57

Dimerson писал(а):вышли вот патчи для оес11 ... может полегчает ?


Обновлялся 01.05.2012. Всё что было рекомендовано установил.

О результатах уже доложил. Может чего не заметил?


P.S. Имеется ли у кого-то OES11 в работе и имеются ли проблемы?
Михаил Цветаев
 
Сообщения: 186
Зарегистрирован: 28 авг 2008, 13:31


Вернуться в *nix

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2

cron