HP Proliant 380g4 abends

Обсуждение технических вопросов по продуктам Novell

HP Proliant 380g4 abends

Сообщение v13 » 22 июл 2008, 17:52

Перенёс сервер nw65sp7 с proliant 380 g3 на proliant 380 g4.
Стал падать раз в час с диагностикой "Deadlock detected waiting for spinlock"
Прогуглил вечер, поставил рекомендованые обновления wsock6o
ничего не помогло.
Рядом стоит такойже сервер, там всё работает за счет отката драйверов
q57.lan на версию 2003года, захотелось разобраться в причине.
Сервера однопроцессорные,биос обновлён,гипертрейдинг отключен.
Железо 100% рабочее.
Сегодня убрал загрузку acpidrv из startup.ncf жду завтрашних падений :-)
Кто нибудь боролся с подобными проблемами ?
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение Иван Левшин aka Ivan L. » 22 июл 2008, 19:04

Кинь config.txt (sys:\system\config /all), abend.log на ilevshin.AT.novell.ru

У меня под наблюдением были и G4, и G5 с SP7 - проблем не было.
Иван Левшин aka Ivan L.
 
Сообщения: 2592
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.

Сообщение Юрий Беляков » 23 июл 2008, 07:17

Подтверждаю - nw65sp7 на proliant 380 g4 работает без проблем.

Версии биос и HP PSP не помню, последние по состоянию на начало этого года.
Аватара пользователя
Юрий Беляков
 
Сообщения: 628
Зарегистрирован: 31 май 2002, 11:46
Откуда: Екатеринбург

Сообщение v13 » 23 июл 2008, 11:30

Падает и без acpidrv :(
Последний раз обвалился когда я пытался сделать config.txt :-)
Поставил старые дровишки надоело по шапке получать.
Конфиги сегодня вышлю - единственное там будут другие (старые) q57.lan и qasp.lan
Может у меня партия серверов какая не такая была, на них отлично работают линуксы и винды, с нетварью вот проблема :( серверов таких в работе около 10.
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение Иван Левшин aka Ivan L. » 23 июл 2008, 11:36

Шлите апельсины бочками :) Прямо сейчас, правда, G4 с нетварью под руками нету - посмотрим, чем можно помочь.
Иван Левшин aka Ivan L.
 
Сообщения: 2592
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.

Сообщение v13 » 23 июл 2008, 20:54

Появилась мысль.

здесь:
http://h20000.www2.hp.com/bizsupport/Te ... 135&mode=5

напротив версии которую использует Иван есть интересные замечания:
Version: 9.72 (14 Nov 2006)
Fixes:

This driver now disables interrupts properly and no longer hangs in some situations with multiple NICs installed in a system.
This driver no longer hangs after successive cable disconnects.

Далее же тупо
Version: 10.02 (26 Mar 2007)
Enhancements:

This driver is the latest available from Broadcom.

Конкретно версию Q57.LAN v9.72 я не пробовал.

Т.Е. у меня предположение что HP както раз пофиксила драйвер от броадкома, далее же этот фикс потерялся.

Причем все это касается именно настроенной конфигурации с двумя и более сетевыми картами работающими одновременно.
подтвердить это можно будет установив эти дрова, что я какнибудь обязательно попробую, когда шея перестанет болеть которую мне хорошо намылили из-за падения сервера :-)
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение Иван Левшин aka Ivan L. » 23 июл 2008, 21:42

Володь, дело, собственно, в чем - насколько я успел понять, НР ничего особенного с броадкомовскими дровами чаще всего не делает. Более того - в нашей практике были случаи, когда Q57 менялся на B57 и с точки зрения стабильности ситуация становилась лучше. То, что я тебе прислал - срез стабильного сервера, который работает без нареканий. Решать тебе :)
Иван Левшин aka Ivan L.
 
Сообщения: 2592
Зарегистрирован: 05 июн 2002, 18:36
Откуда: Новомосковск, Тул. обл.

Сообщение v13 » 23 июл 2008, 22:34

Спасибо за помощь, просто у меня уже есть стабильный сервер с драйвером:
NW2:m q57
Q57.LAN
Loaded from [SYS:SYSTEM\] on 21 Jul 2008 21:51:18
(Address Space = OS)
HP NC10xx/NC67xx/NC77xx Gigabit Server Adapter
Version 7.05 18 December 2003
Copyright (c) 2000,2001,2002,2003 Broadcom Corporation. All rights reserved.

Интересно разобраться в причине, + новые драйвера меньше грузят проц и быстрее работают.
Последний раз редактировалось v13 23 июл 2008, 23:03, всего редактировалось 1 раз.
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение Sergant » 23 июл 2008, 22:41

А на серверах firmware сравнивали ? Вроде как HP регулярно обновляет firmware для сетевых карт.
Sergant
 
Сообщения: 330
Зарегистрирован: 22 сен 2006, 14:41
Откуда: Москва

Сообщение v13 » 23 июл 2008, 22:44

Искал, нигде не нашёл прошивок для сетевух. Возможно включено в обновление биос ?
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение v13 » 23 июл 2008, 22:48

Таакс, вроде что-то нашел.
http://h20000.www2.hp.com/bizsupport/Te ... =1064#2913
Исошка на 500 мб :)
Скачаю посмотрю что получится :-)
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение v13 » 24 июл 2008, 17:03

Обновил всё что обновилось с firmware cd 8.10 (у сетевухи что-то тоже обновилось, IML вроде называлось), поставил дрова
Q57.LAN v9.72
QASP.LAN v2.27
Буду наблюдать.
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07

Сообщение Dmitry DRB » 24 июл 2008, 17:38

Имеет смысл еще поставить последний сервиспак от HP.

http://h20000.www2.hp.com/bizsupport/TechSupport/SoftwareIndex.jsp?lang=en&cc=us&prodNameId=3288132&prodTypeId=15351&prodSeriesId=397634&swLang=8&taskId=135&swEnvOID=1064#78221

Там обновление не только сетевых драйверов, но многого еще...

Удачи,
Дима
Dmitry DRB
 
Сообщения: 30
Зарегистрирован: 28 янв 2003, 10:14
Откуда: Moscow

Сообщение v13 » 08 авг 2008, 13:05

На новеловском форуме посоветовали убрать пока qasp.lan
2 дня аптайма, раньше раз в день железно падал.
На следующей неделе продолжу изыскания.
Вообще особенности отличия 380 g4 от 380 g3 серверов
это то что в g4 только 2 реальных прерывания для сетевух, дисковых и прочих контроллеров.
И именно на этом сервере вроде воткнул на обе сетевухи вроде как 5-е прерывание, перегрузить не могу чтоб проверить.
Т.Е. Может быть проблема даже такая: interrupt sharing + qasp + большая нагрузка ...
Ну простоит если ещё дня 3 буду буржуев пинать, у них наверняка опыта по своим продуктам прилично :-)
Выводить вторую сетевуху насовсем из работы неохота ...
Аватара пользователя
v13
 
Сообщения: 660
Зарегистрирован: 31 авг 2007, 09:07


Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 10