Проблемы с UPS"ом APC Smart-5000i

Обсуждение технических вопросов по продуктам Novell

Проблемы с UPS"ом APC Smart-5000i

Сообщение Музалёв Николай » 16 июн 2004, 14:12

Уважаемые коллеги! Возникла впроблема, с которой я уже не знаю, что делать - кончились идеи. Возможно, у вас были такие или подобные ситуации.

Аппаратная на отдельном фидере; три сервера, на всех- парашут 4.2.4 ; общий UPS от АРС. Сигнальный выход прибора заведен на устройство ShareUPS (хаб для раздачи сигналов UPSa, кто не сталкивался).
Платформа сервера, который является Smart'ом:
51+sp6, лиценз. ; NDS 8.85 ; сопутств. задачи: NDPS и LDAP-сервер; IP-аддр статич. ; лицензии в порядке; DSREPAIR молчит

Вся сеть - в одной подсети, адреса: часть статические, часть дин.

До последнего времени в качестве UPSa стоял прибор Smart-1400 . Все работало отлично.
Некоторое время тому получили прибор Smart-5000i . Он был установлен вместо прежнего, но без настройки своей сетевой карты. И тоже все работало достаточно продолжительное время.
Возникла необходимость настроить сетевой интерфейс прибора. Почитали инструкцию, выбрали статический адрес, завели на прибор терминал и настроили. И начались "качания" прибора. См. выборку из лога.

Код: Выделить всё

Date     Time     Event
=================================================

05/28/04 13:36:21 Unable to communicate with UPS
05/28/04 13:36:30 Communication established

.................................................
05/28/04 16:36:00 Unable....
05/28/04 16:36:10 .....established
05/31/04 08:05:00 Unable
05/31/04 08:05:09 .....established
.................................................
05/31/04 17:03:24 Unable....                   
05/31/04 17:03:34 .....established             
06/01/04 07:42:19 Unable                       
06/01/04 07:42:28 .....established             
.................................................
06/01/04 17:02:06 Unable....                   
06/01/04 17:02:16 .....established             
06/02/04 08:34:21 Unable                       
06/02/04 08:34:31 .....established             
.................................................
06/03/04 17:45:22 Unable....                   
06/03/04 17:45:31 .....established             
06/04/04 08:57:50 Unable                       
06/04/04 08:58:00 .....established             
.................................................
06/04/04 14:30:09 Unable....                   
06/04/04 14:30:19 .....established             
06/07/04 08:26:01 Unable                       
06/07/04 08:26:12 .....established             
.................................................
06/09/04 16:50:01 Unable....                   
06/09/04 16:50:10 .....established             
06/10/04 08:41:37 Unable                       
06/10/04 08:41:47 .....established             
.................................................
06/10/04 15:53:40 Unable....                   
06/10/04 15:53:49 .....established             
06/11/04 08:19:15 Unable                       
06/11/04 08:19:25 .....established             
.................................................
06/11/04 15:11:25 Unable....                   
06/11/04 15:11:35 .....established             
06/12/04 08:41:43 Unable                       
06/12/04 08:41:53 .....established             
.................................................
06/14/04 08:37:19 Unable....                   
06/14/04 08:37:29 .....established             
06/14/04 16:51:33 Unable                       
06/14/04 16:51:42 .....established             
.................................................
06/15/04 08:41:34 Unable to communicate with UPS
06/15/04 08:41:45 Communication established
06/15/04 12:06:13 Unable to communicate with UPS
06/15/04 12:06:23 Communication established
06/15/04 12:56:16 Unable to communicate with UPS
06/15/04 12:56:25 Communication established
06/15/04 13:43:02 Unable to communicate with UPS
06/15/04 13:43:12 Communication established
06/15/04 14:47:01 Unable to communicate with UPS
06/15/04 14:47:11 Communication established
06/15/04 16:15:14 Unable to communicate with UPS
06/15/04 16:15:24 Communication established
06/15/04 17:04:32 Unable to communicate with UPS
06/15/04 17:04:42 Communication established
06/16/04 08:15:56 Unable to communicate with UPS
06/16/04 08:16:05 Communication established


Потеря соединения - всегда ровно на 10 секунд (!?!?!) , всего таких колебаний может быть от 3...5-ти до 20-ти за день - эти строки для краткости заменены точками). Причем ( посмотрите лог) это свинство точно коррелирует с рабочим днем. (??) Совсем ничего не понимаю.... учитывая, что у нас рабочий день несколько размыт и после остаются до 10-15 процентов работников....
Два ведомых сервера о потере соединения ничего не говорят.

Что было сделано:
-отключали прибор от локальной сети;
-проверены IP-аддр на корректность;
-перешит AOS file & Application file сетевой карты на последний релиз;
- в конце концов увеличили интервал NotifyDelay = 15
В результате пользователи стали получать сообщения 1-2ва раза в день, но тоже недовольны.

А вот причина так и не выяснена.
Что посоветуете?
armoracia rusticana (lat.), "блины" и "фиги" всех видов, а также смайлики - крайне не желательны !
Музалёв Николай
 
Сообщения: 3034
Зарегистрирован: 04 июн 2002, 19:58
Откуда: Беларусь. МИНСК.

Re: Проблемы с UPS"ом APC Smart-5000i

Сообщение Vladimir Kozak » 16 июн 2004, 15:02

Музалёв Николай писал(а):А вот причина так и не выяснена.
Что посоветуете?


Месяца два назад я спрашивал совета также. Ситуация полностью аналогична, только 13 секунд :lol:

Парашут 4.3.3, NW 5.1 SP6.

300000 06/15/04 09:45:58 Unable to communicate with UPS
100200 06/15/04 09:46:11 Communication established
300000 06/15/04 20:45:19 Unable to communicate with UPS
100200 06/15/04 20:45:32 Communication established
300000 06/16/04 07:08:00 Unable to communicate with UPS
100200 06/16/04 07:08:13 Communication established

... я фигею, дорогая редакция :lol:
Аватара пользователя
Vladimir Kozak
 
Сообщения: 762
Зарегистрирован: 30 янв 2003, 15:13

Сообщение TimH » 16 июн 2004, 15:20

Уважаемый !
a)Где (как вы сохранили зтот архаизм )PowerChute Plus 4.2.4 взяли ?
Я Вам вышлю v 4.3.3 он совместим с Novell NetWare 5.1 !
б)Убидительная просьба исп штатные кабеля 940-0024 и 940-0020 .
Родные или самопал -C Share родные не поставляются?
прочитайте на форуме ибп http://forum.ntfs.ru/viewtopic.php?t=87 ... 346490895f
в) интервал выдачи лог (data recording interval)случаем не пару сек по ум 300 сек ?
г) Share -ups КАКОЙ AP9??? - ?
Могу выслать доку если не очень совр то возм и на русском !
PS нe использовал я Share ups но чувствую из-за чего в раб время
теряется связь по COM порту !
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Сообщение Vladimir Kozak » 16 июн 2004, 15:34

TimH писал(а):Уважаемый !


Не менее! :)

TimH писал(а):a)Где (как вы сохранили зтот архаизм )PowerChute Plus 4.2.4 взяли ?
Я Вам вышлю v 4.3.3 он совместим с Novell NetWare 5.1 !


Какая разница? Лишь бы проблем не было и работало. Но у меня с "совместимым" 4.3.3 те же грабли.

TimH писал(а):б)Убидительная просьба исп штатные кабеля 940-0024 и 940-0020 .
Родные или самопал -C Share родные не поставляются?


Прошу прощения, но непонятно. У меня 940-0024С.

TimH писал(а):прочитайте на форуме ибп http://forum.ntfs.ru/viewtopic.php?t=87 ... 346490895f


И что там читать? Как паять кабели? Вместо штатных?

TimH писал(а):PS нe использовал я Share ups но чувствую из-за чего в раб время
теряется связь по COM порту !


У меня ровно так же - по COM-порту. В простой конфигурации. Smart - кабель - COM.
Аватара пользователя
Vladimir Kozak
 
Сообщения: 762
Зарегистрирован: 30 янв 2003, 15:13

Сообщение TimH » 16 июн 2004, 16:25

Vladimir Kozak !
Oбратите внимание что у меня нет проблем с ни с Nоvell NetWare
ни с APC ! Я их умею дружить и хотело чтоб и у Вас получилось !
Наверно потому что читаю еще и базу знаний
на http://www.apc.com/support/index.cfm и

http://www.apcc.ru/support/forum.html?idq=1428
ps (ПЕРЕЧИСЛЯЮ и у Вас тоже самое наверное)IBM SERVER 325 (не наше)
Nоvell NetWare(не нашими умами),Smart UPS 5000,2200,700 (не нашими умами и руками) + правильно приложить немного своего ! А мы и того не можем !1000 извенений !
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Сообщение Vladimir Kozak » 16 июн 2004, 17:08

TimH писал(а): + правильно приложить немного своего ! А мы и того не можем !1000 извенений !


Это мы старались читать. Но, честно говоря, некоторые вещи просто поразили.
Например совет переустановить Novell Client 32 в случае Windows 2000.

Или: "Unable To Communicate with UPS" when CD-ROM with NetWare is mounted. :shock:

Хотя, шаманский (e.g. - админовский) бубен у нас тоже не шибко пылью покрывается :) Не будем наезжать. :)

Но вот пара цитат:

"Remove the NOFIFO statement from the following load statement:
if using COM1: LOAD AIOCOMX INT=4 PORT=3F8 NOFIFO
It should be noted that if the NOFIFO statement is removed further complications can occurr especially if the UPS has accessories attached."

Прошу, прощенья, не владею я аглицким достаточно хорошо :oops: Как должно быть:

LOAD AIOCOMX INT=4 PORT=3F8 NOFIFO
или
LOAD AIOCOMX INT=4 PORT=3F8?

Тогда как это увязывается со следующим:

"PowerChute plus or PowerChute v/s for NetWare, it is strongly recommended to load the AIOCOMX.NLM with a switch setting of "NOFIFO."

Или вот это:

"You may also have to set PowerChute's "TimeOutFactor=100" in PwrChute.ini, under the [UPS] section of the smart signaling server/wkstation."

Что есть TimeOutFactor - великая тайна. Ткните носом в доку пожалуйста. Потому что с момента загрузки модулей до "established" проходит минут 6-7, что нам совсем не нравится.

Кстати, на другом Smart'е другой глюк у нас есть - ежемесячная калибровка не идет. Больше одного раза :)

Заранее спасибо за советы.
Аватара пользователя
Vladimir Kozak
 
Сообщения: 762
Зарегистрирован: 30 янв 2003, 15:13

Сообщение TimH » 16 июн 2004, 17:09

Serial Communication Lost" error with the Network Management Card
в буржуйской базе знаний Answer ID 770
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Сообщение TimH » 17 июн 2004, 07:19

.....ежемесячная калибровка не идет. Больше одного раза ...
а)дайте устройству (отдохнуть) зарядиться до 100% и вперед по второму ... !
б)Оно Вам надо -трата ресурсов аккумуляторных батарей (AB)?
Программе APC Smart UPS регулярного self test а достаточно чтобы
знать состояние AB !
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Сообщение Vladimir Kozak » 17 июн 2004, 10:02

TimH писал(а):.....ежемесячная калибровка не идет. Больше одного раза ...
а)дайте устройству (отдохнуть) зарядиться до 100% и вперед по второму ... !


Вперед по второму? Вы не поняли - все упсы выполняют раз в месяц калибровку сами. Устройства заряжены на 100%. А один выпендривается. А второй - свой глюк - теряет соединение.

TimH писал(а):б)Оно Вам надо -трата ресурсов аккумуляторных батарей (AB)?
Программе APC Smart UPS регулярного self test а достаточно чтобы
знать состояние AB !


Недостаточно. Убеждались на личном опыте не раз. Или может скажете еще например, что после замены аккумуляторов не надо шаманить с их упсом? :D Да и не трата это ресурсов. Стареют ("естесственно") они не менее быстро. Или вы о том что "вдруг в этот момент пропадет питание"? Не страшно: а) нормальная штатная ситуация - powerchut'ы настроены, сложат аккуратно сервера; б) "персональные" упсы серверов включены в "баааальшой" упс :wink:

Насчет намека на криворукость - Smart'ов (и не только) у нас не два. Гораздо больше.
Аватара пользователя
Vladimir Kozak
 
Сообщения: 762
Зарегистрирован: 30 янв 2003, 15:13

Сообщение TimH » 17 июн 2004, 11:51

..... Убеждались на личном опыте не раз...
Пришлите мне pwrchute.dat,log за n-лет эксплуатации нового APC
я проанализирую посмотрю при какой температуре он жил и "ткну"
в pwrchute.log -когда надо было бежать в магазин (за AB) и не надо было"шаманить"- жду !!!
ДА и что трудно :unload pwrchute.nlm (powernet.nlm)--->
Load terminal.nlm ---> 1...1 --->0---->+(подержать) --->R--bye
и ВСЁ-Ё-Ё! А сколько слов и наезда на легендарную надежность !
А если не пришлете, то что я просил то первая строка моего постинга
(Ваше высказывание) -подтвердится что даже грамотно эксплуатировать не умеем МЫ!
найдите при инсталяции 4.3.3 в "pdf" -lost com.... every 10 sec
небось от чтения гуйдов и release note... (!) отказались и
нажали кнопку INSTALL now ! А потом появляются такие наезды :
http://www.apcc.ru/support/forum.html?idq=1442
УСПЕХОВ !
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Сообщение TimH » 17 июн 2004, 12:23

Vladimir Kozak писал(а): Вы не поняли - все упсы выполняют раз в месяц калибровку сами.


в Smart ups от APC c 2g-3.6g(поколения )заложен параметр
"E"-интервал самотестирования(self test) поумолчанию 336(часов) !
self test-тест устройства с кратковременной работой инвертора()c переходом на батареи !
"D" переход на раб от батарей (до опр уровня) и возврат
Хочу процетироать молодого умного соседа по работе
(на 20 моложе ему 28) :"Читайте доки они-же рулез"!
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

Не надо всех огульно в неграмотные записывать...

Сообщение Сергей Дубров » 17 июн 2004, 14:37

Смотрю, у нас тут активный поклонник славной фирмы APC образовался - TimH. Или проще - продавец? :lol:. Только вот совет хочу дать небольшой - не надо здесь априори всех нечитающими документацию неумехами называть. И рекламные сказки про "легендарную надёжность" вы для своих покупателей придержите, здесь в основном люди опытные и толковые обитают, за очень редким исключением.

К чему это я? А вот к чему - не всё так здорово у APC, как вы тут нам снисходительно пояснить пытаетесь, намекая на элементарное непрочтения документации. Желаете примеры того, что не всё так безусловно хорошо у APC, как вы нам тут поёте? Их есть у нас, причём разные - как по части софта, так и по части железа. Плюс примеры откровенного жлобства со стороны фирмы, когда на меня наехали за "рассекреченную" распиновку кабеля для Back-UPS (который предлагалось покупать за $50). Итак, примеры:

1. Программа PowerChute V/S позволяла (и позволяет) задаунить любой сервер в сети БЕЗ АВТОРИЗАЦИИ! Если только не сделана некая, совсем неочевидная настройка на консоли NW-сервера. Эту настройку в своё время мне рассказал Исаков, в бытность его работы в московском новеле. Про сволочную особенность Powerchute V/S даже в своё время в журнале LAN писали.

2. Много лет (с 1995 или 1996, точно не помню), эксплуатируем два Matrix 5000 и парочку Share-UPS, покдключенных к каждому из них (поскольку на матриксах висит заметно поболее одного сервера). К Share-UPS подключён один ведущий сервер (smart-овым кабелем) и несколько а-ля Back, как обычно. Обнаружилась такая вещь - при подключении первого шнурка к com-порту "back"-сервера - всё в порядке, переходы на батарею и обратно отслеживаются, down отрабатывает. Подключаем шнурок второго "back"-сервера - хех, знакомая картина - появились ошибки (редкие пока) c communication lost. Подключаем третий шнурок - communication lost возникают гораздо чаще, после подключения четвертого и далее - сразу же, как только втыкается кабель в Share-UPS.

Мне стало любопытно, в чём тут проблема, переписка с APC ничего по этому поводу не дала, поддержка только пальцы гнула и нас в невежестве обвиняла. Напомню, что Share-UPS-ов у нас было два и вели так себя - ОБА! И шнурки типа 940-0020B на то время были исключительно фирменными (напрокат взяли, потом уже сами их делали). Я, вообще-то, когда-то был не самым последним электронщиком-разработчиком , осциллографа и паяльника не боюсь :D. Поэтому за этим последовало вскрытие корпуса Share-UPS и пристальное его исследование.

Причина увеличения вероятности появления ошибки communication lost была найдена довольно быстро - некачественная схемотехника (если честно - весь Share-UPS тянет на курсовую третьекурсника-электронщика, не более. За что там $172 - искренне не понимаю). Оказалось, что "легендарно надёжная" фирма APC сэкономила на спичках и источник отрицательного напряжения -12вольт, требующегося по стандарту RS-232-C (com-порты), сделали на... инверторе TTL вентиля с удвоением напряжения. Т.е., мало того, что вместо положенных -11-12 вольт там максимум вольт 6-7 будет, так ещё и нагрузочная способность никакая. Что мы и наблюдали, собственно - каждое следущее подключение отбирало от этого хилого "источника" отрицательного напряжения свои законные 2-3 миллиампера, источник "проседал" и после подключения третьего-четвертого RS-232-C от минус 6 вольт оставалось вольта 2-2.5. Схемотехники хреновы. Мы доработали схему, работает уже 8 лет без нареканий.

3. Любимый пример номер три - схема шнурка 940-0020B - блин, устроили из двух разъёмов, нескольких проводочков, транзистора и нескольких резисторов великую тайну, хайтек, интеллектуальное нау-хау. И продают эту "тайну" аж за 50 уёв. Совсем рехнулись ребята. Когда мы вычислили распиновку (ничего сложного, квалификация наша это легко позволила сделать :lol: ), я опубликовал эту схему на каком-то сайте. Так ведь наехали, жлобы APC-шные, дескать, копирайты я ихние нарушаю и деньги зарабатывать мешаю. Послал я их подальше, сказал, что кабель и схема внутри - мои собственные, за случайные совпадения номиналов и типы транзисторов я ответственности не несу. Погундели ещё немного - и отстали.

Вот такая вот "легендарная надёжность" - жлобство и непрофессионализм им совершенно не чужды. Хотя сами УПСы - замечательные (я про Matrix-ы). Правда мы и их доработали :lol: ...
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Вопрос..

Сообщение Мещеряков Андрей » 17 июн 2004, 16:02

Сергей, а можно адрес сайта, где выложена схема шнура? Плиз...
У меня тоже проблемы с АРС... одно из устройств скандалит о разряженности батареи при 100% заряде...
Аватара пользователя
Мещеряков Андрей
 
Сообщения: 1999
Зарегистрирован: 19 сен 2002, 14:55
Откуда: lipetsk

Re: Вопрос..

Сообщение Сергей Дубров » 17 июн 2004, 16:05

Мещеряков Андрей писал(а):Сергей, а можно адрес сайта, где выложена схема шнура? Плиз...
У меня тоже проблемы с АРС... одно из устройств скандалит о разряженности батареи при 100% заряде...

Давно это было, я уже сейчас и не вспомню где именно. Можно поступить проще - схема существует в виде 74кб PCX-файла, могу ее просто выслать, н-р, по почте.

Выслал, лови...
Аватара пользователя
Сергей Дубров
 
Сообщения: 2096
Зарегистрирован: 05 июн 2002, 06:07
Откуда: Новосибирск, ин-т ядерной физики СО РАН

Re: Вопрос..

Сообщение TimH » 17 июн 2004, 17:41

Мещеряков Андрей писал(а):Сергей, а можно адрес сайта, где выложена схема шнура? Плиз...
У меня тоже проблемы с АРС... одно из устройств скандалит о разряженности батареи при 100% заряде...


Андрей распайка лежит на http://ups.miem.edu.ru/ups_faq5.html#5
A еще люблю triplite,MGE-с удовольствием попробывал бы эксплутировать но организация не купила!
ps C УДОВОЛЬСТВИЕМ ОТВЕЧУ BAM КАК ЭТО СДЕЛАТЬ!
Хотя в 95% процентах помогает то что здесь уже было сказано
выше !
а)http://forum.ntfs.ru/viewforum.php?f=38
б)http://forum.ntfs.ru/viewforum.php?f=17
в)http://www.apcc.ru/support/forum.html
TimH
 
Сообщения: 56
Зарегистрирован: 18 мар 2003, 14:48
Откуда: Ташкент

След.

Вернуться в Novell

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8

cron