Жуткие глюки - а все дело в проводах.

Для любителей просто поболтать

Жуткие глюки - а все дело в проводах.

Сообщение Dimerson » 14 фев 2013, 08:00

Имеется сервер OES11SP1.
Он подготовлен к миграции GW на 2012, пока стоит так сказать в готовности.

Все ничего, но было замечено что его регулярно не видать в списке биндерных серверов.
Было обнаружено что регистрация в SLPDA сервисов Bindery и Ndap происходит весьма нерегулярно. Может быть раз в час а может и сутки там не отсвечивать.

В логах на стороне SLPDA никаких ошибок - нет только регулярности.
На стороне OES11 в логах так же все тихо.

Поглядел iMonitor -> Действия Агента -> Расписание фоновых процессов и ужанулся - там вот такая бяка:
Изображение


Для сравнения то же на беспроблемном сервере:
Изображение

Что самое забавное если N раз на этой странице iMonitor надавить Refrseh в браузере, то RNRAdbertise таки происходит и на некоторое время эти огромные цифры пропадают (на непродолжительное время вернее).

Долго общался с саппортом, изучал логи gstrace и отладочные логи ndsd.

В общем проблема разрешилась сама собой.

В данном случае упрощенно все было так:

[SLPDA NW65SP8] ---- [CISCO 3750] ---- [HP1910] ---- [OES11]

Был гнилой линк между 3750 и ПроКурвой.
Причем гнилой но не до конца. Свичти поднимали интерфейсы в гигабит. И связь не падала.
Cisco его не роняло в ERR_DISABLE. Но скорость ровнехонько соответствовала 100 мбит. Тестировал со стендов 100 мб и заметить было сложно. картами. В общем после того как Fluke на этот кабель поставил жирный крест и был заменен 1 патчкорд в шкафу с 1910 все вздохнуло с облегчением.

RNRAdvertise работает раз в час как и положено. Сервер не пропадают на SLPDA и в браузинге всегда есть. И цифр сумасшедших нет в iMonitor.

Для интереса вот что говрит циско про порт который смотрит на 1901.
Изображение

Убил вот много времени на этот непонятный подземный стук ....
Аватара пользователя
Dimerson
 
Сообщения: 2951
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70

Re: Жуткие глюки - а все дело в проводах.

Сообщение Константин Ошмян » 14 фев 2013, 11:32

Спасибо! Действительно, любопытно.
Аватара пользователя
Константин Ошмян
 
Сообщения: 991
Зарегистрирован: 13 авг 2002, 21:36
Откуда: Рига

Re: Жуткие глюки - а все дело в проводах.

Сообщение Alex-M » 14 фев 2013, 14:41

Я как-то тоже сталкивался с "полуживыми" кабелями. Причём несколько раз были глюки "из коробки":
1) несколько STPшных Hyperline-овских патч-кордов прям из пакета. Линк заводится на гиг - пинга нету или со сбоями. На 100 всё нормально. Выявляется только Флюком.
2) бывали и оптические патчи дохлые "из пакета". Одно волокно тусклое или феррула в разъёме засохла/перекосило/не ходит. Интересно, как он тогда тест проходил - ведь паспорт в пакете лежит...
3) с магистралкой бывает отдельная история. Тянули как-то подрядчики оптические кабеля. Протянули, разварили в панель, начали тестировать. Протестировали, сдали паспорт линии, всё ОК. Подключаем порты - линка нет! Где-то на обоих концах, где-то на одном. Делаем рекламацию, ответ - не может быть, мы тестировали все волокна. Тестируют повторно - всё ОК! Подключаю порты снова - линка нет.
Включаю блок логики и телепатор. Выстраиваю модель сбоя и нахожу лазейку. Спрашиваю перцев - чем тестировали. Говорят - рефлектометром. Спрашиваю - по одному волокну и только с одной стороны (из ЦОДа, ибо на удалёнку ходить влом)? Ага, говорят, а что - рефлектрометр, он же крутой, круче яиц варёных и гор кавказских, он "висо сам мэряэт..." Отвечаю - а если "там, вдали за рекой" разъём на пигтейле битый или адаптер в панели кривой? Говорят - да не может быть, никогда такого не было. Настаиваю - проверяйте с обеих сторон, да не рефлектометром, а измерителем мощности. После долгих споров поехали мерять... И что же? Из 24 волокон - 2 битых пигтейла и 2 сломанных адаптера. Твою ж так наперекосяк! Говорю - где панели с пигами брали? В ответ - бла, бла, конкурс, бла, бла, поддержка отечественного производителя. Отвечаю - ок, поддерживаем, только не за наш счёт. Лажу отечественному производителю возвращаем "с благодарностью". Покупаем нормальные панели AMP и ихние же пиги. Всё за ВАШИ деньги, ибо гарантия на линию...
От так вот бывает даже в нерезиновой!
Вагончик тронется, НОВЕЛЛ - останется!!!
Alex-M
 
Сообщения: 298
Зарегистрирован: 21 авг 2002, 16:46
Откуда: Москва, МИД России

Re: Жуткие глюки - а все дело в проводах.

Сообщение Dimerson » 29 мар 2013, 07:05

UPD: таки обнаружил исходную проблему с гигантскими цифрами. Все ОК. Собственная тупость. Зато теперь все расчудесно.

Hardrware Clock было не в Гринвиче. Хотя крыжег стоял.

При старте время +7. При этом все eDir шедулеры получат время следующего запуска ( пока веремя +7)
далее NTP выставит время правильно и значения next run в шедулере eDir становятся нечеловеческими.

Рестарт eDir - и дурных цифр нет (ибо время ОК нтп его не дергает на 7 часов и дурным интервалам взяться неоткуда).

И если траблы с UDP (кривые шнурки итд) то дурит NTP и все такое.

:(
Аватара пользователя
Dimerson
 
Сообщения: 2951
Зарегистрирован: 15 сен 2002, 14:39
Откуда: Регион 70


Вернуться в Флейм

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8

cron