...

понедельник, 16 сентября 2013 г.

Dumb ways to die, или 7 популярных ошибок при подключении оборудования

Не хотелось бы никого расстраивать, но даже самый “нарядный” ЦОД — с резервированием по схеме N в кубе и вообще ваш собственный — еще не гарантия бесперебойной работы оборудования: это самое оборудование, прежде всего, нужно правильно подключить.

“Спасибо, Кэп!” — снисходительно улыбнется мой читатель, а я ему отвечу: не стоит благодарностей, сходите лучше в ЦОД и проверьте еще раз ваши стойки. Да-да, те самые, с которыми сто лет как все в порядке. Вы не поверите, как часто именно с такими вот “беспроблемными” стойками и случается прискорбное. Я даже чеклист набросал.






Итак, что НЕ должно встретиться вам на этой послеобеденной прогулке:


1. Сервер, СХД или сетевое оборудование о двух блоках питания, подключенных зачем-то к одному PDU*

Вот вроде бы азбука, — а вы все же проверьте. Бывает.


Вариация на ту же тему — АВР, обоими кабелями питания воткнутый в один и тот же PDU.


Во избежание: АВР (автоматический ввод резерва) — это такая штуковина, посредством которой к двум PDU (и, стало быть, к двум лучам) подключается оборудование с одним блоком питания — например, сетевое: коммутаторы, маршрутизаторы, вот это все.


Предположим, по чьей-то рассеянности АВР, к которому вот это все подключено, оказывается запитан от одного PDU. Чем это чревато? При пропадании соответствующего луча оборудование с таким АВР, разумеется, отключится, — а если это сетевое железо, вы и вовсе потеряете связь со всей стойкой. Звучит не очень, согласитесь.



2. Оборудование с одним блоком питания, подключенное вовсе без АВР.

Плохая, плохая идея. Понимаю, копейка рубль бережет, — но вам ведь важно, чтобы оно еще и безотказно работало, верно?


3. Загрузка АВР более чем на 75-80%.

​В чем тут засада: при запуске и перезагрузке оборудование потребляет гораздо больше тока, чем в обычном рабочем режиме. Соответственно, если «запаса» АВР на такие разовые «всплески» нет, у вас при запуске \ перезапуске просто «выбьет пробки» и привет.



4. Оборудование, подключенное в соседние стойки

​Возможно, кому-то покажется остроумным “отгрузить” немного электропотребления в соседний “шкаф”, раз уж он простаивает недоутилизированным, пока рядом, что называется, некуда вешать. А теперь вопрос на засыпку: что там у нас к какому лучу подключено в итоге? А? Никто не в курсе? Вот то-то и оно.


Еще есть такой нюанс, как тепло, вырабатываемое оборудованием, и риски локального перегрева стойки, нагруженной этим оборудованием «под завязку». Перегрев и бардак с прокладкой проводов — не лучшее подспорье в ИТ-хозяйстве, поверьте.



5. Перегруженные секции PDU

Начну издалека: у PDU есть секции, и это все не просто так. Каждая секция стандартного PDU, суммарная мощность которого составляет, скажем, 32А, рассчитана на ток не более 16А. А на 20А уже не рассчитана. И на 25 тоже нет. Даже если вторая секция совершенно свободна. Такой вот нюанс.


А теперь представим, что кто-то (с самыми светлыми, заметим мы в скобках, намерениями) аккуратно заполняет стойку оборудованием и АВР — допустим, снизу вверх — и, понятно, подключает все это дело также строго снизу вверх. Чтобы как раз без бардака и красиво.


Казалось бы, все правильно сделал, и 32А еще не вычерпаны, а всего только 20 — живи да радуйся. Потом одним прекрасным утром в ЦОДе отключается один луч питания — и внезапно (!) на “перегретой” секции срабатывают защитные автоматы и вся эта секция (с подключенным к ней оборудованием, да-да) благополучно отключается. Изящно, правда? Хотите себе такое?



6. Стойка, перегруженная оборудованием настолько, что вынуждена в штатном режиме “кормиться” сразу от двух лучей, один из которых вообще-то резервный.

Тут такое дело: резерв, который задействован в штатной ситуации, — он как бы уже и не резерв, что ли…

Хорошая же новость заключается в том, что есть и человеческие способы увеличить мощность стойки,- причем без отключения активного оборудования. Заинтриговал? Тогда записывайте:



  • во-первых, можно добавить еще пару PDU аналогичной мощности и все новое оборудование… ладно, дальше сами, не маленькие;

  • во-вторых (вариант поэкзотичнее), можно заменить текущие PDU на более мощные




Здесь, пожалуй, потребуется некоторая сноровка, но в целом все, опять-таки, прозрачно: ставите более мощные автоматы, прокладываете более мощный кабель, устанавливаете новый (по совместительству более мощный) PDU рядом с прежним — и спокойно переключаете оборудование из одного PDU в другой. Ну, то есть как спокойно: если вдруг у вас недосмотр по пункту один нашего чеклиста, может получиться неловко. А если все четко — пройдет без помех. Далее повторяете процедуру со вторым PDU — и виват! Можно пойти перекурить.

7. Вы только не смейтесь, но… проверьте индикацию. Нет, правда, проверьте.

У самого бывало: подключили АВР, вроде бы все ok, – а плохой контакт, или нерабочий провод, или вовсе неплотно вставлен кабель… продолжать?


То же самое и с двумя блоками питания: внешне все прекрасно – оборудование работает, проблем нет. А на самом деле один из блоков давно помер, не оставив завещания.


В общем, не ленитесь раз в как получится проверить особенно дорогое вашему сердцу оборудование на наличие красных лампочек или отсутствие зеленых в нужных местах. Сами себе потом спасибо скажете.


На этом наш скромный хит-парад несуразностей при подключении оборудования исчерпан. Непрерывного вам сервиса и бесперебойных благ.


* Power Distribution Unit – блок розеток, если по-простому


This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers. Five Filters recommends:



Комментариев нет:

Отправить комментарий