null

ASR на 42 хоста? Да с удовольствием!

Последнее время Sun испытывает особую любовь к Auto Service Request (ASR), позволяющему автоматически регистрировать заявки в Sun при возникновении аппаратных проблем. Недавно перед мной встала задача установки ASR на некоторое количество оборудования, включая Sun Fire X4170 и X4270, коих было в суммарном количестве 42 штуки.

На всех этих машинках установлена операционная система Windows, и, как следствие, для мониторинга остаётся только ILOM. А для его настройки необходимы некоторые (описанные в документации) шаманские действия на нём. Все ILOM-ы естественно подключены в сеть, но вот как вполнить одинаковые действия сразу на 42-х хостах?

Правильно. Для такой операции я воспользовался горячё любимым мной ClusterSSH. Элементарный скрипт на шелле:

cssh -l root `tail -42 /etc/hosts | awk { print $2 }'`

И результат... заставил себя подождать.

Нажмите на картинке для просмотра в полном размере

Если честно, то было немного страшно.

Выполнив необходимые действия на стороне ILOM-ов приступаем к регистрации ILOM-ов на SASM хосте. Аналогичным способом генерируем команды asr activate_asset -i для 42-х адресов ILOM и запускаем. Так как asr штука не быстрая, нервно курим минут 20, после чего выполняем asr list_asset и... о ужас. В колонке SERIAL_NUMBER вместо собственно серийного номера системы содержимое product_part_number из свойств /SYS:

IP_ADDRESS      HOST_NAME                      SERIAL_NUMBER                  ASR      PRODUCT_NAME                 
--------------- ------------------------------ ------------------------------ -------- ------------------------------
10.xxx.xxx.xxx  rs1bkmr1-sp                    4532576-113                    Enabled  SUN FIRE X4270 SERVER

Так как время слегка поджимает, скидываем этот косяк в Sun нужному инженеру, на что получаем ответ:

There is a known issue with ILOM version 3.0.9.19, the solution is to wait for the fix or downgrade the ILOM version.
Предлагаю задаунгрейдить ILOM, где это необходимо (насколько я понимаю - везде :()
Дмитрий,
Есть ли силы на это?

Есть ли у нас силы на даунгрейд 42-х ILOM-ов? Жаль, что нас не спросили, а есть ли у нас план? Конечно же у нас есть план. Когда еще предоставится замечательный шанс одновременно угробить прошивку на таком количестве серверов? Не долго думая, повторяем команду запуска cssh, и запускаем процедуру даунгрейда. Еще какое-от время на выполнение нужного количества deactivate_asset/activate_asset и в list_asset получаем корректные серийники, о чём довольные собой сообщаем тому же инженеру. Ответом было:

Уфф, ну вы монстры, когда успели ;)?!