Последнее время Sun испытывает особую любовь к Auto Service Request (ASR), позволяющему автоматически регистрировать заявки в Sun при возникновении аппаратных проблем. Недавно перед мной встала задача установки ASR на некоторое количество оборудования, включая Sun Fire X4170 и X4270, коих было в суммарном количестве 42 штуки.
На всех этих машинках установлена операционная система Windows, и, как следствие, для мониторинга остаётся только ILOM. А для его настройки необходимы некоторые (описанные в документации) шаманские действия на нём. Все ILOM-ы естественно подключены в сеть, но вот как вполнить одинаковые действия сразу на 42-х хостах?
Правильно. Для такой операции я воспользовался горячё любимым мной ClusterSSH. Элементарный скрипт на шелле:
cssh -l root `tail -42 /etc/hosts | awk { print $2 }'`
И результат... заставил себя подождать.

Если честно, то было немного страшно.
Выполнив необходимые действия на стороне ILOM-ов приступаем к регистрации ILOM-ов на SASM хосте. Аналогичным способом генерируем команды asr activate_asset -i
для 42-х адресов ILOM и запускаем. Так как asr штука не быстрая, нервно курим минут 20, после чего выполняем asr list_asset и... о ужас. В колонке SERIAL_NUMBER вместо собственно серийного номера системы содержимое product_part_number из свойств /SYS:
IP_ADDRESS HOST_NAME SERIAL_NUMBER ASR PRODUCT_NAME
--------------- ------------------------------ ------------------------------ -------- ------------------------------
10.xxx.xxx.xxx rs1bkmr1-sp 4532576-113 Enabled SUN FIRE X4270 SERVER
Так как время слегка поджимает, скидываем этот косяк в Sun нужному инженеру, на что получаем ответ:
There is a known issue with ILOM version 3.0.9.19, the solution is to wait for the fix or downgrade the ILOM version.
Предлагаю задаунгрейдить ILOM, где это необходимо (насколько я понимаю - везде :()
Дмитрий,
Есть ли силы на это?
Есть ли у нас силы на даунгрейд 42-х ILOM-ов? Жаль, что нас не спросили, а есть ли у нас план? Конечно же у нас есть план. Когда еще предоставится замечательный шанс одновременно угробить прошивку на таком количестве серверов? Не долго думая, повторяем команду запуска cssh, и запускаем процедуру даунгрейда. Еще какое-от время на выполнение нужного количества deactivate_asset/activate_asset и в list_asset получаем корректные серийники, о чём довольные собой сообщаем тому же инженеру. Ответом было:
Уфф, ну вы монстры, когда успели ;)?!