null

Восстановление доступа к "упавшему" web-интерфейсу на Storwize V3700

Не так давно с коллегами столкнулись с проблемой, что на IBM Storwize V3700 (на V7000 не проверялось) перестаёт открываться web-интерфейс управления, при этом сама СХД продолжает исправно работать. После упорного чтения логов было замечено, что в какие-то моменты Tomcat "падает" в Out of memory exception. Инженеры IBM сообщили, что такая ситуация может возникнуть вследствие резкого повышения нагрузки на хранилку к значениям, близким к максимальным. Особенно вероятен подобный исход в случае использования Storwize с 4GB кэш-памяти. 

Рухнувший в Out of memory Tomcat возможно лечить только одним способом: рестартом. Ниже приведена последовательность действий, которые требуется выполнить для перезагрузки сервиса. 

  • Логинимся по SSH на нашу СХД под пользователем "superuser"
  • Получаем список panel names
    sainfo lsservicenodes
  • Сервис нужно перезапускать на master-ноде. Чтобы узнать какая из нод в данный момент является конфигурирующей, вводим следующую команду
    sainfo lsservicestatus <panel name> 
    # где <panel name> -- имя панели, полученное из предыдущей команды
  • Вы увидите строчку Config_node yes, если данная нода является конфигурирующей
  • Теперь используйте следующую команду для перезапуска сервиса
    satask restartservice -service tomcat <panel name>

Через некоторое время web-интерфейс снова станет доступен.

Данное действие никак не влияет на полезную работу СХД