Тестирование
Как проверить поведение системы в критический момент выхода из строя оборудования? Как отработает динамическая реконфигурация? Как предсказать сколько пользователей или соединений сможет система вынести без явного замедления обслуживания? А с 40% замедлением? А сколько при этом может быть пользователей?
Ответ на этот и подобные вопросы можно получить если подвергнуть систему тестированию на нештатные ситуации. Конечно, это лучше всего делать в момент запуска комплекса в эксплуатацию, но мы можем составить план и провести тестирование во время окон в обычной эксплуатации.
План тестирования зависит от конфигурации системы, мы разрабатываем его, что бы проверить:
-
Отработку стандартных реакций аппаратуры на сбои, такие как мultipathing, IP-failover, disk failure, и пр.
-
Переключение программных служб в кластерных конфигурациях
-
Автоматическую и ручную активацию серверов горячей готовности
-
Отработку отказа системных контроллеров
-
Корректное логирование аппаратных и программных сбоев
-
Передачу событий в службы мониторинга и автоматическую регистрацию заявок в сервисных службах
-
Поведение смежных систем в сети во время сбоя
-
Поведение комплекса под различными эквивалентами нагрузки
-
Величину уменьшения производительности при выходе из строя того или иного компонента системы.