angle-left

Veritas Cluster: Did not receive cluster membership

В период обслуживания ИТ-оборудования у нашего заказчика возникла проблема с Veritas Cluster Server с eventID: 11306.
В процессе разбора было обнаружено, что второй резервный узел был выключен, а первый узел (основной) перезапущен.
 
C:\Users\Administrator> lltstat -nvv

	LLT node information:

		Node                 State    Link  Status  Address

	   * 0 CLUSTER_NODE_1  OPEN

									  Link1   UP      192.168.187.20

									  Link2   UP      192.168.187.10

		 1 CLUSTER_NODE_2   CONNWAIT

									  Link1   DOWN    192.168.187.21

									  Link2   DOWN    192.168.187.11

	PS C:\Users\Administrator> hastatus -sum

	VCS ERROR V-16-1-10600 Cannot connect to VCS engine

	VCS WARNING V-16-1-11046 Local system not available
При включении в отсутствии heartbeat со вторым узлом, во избежании состояния splitbrain (состояние с несколькими одновременно запущенными кластерными узлами) не был запущен.
 
С учетом того, что мы точно обладали знанием о том, что второй узел находился в выключенном состоянии, мы могли гарантировать корректную работу систем на одном из узлов.
Для оживления кластера необходимо выполнить комманду gabconfig с ключем -x:
Seed control port.  This option affords protection 
from pre-existing network partitions.  The control
port (port  a) propagates the  seed to all configured
systems.   GAB  must  be  seeded  to  enable
the delivery of membership on client ports.

 

Выполнение команды gabconfig -x и результат:

PS C:\Users\Administrator> gabconfig -x

	PS C:\Users\Administrator> hastatus -sum

	 

	-- SYSTEM STATE

	-- System               State                Frozen

	 

	A  CLUSTER_NODE_1     RUNNING              0

	A  CLUSTER_NODE_2      UNKNOWN              0

	 

	-- GROUP STATE

	-- Group           System               Probed     AutoDisabled    State

	 

	B  MRU-SQL-GROUP   CLUSTER_NODE_1     Y          N               OFFLINE

	B  MRU-SQL-GROUP   CLUSTER_NODE_2      Y          N               OFFLINE

	 

	-- RESOURCES NOT PROBED

	-- Group           Type                 Resource             System

	 

	E  MRU-SQL-GROUP   IP                   MRU-SQL-GROUP-IP     CLUSTER_NODE_2

	E  MRU-SQL-GROUP   Lanman               MRU-SQL-GROUP-Lanman CLUSTER_NODE_2

	E  MRU-SQL-GROUP   MountV               MRU-SQL-GROUP-MountV CLUSTER_NODE_2

	E  MRU-SQL-GROUP   MountV               MRU-SQL-GROUP-MountV-1 CLUSTER_NODE_2

	E  MRU-SQL-GROUP   MountV               MRU-SQL-GROUP-MountV-2 CLUSTER_NODE_2

	E  MRU-SQL-GROUP   NIC                  MRU-SQL-GROUP-NIC    CLUSTER_NODE_2

	E  MRU-SQL-GROUP   RegRep               MRU-SQL-GROUP-RegRep-MSSQL CLUSTER_NODE_2

	E  MRU-SQL-GROUP   SQLServer2008        SQLServer2008-MSSQLSERVER CLUSTER_NODE_2

	E  MRU-SQL-GROUP   VMDg                 MRU-SQL-GROUP-VMDg   CLUSTER_NODE_2

 

 

Наша компания имеет богатый опыт в области кластеризации критически важных систем и приложений.