Создан кластер Hyper-V на базе Windows Server 2012 R2 с единственным узлом и диском-свидетелем. После этого пытаемся добавить в кластер новый узел. В результате появляется ошибка:
Если смотреть отчёт (View Report), то видно что узел проходит первичную валидацию, а потом операция безуспешно завершается с сообщением о каким-то таймауте ожидания:
Adding KOM-AD01-VM07.holding.com to the cluster. Validating cluster state on node KOM-AD01-VM07. Getting current node membership of cluster KOM-AD01-VMFC01. Adding node KOM-AD01-VM07 to Cluster configuration data. Validating installation of the Network FT Driver on node KOM-AD01-VM07. Validating installation of the Cluster Disk Driver on node KOM-AD01-VM07. Configuring Cluster Service on node KOM-AD01-VM07. Waiting for notification that Cluster service on node KOM-AD01-VM07.holding.com has started. Waiting for notification that node KOM-AD01-VM07 is a fully functional member of the cluster. Cluster service on node KOM-AD01-VM07 did not reach the running state. The error code is 0x5b4. For more information check the cluster log and the system event log from node KOM-AD01-VM07. This operation returned because the timeout period expired. Unable to successfully cleanup. The server 'KOM-AD01-VM07.holding.com' could not be added to the cluster. An error occurred while adding node 'KOM-AD01-VM07.holding.com' to cluster 'KOM-AD01-VMFC01'. This operation returned because the timeout period expired
Чтобы понять корень проблемы требуется дополнительная отладочная информация, получить которую помогут рекомендации из статьи Failover Clustering and Network Load Balancing Team Blog - How to Troubleshoot Create Cluster failures in Windows Server 2012. В частности, для получения лога компоненты кластеризации выполним на обоих серверах (на действующем узле кластера и добавляемом в кластер сервере) Powershell командлет выгружающий в текстовый файл этот самый лог:
Get-ClusterLog -Destination C:\ –UseLocalTime
В результате, по указанному пути появиться лог-файл с именем вида KOM-AD01-VM04_cluster.log
В нашем конкретном примере изучение лога на добавляемом в кластер сервере не внесло ясности, однако в логе сервера-владельца кластера были замечены множественные предупреждения вида:
00000ad8.00001dd4::2014/10/29-20:14:55.154 WARN mscs::ListenerWorker::operator (): (5060)' because of '[FTI][Initiator] Discarding connection from 10.160.35.58:~3343~ to 10.160.35.57:~3343~ (node KOM-AD01-VM07) because it uses a disabled network.'
В итоге выяснилось, что выключенная в кластере подсеть, относящаяся к Live Migration и стала причиной возникновения проблемы.
После включения соответствующей кластерной сети новый узел успешно был добавлен в кластер.
Другие материалы, которые могу оказаться полезными при разборе ситуаций с невозможностью добавления нового узла в кластер:
- SQLServerScribbles.COM - windows cluster freezes at “waiting for notification that node ‘‘ is a fully functional member of the cluster”
- Microsoft GTSC Romania - Enterprise Platforms Support Blog - The case of the server who couldn’t join a cluster – operation returned because the timeout period expired
- TechNet Forum - Can't add Hyper-V 2012R2 Node
Огромное спасибо за статью!!!
Я уже все ногти сгрыз и волосы на ногах повыщипывал!
=)))
Спасибо большое!! к и Anton уже начинал отчаиваться, но вы спасли!
У меня такая ошибка появлялась при добавлении узла в кластер из-за того, что одна нода была не рабочей (выключена/сломалась). После того как её выгнал из кластера получилось добавить узел в кластер.
You are the best! Thanks so much!