DPM 2010 — An existing connection was forcibly closed by the remote host (0x80072746)

imageНе смотря на то что я уже перешёл на System Center 2012 Data Protection Manager (DPM), решил написать заметку о проблеме, которая была обнаружена при использовании DPM 2010 и была решена с помощью обращения в тех.поддержку Microsoft. Суть проблемы заключалась в том, что при попытке выполнения задания резервного копирования виртуальной одной машины Hyper-V примерно через 3 часа и 10-15 минут после начала выполнения на сервере DPM регистрировалась ошибка:

The DPM service was unable to communicate with the protection agent on vm01.holding.com. (ID 65 Details: An existing connection was forcibly closed by the remote host (0x80072746))

 

При этом все другие виртуальные машины с этого же хоста бэкапились без проблем. Особенностью этой виртуальной машины от других было лишь то, что в ней работал экземпляр SQL Server 2008 R2 Express Edition с большим количеством файлов БД небольшого размера, расположенных на отдельном VHD размером около 300 Gb.

В ходе решения проблемы был выполнен ряд манипуляций, которые не принесли в данном случае нужного результата:

1) Увеличен до 15 минут таймаут возможного простоя подключения на защищаемом сервере (на хосте виртуализации) с последующим перезапуском службы DPMRA.

Windows Registry Editor Version 5.00

 

[HKEY_LOCAL_MACHINESOFTWAREMicrosoftMicrosoft Data Protection ManagerAgent]

 

"ConnectionNoActivityTimeout"=dword:0000900

 

2) Проверена корректность настройки списка исключений для Антивирусного ПО. Проблема воспроизводилась и с выключенным Антивирусом и даже после его полного удаления.

3) Выключен механизм TCP Chimney на сервере DPM и хосте виртуализации:

Netsh int tcp set global chimney=disabled

4) Выключен механизм  NetDMA на сервере DPM и хосте виртуализации:

Netsh int tcp set global netdma=disabled

5) Если не используется Hardware VSS Provider, в документе Considerations for Backing Up Virtual Machines on CSV with the System VSS Provider рекомендуется выполнять резервное копирование виртуальных машин с включенным VM Per Node Serialization. Несмотря на то, что данная рекомендация относиться к CSV было рекомендовано проверить и этот вариант. На сервере DPM был создан параметр реестра (с последующей перезагрузкой сервера):

Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINESOFTWAREMicrosoftMicrosoft Data Protection Manager2.0ConfigurationMaxAllowedParallelBackups]

"Microsoft Hyper-V"=dword:00000001

 

Решение проблемы

В конечном итоге проблема была решена только тогда, когда на сервере DPM и хосте виртуализации в реестре было установлено значение каких-то ещё таймаутов (точного описания этих ключей нигде так и не нашёл) в значение 7200 с последующим перезапуском агента — службы DPMRA

Windows Registry Editor Version 5.00

 

[HKEY_LOCAL_MACHINESOFTWAREMicrosoftMicrosoft Data Protection ManagerAgent]

 

"ConnectionNoActivityTimeoutForNonCCJobs"=dword:00001c20

"ConnectionNoActivityTimeout"=dword:00001c20

В результате проблемная виртуальная машина на DPM 2010 стала бэкапится успешно примерно за 3 часа 20 минут. При переходе на System Center 2012 DPM я был приятно удивлён тем, что обновлённый алгоритм резервного копирования виртуальных машин теперь выполняет туже ежедневную задачу буквально за 15- 20 минут. Это показательный пример для тех, кто ещё не перешёл на новую версию DPM.

Добавить комментарий