Экземпляры масштабируемого набора виртуальных машин Azure не восстанавливаются, даже если включена политика автоматического восстановления.

Экземпляры Azure VMSS остаются в неработоспособном состоянии и не восстанавливаются, даже если включена политика автоматического восстановления. В этой статье приводятся возможные причины и соответствующие решения для этой проблемы:

Политика автоматического исправления неправильно включена в масштабируемом наборе

Убедитесь, что служба VMSS настроена на автоматическое восстановление, просмотрев состояние службы.

В свойстве orchestrationServices , если serviceState параметр для автоматического восстановления имеет значение Running, VMSS выбирается на автоматическое восстановление.

serviceState NotRunning Если политика автоматического восстановления is или не отображается в свойстве orchestrationServices , необходимо включить политику автоматического восстановления в масштабируемом наборе. Дополнительные сведения см. в разделе Включение политики автоматического исправления при обновлении существующего масштабируемого набора.

serviceState Если имеет значение Suspended, перейдите к разделу Автоматическое восстановление приостановлено в масштабируемом наборе из-за слишком большого количества неудачных исправлений.

Мониторинг работоспособности неправильно настроен в масштабируемом наборе

Если все экземпляры в масштабируемом наборе отображаются как "Неработоспособные", это может быть признаком того, что проба мониторинга работоспособности настроена неправильно во время установки. Убедитесь, что приложение отправляет ожидаемые ответы HTTP/HTTPS/TCP настроенным конечным точкам.

Чтобы достичь состояния "Работоспособно", пробы работоспособности расширения работоспособности приложения или пробы работоспособности подсистемы балансировки нагрузки требуют, как минимум, ответа HTTP(S) 2xx или успешного подтверждения TCP от приложения в настроенной конечной точке. Если ожидаемый ответ не получен, будет сообщено состояние "Неработоспособно". Убедитесь, что приложение отправляет правильные сигналы работоспособности в указанную конечную точку.

Дополнительные сведения об ожидаемых ответах TCP/HTTP(S) для проб работоспособности подсистемы балансировки нагрузки см. в разделе Load Balancer пользовательские пробы.

Дополнительные сведения об ожидаемых ответах TCP/HTTP(S) для проб расширения работоспособности приложений см. в разделе "Настройка конечной точки для предоставления состояния работоспособности" статьи Требования к использованию автоматического восстановления экземпляров.

Экземпляр помечен как неработоспособный из-за сбоя подготовки

Используйте представление get instance с API версии 2019-12-01 или более поздней для VMSS, чтобы просмотреть состояние подготовки экземпляров statusesSummary в свойстве virtualMachine .

API REST

GET '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}/instanceView?api-version=2019-12-01'
"virtualMachine": {
        "statusesSummary": [
            {
                "code": "ProvisioningState/succeeded",
                "count": 2
            }
        ]
}

Если у вас есть ProvisioningState/failed код в statusesSummary, удалите экземпляр со сбоем и добавьте новый экземпляр в масштабируемый набор. Восстановление экземпляров в настоящее время не поддерживает сценарии, в которых виртуальная машина помечена как неработоспособная из-за сбоя подготовки.

Чтобы удалить неудачный экземпляр из масштабируемого набора, см. статью Удаление виртуальных машин из масштабируемого набора.

Сведения о добавлении нового экземпляра в масштабируемый набор см. в статье Изменение емкости масштабируемого набора.

Автоматическое восстановление приостановлено в масштабируемом наборе из-за слишком большого количества неудачных исправлений

Если приложение продолжает выдавать сигнал "Неработоспособен" после повторных попыток восстановления, платформа в конечном итоге приостановит восстановление экземпляров в качестве меры безопасности, изменив значение для автоматического serviceState восстановления на Suspended.

Подтвердите serviceState политику автоматического восстановления. Для этого см. статью Просмотр и обновление состояния службы политики автоматического восстановления экземпляров.

serviceState Если имеет значение Suspended, возобновите автоматическое исправление, обновив serviceState обратно до Running с помощью setOrchestrationServiceState примеров API и командлетов в разделе Просмотр и обновление состояния службы политики автоматического восстановления экземпляров.

Экземпляр находится в периоде отсрочки

Если ни одна из указанных выше причин не применима к проблеме, экземпляр может находиться в периоде отсрочки.

Льготный период — это время, в течение которого автоматическое восстановление будет ожидать после изменения состояния экземпляра перед выполнением исправлений, что помогает избежать преждевременных или случайных исправлений. Действие восстановления должно выполняться после завершения льготного периода для экземпляра. Дополнительные сведения о настройке льготного периода для автоматического восстановления см. в разделе Льготный период.

Свяжитесь с нами для получения помощи

Если у вас есть вопросы или вам нужна помощь, создайте запрос в службу поддержки или обратитесь за поддержкой сообщества Azure. Вы также можете отправить отзыв о продукте в сообщество отзывов Azure.