Резервное копирование и аварийное восстановление для управляемых дисков Azure

Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Гибкие масштабируемые наборы

В этой статье объясняется планирование архивации и аварийного восстановления для управляемых дисков Azure. В ней представлена встроенная избыточность Azure и некоторые распространенные типы сбоев. После этого он охватывает типичные сценарии резервного копирования и аварийного восстановления. Наконец, он сравнивает каждый вариант резервного копирования и аварийного восстановления для управляемых дисков Azure.

Встроенные параметры избыточности Azure

Управляемые диски Azure имеют два встроенных варианта избыточности для защиты данных от сбоев:

  • Локально избыточное хранилище (LRS) реплицирует данные три раза в одном центре обработки данных в определенном регионе. LRS защищает ваши данные от сбоев в стойках сервера и на дисках.
  • Хранилище, избыточное между зонами (ZRS), обеспечивает синхронную репликацию данных между зонами в регионе, что позволяет дискам допускать зональные сбои, которые могут возникать из-за стихийных бедствий или проблем с оборудованием.

Однако крупные аварии (например, землетрясения, пожары или ураганы) могут привести к сбоям или недоступности крупномасштабных серверов хранения, иногда влияя на весь центр обработки данных или зону (влияющие на диски LRS), или целый регион (влияющие на диски ZRS). Помимо сбоев платформы, могут возникнуть проблемы с приложением или данными (например, случайное удаление и атака программ-шантажистов). При этом может потребоваться вернуть приложение и данные до предыдущей версии, содержащей последнее известное хорошее состояние. Для восстановления хорошего состояния требуется регулярное резервное копирование.

Чтобы защитить рабочие нагрузки IaaS от сбоев, запланируйте избыточность и создайте регулярные резервные копии. Чтобы защитить рабочие нагрузки IaaS от региональных аварий, создайте резервные копии в другом географическом расположении, отличном от основного сайта. Это гарантирует, что резервные копии не влияют на те же события, которые повлияли на другие ресурсы. Дополнительные сведения см. в разделе "Аварийное восстановление" для приложение Azure.

Сценарии резервного копирования и аварийного восстановления

Рассмотрим несколько примеров сценариев рабочей нагрузки приложений и вещей, которые следует учитывать при планировании резервного копирования и аварийного восстановления.

Сценарий 1. Решения для крупных баз данных

В этом сценарии у вас есть рабочий сервер базы данных (например, SQL Server и Oracle), поддерживающий высокий уровень доступности. От этой базы данных зависят критически важные рабочие приложения и пользователи. План аварийного восстановления для этой системы должен включать следующие требования:

  • Данные должны быть защищены и иметь возможность восстановления.
  • Сервер должен быть доступен для использования.
  • (Необязательно) Реплика базы данных в другом регионе в качестве резервной копии

В зависимости от требований к доступности сервера и восстановлению данных решения могут варьироваться от сайта реплики "активный— активный" или "активный- пассивный" до периодических автономных резервных копий данных. Реляционные базы данных, такие как SQL Server и Oracle, предоставляют различные варианты репликации. Для обеспечения высокого уровня доступности в SQL Server используйте группы доступности Always On (SQL Server).

Для обеспечения избыточности в базах данных NoSQL, таких как MongoDB, также поддерживаются реплики. Реплики используются для обеспечения высокого уровня доступности.

Сценарий 2. Кластер избыточных виртуальных машин

В этом сценарии у вас есть рабочая нагрузка, обрабатываемая кластером виртуальных машин, которые обеспечивают избыточность и балансировку нагрузки, например кластер Cassandra, развернутый в регионе. Этот тип архитектуры уже обеспечивает высокий уровень избыточности в этом регионе. Однако чтобы защитить рабочую нагрузку от сбоя регионального уровня, рассмотрите возможность распространения кластера между двумя регионами или периодического резервного копирования в другой регион.

Сценарий 3. Рабочая нагрузка приложения IaaS

В этом сценарии у вас есть приложение с типичной рабочей рабочей нагрузкой, работающей на виртуальной машине Azure (рабочая нагрузка приложения IaaS). Это может быть веб-сервер или файловый сервер, содержащий содержимое и другие ресурсы сайта, или пользовательское бизнес-приложение, работающее на виртуальной машине, которая хранит свои данные, ресурсы и состояние приложения на дисках виртуальной машины. В этом случае важно регулярно создавать резервные копии. Интервал архивации зависит от характера рабочей нагрузки на виртуальной машине. Например, если приложение выполняет ежедневно и изменяет данные, резервное копирование должно выполняться почасово.

Другой распространенный сценарий включает в себя сервер отчетов, который извлекает данные из других источников и создает агрегированные отчеты. Потеря этой виртуальной машины или дисков может привести к потере отчетов. Однако можно повторно создать выходные данные, повторно выполнив процесс создания отчетов. В этом случае вы не испытываете потери данных, даже если сервер отчетов пострадал от аварии. Таким образом, у вас есть более высокий уровень терпимости к потере части данных на сервере отчетов. В этом случае при принятии резервных копий реже будет снижена стоимость.

Сценарий 4. Проблемы с данными для приложения IaaS

В случае проблем с данными для приложения IaaS стоит рассмотреть другие возможности. Рассмотрим приложение, которое вычисляет, хранит и обслуживает критически важные коммерческие данные, такие как сведения о ценах. В новой версии приложения была допущена ошибка в программном обеспечении, из-за которой цены были вычислены неправильно и существующие коммерческие данные платформы были повреждены. Оптимальным вариантом действий в таком случае является возврат к более ранней версии приложения и данных. Чтобы этот вариант стал возможным, включите периодическую архивацию системы.

Решения для резервного копирования и аварийного восстановления

Обзор сравнения

В этом разделе рассматриваются некоторые варианты Azure для резервного копирования и аварийного восстановления. Вы можете ознакомиться со следующей таблицей сравнения, чтобы получить общие сведения о высоком уровне.

Решение Снимок Точки восстановления Azure Backup Azure Site Recovery
Description Моментальный снимок — это готовая копия диска, который можно использовать для резервного копирования. Точки восстановления можно использовать для реализации детализированной резервной копии всех дисков, подключенных к виртуальной машине. Azure Backup — это полностью управляемая служба Azure, обеспечивая простое, безопасное и экономичное решение для резервного копирования данных и его восстановления. Azure Site Recovery помогает обеспечить непрерывность бизнес-процессов вашей организации путем сохранения приложений и рабочих нагрузок во время сбоя.
Добавочное резервное копирование Да Да Да Да
Копирование между регионами Да Доступно в общедоступной предварительной версии Да, при резервном копировании виртуальных машин Azure Да
Цены См. цены на диски Azure Н/П Сведения о затратах на резервное копирование виртуальных машин Azure или локальных серверов См. цены на Azure Site Recovery
Обслуживание операций Высокий Средний Низкий Низкая
Основные преимущества Наиболее экономичный, подходящий для резервного копирования дисков Резервное копирование дисков на уровне виртуальной машины, согласованность приложений для виртуальных машин под управлением ОС Windows, согласованности файловой системы для виртуальных машин под управлением ОС Linux Частое и быстрое резервное копирование без прерывания виртуальной машины, настраиваемой политики резервного копирования, решения без агента Простое решение BCDR, обеспечение согласованности приложений при отработки отказа, оркестрация репликации без перехвата данных приложения

Моментальные снимки

Моментальный снимок — это копия диска только для чтения. Моментальный снимок можно сделать в любое время. Моментальные снимки существуют независимо от исходного диска и могут использоваться только для создания новых управляемых дисков. Их нельзя использовать для изменения состояния существующего диска. Кроме того, можно использовать добавочные моментальные снимки для периодического добавочного резервного копирования управляемых дисков.

Как правило, следует использовать добавочные моментальные снимки для резервного копирования и аварийного восстановления, так как они снижают затраты и обеспечивают более быстрое время восстановления. Добавочные моментальные снимки — это резервные копии управляемых дисков на определенный момент времени, которые содержат только изменения, внесенные с момента создания предыдущего моментального снимка. Первый добавочный моментальный снимок — это полная копия диска. Все добавочные моментальные снимки после первого из них состоят только из изменений диска с момента последнего моментального снимка. При создании диска из моментального снимка система восстанавливает полный диск, представляющий моментальную резервную копию диска при создании добавочного моментального снимка. Кроме того , можно скопировать добавочный моментальный снимок в новый регион для аварийного восстановления.

Механизмы резервного копирования можно реализовать с помощью моментальных снимков. Для этого необходимо создать согласованные моментальные снимки для всех дисков, используемых виртуальной машиной, а затем реплицировать их в другой регион. Возможность создания согласованных резервных копий с моментальным снимком — завершение работы виртуальной машины и создание моментальных снимков каждого диска. Если приложения, работающие на виртуальной машине, могут приостановить операции ввода-вывода, следует воспользоваться приостановкой работы, а затем создать моментальные снимки всех дисков, подключенных к виртуальным машинам. Этот вариант проще, чем создание координированных моментальных снимков работающей виртуальной машины, но для его выполнения потребуется несколько минут простоя.

Вы можете сделать моментальный снимок в любое время, но если во время работы виртуальной машины выполняется моментальный снимок, имейте в виду следующее:

  • При запуске виртуальной машины данные по-прежнему передаются на диски. В результате моментальные снимки запущенной виртуальной машины могут содержать частичные операции, которые находились в тестовом режиме.
  • При наличии нескольких дисков, участвующих в виртуальной машине, могут возникать моментальные снимки разных дисков.

В описанном сценарии моментальные снимки не были согласованы. Это отсутствие координации является проблемой для полосатых томов, файлы которых могут быть повреждены, если изменения были сделаны во время резервной копии. Поэтому процесс резервного копирования должен реализовать следующие действия:

  1. Заморозить все диски.
  2. Очистить все ожидающие операции записи.
  3. Создайте добавочный моментальный снимок для всех управляемых дисков.

Некоторые приложения Windows, такие как SQL Server, предоставляют согласованный механизм резервного копирования с помощью теневой службы томов для создания резервных копий, согласованных с приложениями. В Linux можно использовать такое средство, как fsfreeze, для координации дисков (это средство предоставляет согласованные с файлами резервные копии, а не моментальные снимки, согласованные с приложениями). Эта процедура резервного копирования сложна, поэтому следует рассмотреть общие сведения о резервном копировании дисков Azure или стороннем решении резервного копирования, которое уже реализует эту процедуру. Это приведет к сбору координированных моментальных снимков для всех дисков виртуальных машин, представляющего определенное представление виртуальной машины на определенный момент времени. Другими словами, точка восстановления резервного копирования для виртуальной машины. Процесс можно повторить через запланированные промежутки времени, чтобы создать периодические архивы.

Точки восстановления

Точки восстановления виртуальных машин Azure можно использовать для реализации подробных политик резервного копирования и хранения всех дисков, подключенных к виртуальной машине. Отдельная точка восстановления виртуальных машин — это ресурс, который хранит конфигурацию виртуальной машины и согласованные моментальные снимки приложений на определенный момент времени всех управляемых дисков, подключенных к виртуальной машине. Точки восстановления виртуальных машин можно использовать для легкой записи резервных копий всех дисков, подключенных к виртуальной машине, с несколькими дисками.

Точки восстановления имеют три уровня иерархии: сбор точек восстановления виртуальных машин, точек восстановления виртуальной машины и точек восстановления диска:

  • Уровень 1. Точки восстановления виртуальных машин организованы в коллекции точек восстановления. Коллекция точек восстановления — это ресурс управления ресурсами Azure, содержащий точки восстановления для конкретной виртуальной машины.
  • Уровень 2. Точки восстановления виртуальной машины содержат точку восстановления диска для каждого подключенного диска.
  • Уровень 3. Точка восстановления диска состоит из моментального снимка отдельного управляемого диска.

Точки восстановления являются добавочными. Первая точка восстановления сохраняет полную копию всех дисков, подключенных к виртуальной машине, в то время как последовательная точка восстановления содержит только добавочные изменения дисков виртуальных машин. С помощью точек восстановления можно:

  • Скопируйте точки восстановления виртуальной машины между регионами, восстановите виртуальные машины в другом регионе, отличном от исходной виртуальной машины, и отслеживайте ход выполнения операции копирования.
  • Создайте диски с помощью точек восстановления дисков и получите подписанный URL-адрес для диска. Затем эти диски можно использовать для создания новой виртуальной машины.

Дополнительные сведения о создании точек восстановления виртуальной машины и управлении точками восстановления виртуальной машины см. в следующих статьях.

Azure Backup

Azure Backup предоставляет простые, безопасные и экономичные решения для резервного копирования данных и его восстановления из Azure. Резервное копирование дисков Azure — это собственное облачное решение резервного копирования , которое защищает данные на управляемых дисках. Это простое, безопасное и экономичное решение для настройки защиты управляемых дисков за несколько шагов. Это гарантирует защиту данных в случае аварии.

Служба архивации дисков Azure предлагает готовое решение, которое обеспечивает управление жизненным циклом моментальных снимков для управляемых дисков, автоматив периодическое создание моментальных снимков и сохраняя его в течение длительного времени, используя политику резервного копирования. Вы можете управлять моментальными снимками дисков без затрат на инфраструктуру, без необходимости пользовательского скрипта или каких-либо затрат на управление.

Резервное копирование дисков Azure — это решение резервного копирования, согласованное с аварийной архивацией, которое выполняет резервное копирование управляемого диска с помощью добавочных моментальных снимков и поддерживает несколько резервных копий в день. Это также решение без агента и не влияет на производительность рабочего приложения. Она поддерживает резервное копирование и восстановление дисков ОС и данных (включая общие диски), независимо от того, подключены ли они к работающей виртуальной машине Azure или нет.

Служба резервного копирования дисков Azure интегрирована в Центр резервного копирования, который предоставляет единый унифицированный интерфейс управления в Azure для предприятий, позволяющий отслеживать, использовать, анализировать резервные копии и управлять ими в большом масштабе. Если требуется согласованное с приложением резервное копирование виртуальной машины, включая диски данных, или возможность восстановления всей виртуальной машины из резервной копии, восстановления файла или папки или восстановления в дополнительном регионе используйте решение резервного копирования виртуальных машин Azure. Если вы не можете использовать Azure Backup, вы можете реализовать собственный механизм резервного копирования с помощью моментальных снимков. Но создание согласованных моментальных снимков для всех дисков, используемых виртуальной машиной, репликация этих моментальных снимков в другой регион и постоянное управление этим процессом является сложным и трудоемким.

Azure Site Recovery

Azure Site Recovery помогает обеспечить непрерывность бизнес-процессов вашей организации, сохраняя приложения и рабочие нагрузки, выполняемые во время сбоя. Это платная полностью управляемая служба, помогая достичь стратегии непрерывности бизнес-процессов и аварийного восстановления (BCDR).

Azure Site Recovery реплицирует рабочие нагрузки, выполняемые на физических и виртуальных машинах из первичного сайта в дополнительное расположение. При сбое на основном сайте отработка отказа рабочей нагрузки в дополнительное расположение и доступ к ней можно получить. После повторного запуска основного расположения рабочие нагрузки могут вернуться к нему.

Вы можете легко настроить аварийное восстановление в дополнительном регионе Azure с помощью нескольких шагов. Azure Site Recovery обеспечивает множество сценариев аварийного восстановления— Azure в Azure, VMware в Azure, физическое в Azure, виртуальную машину Azure Stack, Hyper-V в Azure, аварийное восстановление приложений, аварийное восстановление на дополнительный сайт. Полный список преимуществ, предоставляемых Azure Site Recovery, см. в статье "Сведения о Site Recovery".

Другие варианты

SQL Server, запущенный на виртуальной машине, имеет собственные встроенные функции для архивации базы данных SQL Server в хранилище BLOB-объектов Azure или в общую папку. Дополнительные сведения см. в статье Резервное копирование и восстановление SQL Server в виртуальных машинах Azure. Кроме резервного копирования и восстановления, группы доступности SQL Server Always On поддерживают вторичные реплики баз данных, что позволяет существенно сократить время восстановления после сбоя.

Следующие шаги

Изучите варианты: