Общие сведения о реплике хранилища
Реплика хранилища — это технология Windows Server, которая обеспечивает репликацию томов между серверами или кластерами для аварийного восстановления. Он также позволяет создавать отказоустойчивые кластеры растяжения, охватывающие два сайта, при этом все узлы остаются в синхронизации.
Реплика хранилища поддерживает синхронную и асинхронную репликацию:
- Синхронная репликация зеркально отображает данные на сетевом сайте, обладающем небольшой задержкой, с отказоустойчивыми томами, что полностью предотвращает потерю данных на уровне файловой системы в случае сбоя.
- Асинхронная репликация зеркально отображает данные на сайтах за пределами городской сети через соединения с большей задержкой, но не гарантирует наличие одинаковых копий данных на обоих сайтах во время сбоя.
В чем преимущества реплики хранилища?
Реплика хранилища предоставляет возможности аварийного восстановления и готовности в Windows Server. Windows Server обеспечивает спокойствие нулевой потери данных с возможностью синхронно защищать данные на разных стойких, этажах, зданиях, кампусах, округах и городах. После аварии все данные существуют в другом месте без возможности потери. Кроме того, с помощью реплики хранилища при обнаружении определенных неполадок пользователи могут переместить рабочие нагрузки в безопасное расположение до сбоя, опять-таки без потери данных.
Реплика хранилища обеспечивает более эффективное использование нескольких центров обработки данных. Благодаря растягиванию и репликации кластеров рабочие нагрузки можно распределять по нескольким центрам обработки данных, что, в свою очередь, обеспечивает более быстрый доступ к данным локальных пользователей и приложениям, а также оптимизирует распределение нагрузки и использование вычислительных ресурсов. Если центр обработки данных выйдет из строя, его обычные рабочие нагрузки можно временно переместить на другой сайт.
Реплика хранилища позволяет списать текущие системы репликации файлов, такие как репликация DFS, которые считаются низкопроизводительными решениями аварийного восстановления. Хотя репликация DFS хорошо работает над сетями с низкой пропускной способностью, ее задержка высока - часто измеряется в часах или днях. Это связано с тем, что выполняется репликация только закрытых файлов, а также с искусственным механизмом регулирования, направленным на предотвращение перегрузки сети. Из-за этих особенностей проектирования репликация самых новых и часто используемых файлов в системе репликации DFS не выполняется. Репликация хранилища выполняется ниже уровня файла и не имеет этих ограничений.
Кроме того, реплика хранилища поддерживает асинхронную репликацию, которая подходит для сетей с более длительными задержками и большим диапазоном номеров. Так как он не основан на контрольной точке, и вместо этого непрерывно реплицируется, разность изменений, как правило, значительно ниже, чем продукты на основе моментальных снимков. Реплика хранилища работает на уровне секции и, следовательно, реплицирует все моментальные снимки VSS, созданные Windows Server или программным обеспечением резервного копирования. С помощью моментальных снимков VSS он позволяет использовать моментальные снимки данных, согласованные с приложениями, для восстановления на определенный момент времени, особенно неструктурированных пользовательских данных, реплицируемых асинхронно.
Поддерживаемые конфигурации
Вы можете развернуть реплику хранилища в растянутом кластере между кластером и кластером в конфигурациях между серверами и серверами (см. рис. 1–3).
Растянутый кластер позволяет выполнять настройку компьютеров и хранилища в одном кластере, где некоторые узлы используют один общий набор асимметричного хранилища, а остальные — другой, после чего выполняется синхронная или асинхронная репликация с функцией доступности информации о сайте. В этом сценарии можно использовать дисковые пространства с общим хранилищем SAS, SAN и присоединенные к iSCSI номера LUN. Он управляется с помощью PowerShell и графического средства диспетчера отказоустойчивости кластеров и позволяет выполнять автоматическую отработку отказа рабочей нагрузки.
РИС. 1. Репликация хранилища в растянутом кластере с помощью реплики хранилища
Межкластерная репликация позволяет выполнять синхронную или асинхронную репликацию между двумя отдельными кластерами. В этом сценарии можно использовать локальные дисковые пространства, дисковые пространства с общим хранилищем SAS, SAN и присоединенные к iSCSI номера LUN. Он управляется с помощью Windows Admin Center и PowerShell и требует ручного вмешательства для отработки отказа.
РИС. 2. Репликация хранилища между кластерами с помощью реплики хранилища
Межсерверная репликация позволяет выполнять синхронную или асинхронную репликацию между двумя изолированными серверами, используя дисковые пространства с общим хранилищем SAS, SAN, присоединенные к iSCSI номера LUN, а также локальные диски. Он управляется с помощью Windows Admin Center и PowerShell и требует ручного вмешательства для отработки отказа.
РИС. 3. Репликация хранилища между серверами с помощью реплики хранилища
Примечание.
Кроме того, репликацию можно настроить между четырьмя отдельными томами. Но в этом руководстве такой сценарий не рассматривается.
Возможности реплики хранилища
Полная защита от потери данных, репликация на уровне блоков. При синхронной репликации нет возможности потери данных. При блочной репликации блокировка файлов невозможна.
Удобное развертывание и управление. Реплика хранилища предназначена для простоты использования. Создание партнерства репликации между двумя серверами может использовать Центр администрирования Windows. Развертывание растянутых кластеров осуществляется с помощью интуитивно понятного мастера в знакомом диспетчере отказоустойчивости кластеров.
Гость и узел. Все возможности реплики хранилища можно использовать и в виртуализированных гостевых развертываниях, и в развертываниях на основе узла. Это означает, что гости могут реплицировать тома данных, даже если они работают на платформах виртуализации, отличных от Windows, или в общедоступных облаках, если используется Windows Server в гостевой среде.
Репликация на основе SMB 3. Реплика хранилища использует проверенную и отработанную технологию SMB 3, впервые представленную в Windows Server 2012. Это означает, что в реплике хранилища доступны все расширенные возможности SMB, такие как непосредственная поддержка нескольких каналов и SMB в сетевых RDMA-адаптерах RoCE, iWARP и InfiniBand.
Безопасность. В отличие от продуктов множества поставщиков в реплике хранилища реализована ведущая в отрасли технология безопасности. Сюда входит подписывание пакетов, полное шифрование данных AES-128-GCM, поддержка ускорения шифрования Intel AES-NI и предварительной проверки подлинности с целью предотвращения атак "злоумышленник внутри". Для проверки подлинности между узлами реплика хранилища использует Kerberos AES256.
Высокая производительность начальной синхронизации. Реплика хранилища поддерживает начальную синхронизацию с начальной синхронизацией, где подмножество данных уже существует на целевом объекте из старых копий, резервных копий или отправленных дисков. Начальная репликация копирует только различные блоки, потенциально сокращая время начальной синхронизации и предотвращая использование ограниченной пропускной способности данных. Агрегирование и расчет контрольной суммы блока реплики хранилища показывает, что производительность начальной синхронизации зависит только от скорости хранилища и сети.
Группы согласованности. Порядок записи гарантирует, что такие приложения, как Microsoft SQL Server, могут записываться в несколько реплицированных томов и знать, что данные записываются на целевом сервере последовательно.
Делегирование пользователя. Пользователям могут предоставляться права на управление репликацией. При этом им не обязательно быть участниками встроенной группы администраторов на реплицированных узлах. Доступ этих пользователей к несвязанным областям ограничен.
Ограничение сети. Чтобы обеспечить достаточную пропускную способность для приложения, ПО для резервного копирования и управления, серверы и реплицированные тома могут позволять использование реплики хранилища лишь в отдельных сетях.
Тонкая подготовка. Поддержка тонкой подготовки в дисковые пространства и устройствах SAN поддерживается для обеспечения практически мгновенной начальной репликации во многих случаях. После запуска начальной репликации том не сможет уменьшить или обрезать
Сжатие. Реплика хранилища обеспечивает сжатие данных, передаваемых по сети между исходным и целевым сервером. Сжатие реплики хранилища для передачи данных поддерживается только в Центре обработки данных Windows Server: выпуск Azure, начиная с сборки ОС 20348.1070 и более поздних версий (KB5017381).
Реплика хранилища включает следующие функции:
Функция | Подробности |
---|---|
Тип | На основе узла |
Синхронная | Да |
Асинхронный | Да |
Независимость от оборудования для хранения данных | Да |
Единица репликации | Том (раздел) |
Создание растянутого кластера Windows Server | Да |
Межсерверная репликация | Да |
Межкластерная репликация | Да |
Транспорт | SMB 3 |
Network | TCP/IP или RDMA |
Поддержка ограничения сети | Да |
Сжатие в сети | Да** |
RDMA* | iWARP, InfiniBand, RoCE v2 |
Требования к брандмауэру сетевого порта репликации | Один порт IANA (TCP 445 или TCP 5445) |
Поддержка нескольких путей или каналов | Да (SMB 3) |
Поддержка Kerberos | Да (SMB 3) |
Шифрование и подписывание Over-the-Wire | Да (SMB 3) |
Отработка отказа для каждого тома | Да |
Поддержка хранилища с тонкой подготовкой | Да |
Встроенный пользовательский интерфейс управления | PowerShell, диспетчер отказоустойчивости кластеров |
* Может потребоваться оборудование для работы на длинных расстояниях и кабели. **При использовании Центра обработки данных Windows Server: Выпуск Azure, начиная с сборки ОС 20348.1070
Предварительные требования для реплики хранилища
Лес доменных служб Active Directory.
Дисковые пространства с JBOD SAS, локальные дисковые пространства, сеть SAN Fibre Channel, общий VHDX, конечный объект iSCSI или локальное хранилище SAS/SCSI/SATA. SSD или более быстрый накопитель для хранения журналов репликации. Корпорация Майкрософт рекомендует быстрее хранить журналы, чем хранилище данных. Тома журнала никогда не должны использоваться для других рабочих нагрузок.
На каждом сервере должно быть создано по меньшей мере одно подключение Ethernet/TCP для синхронной репликации, но желательно использовать RDMA.
По крайней мере 2 ГБ ОЗУ и два ядра на сервер.
Сеть между серверами с достаточной пропускной способностью для хранения рабочей нагрузки записи ввода-вывода и в среднем 5 мс задержки кругового пути или ниже для синхронной репликации. Асинхронная репликация не имеет рекомендации по задержке.
Windows Server, Datacenter Edition или Windows Server, выпуск Standard. Реплика хранилища, запущенная в Windows Server, выпуск Standard, имеет следующие ограничения:
- Необходимо использовать Windows Server 2019 или более поздней версии
- Реплика хранилища реплицирует один том вместо неограниченного количества томов.
- Тома могут иметь размер до 2 ТБ вместо неограниченного размера.
Общие сведения
Этот раздел содержит сведения о высокоуровневой отраслевой терминологии, синхронной и асинхронной репликации, а также основных вариантах поведения.
Высокоуровневые отраслевые термины
Аварийное восстановление — способ восстановления работоспособности после сбоя сайта для продолжения работы бизнес-процессов. Такой метод предусматривает сохранение нескольких копий рабочих данных в отдельных физических расположениях. Примером может выступать растянутый кластер, где половина узлов расположена на одном сайте, а остальные — на другом. Готовность к аварийным ситуациям — план заблаговременного переноса рабочих нагрузок в другое расположение до возникновения чрезвычайного происшествия, например урагана.
Соглашения об уровне обслуживания (SLA) — определяют доступность бизнес-приложений, а также допустимое время простоя и потерю данных в рамках планированных и незапланированных простоев. Целевое время восстановления (RTO) — определяет допустимое общее время недоступности бизнес-данных. Целевая точка восстановления — определяет допустимый объем потерь бизнес-данных.
Синхронная репликация
Синхронная репликация гарантирует, что приложение записывает данные в два расположения одновременно до завершения операции ввода-вывода. Эта репликация подходит для критически важных данных, так как для нее требуются инвестиции в сеть и хранилище, а также снижается производительность приложений, необходимых для выполнения операций записи в двух расположениях.
Когда приложение выполняет запись в исходном копировании данных, исходное хранилище не подтверждает операции ввода-вывода немедленно. Вместо этого эти изменения данных реплицируются в удаленное целевое копирование и возвращают подтверждение. Только после этого приложение получает подтверждение операции ввода–вывода. Это гарантирует постоянную синхронизацию удаленного и исходного сайтов, в результате чего в сети расширяются операции ввода–вывода для хранилища. В случае сбоя исходного сайта приложения могут выполнить отработку отказа на удаленный сайт и возобновить свои операции с гарантией нулевой потери данных.
Режим | Схема | Шаги |
---|---|---|
Синхронный Полная защита от потери данных RPO |
1. Приложение записывает данные 2. Данные журнала записываются и данные реплицируются на удаленный сайт. 3. Данные журнала записываются на удаленном сайте 4. Подтверждение с удаленного сайта 5. Подтверждение записи приложения Данные записываются в том, для журналов применяется сквозная запись. |
Асинхронная репликация
В процессе асинхронной репликации записанные приложением данные реплицируются на удаленный сайт без каких-либо гарантий немедленного подтверждения. Этот режим позволяет ускорить время отклика в приложении и решение аварийного восстановления, которое работает географически.
Когда приложение записывает данные, модуль репликации получает данные и немедленно отправляет подтверждение в приложение. Полученные данные затем реплицируются в удаленное расположение. Удаленный узел обрабатывает копию данных и "лениво" подтверждает исходную копию. Так как производительность репликации больше не зависит от пути операции ввода–вывода приложения, скорость реагирования и расстояние удаленного сайта не столь важны. Существует риск потери данных, если исходные данные потеряны, а целевая копия данных по-прежнему находится в буфере, не покидая источник.
Благодаря более высокому нулю RPO асинхронная репликация менее подходит для решений высокой доступности, таких как отказоустойчивые кластеры, так как они предназначены для непрерывной работы с избыточностью и без потери данных.
Режим | Схема | Шаги |
---|---|---|
Асинхронный Практически нулевая потеря данных (зависит от нескольких факторов) RPO |
1. Приложение записывает данные 2. Данные журнала, записанные 3. Подтверждение записи приложения 4. Данные, реплицированные на удаленный сайт 5. Данные журнала, записанные на удаленном сайте 6. Подтверждение с удаленного сайта Данные записываются в том, для журналов применяется сквозная запись. |
Ключевые точки оценки и поведение
Пропускная способность и задержка при использовании самого быстрого хранилища. Синхронная репликация сопряжена с определенными физическими ограничениями. Так как за счет журналов и требуемых полных обходов сети реплика хранилища реализует механизм фильтрации операций ввода-вывода, при синхронной репликации приложение записывает данные медленнее. Используя низкую задержку, сети с высокой пропускной способностью и подсистемы дисков с высокой пропускной способностью для журналов, вы минимизируете нагрузку на производительность.
Конечный том недоступен при репликации в Windows Server 2016. При настройке репликации конечный том отключен, что делает его недоступным для любых операций чтения или записи пользователями. Его буква драйвера может отображаться в типичных интерфейсах, таких как проводник, но приложение не может получить доступ к самому тому. Технологии репликации на уровне блоков несовместимы с разрешением доступа к подключенной файловой системе целевого объекта в томе. NTFS и ReFS не поддерживают запись данных в том, пока блоки изменяются под ними.
Командлет Test-Failover дебютировал в Windows Server версии 1709 и также был включен в Windows Server 2019. Теперь это поддерживает временное подключение моментального снимка для чтения и записи целевого тома для резервных копий, тестирования и т. д. Дополнительные сведения см. в статье "Часто задаваемые вопросы о реплике хранилища".
Реализация асинхронной репликации Microsoft отличается от остальных. Большинство отраслевых реализаций асинхронной репликации основаны на моментальных снимках, где периодические разностные операции обмена данными перемещаются на узел и объединяются. Асинхронная репликация реплики хранилища выполняется подобно синхронной репликации. Разница заключается в том, что для этого типа репликации не требуется последовательное синхронное подтверждение от цели. Таким образом, за счет непрерывной репликации реплика хранилища теоретически имеет более низкое значение целевой точки восстановления. Это также означает, что она основана на внутренних гарантиях согласованности приложения, а не на использовании моментальных снимков для инициации согласованности в файлах приложения. Реплика хранилища обеспечивает отказоустойчивость во всех режимах репликации.
Многие клиенты используют репликацию DFS в качестве решения аварийного восстановления, хотя часто нецелесообразно для этого сценария. Репликация DFS не может реплицировать открытые файлы и предназначена для минимизации использования пропускной способности за счет производительности, что приводит к большим разностным точкам восстановления. Реплика хранилища позволяет снять некоторые обязанности по аварийному восстановлению с системы репликации DFS.
Реплика хранилища не является решением резервного копирования. Некоторые ИТ-среды развертывают системы репликации в качестве решений резервного копирования. Это связано с тем, что системы репликации обеспечивают полную защиту от потери данных по сравнению с ежедневным резервным копированием. Вне зависимости от типа изменений реплика хранилища реплицирует все изменения во все блоки данных на томе. Если пользователь удаляет все данные из тома, реплика хранилища мгновенно реплицирует удаление в другой том, безвозвратно удалив данные с обоих серверов. Не используйте реплику хранилища в качестве замены для решения резервного копирования на определенный момент времени.
Реплика хранилища не является репликой Hyper-V или группами доступности Microsoft SQL AlwaysOn. Реплика хранилища — это независимый от хранилища модуль общего назначения. По определению он не может адаптировать его поведение как идеально, как репликация на уровне приложения. В результате вы не сможете выполнять определенные возможности, что вынудит вас развернуть или продолжить использовать определенные технологии репликации приложения.
Примечание.
В этом документе содержится список известных проблем и ожидаемого поведения, а также приведены ответы на часто задаваемые вопросы.
Терминология по реплике хранилища
В этом руководстве часто используются следующие термины:
Источник — том на компьютере, позволяющий выполнять локальные операции записи и репликацию исходящих данных (также называется "первичным").
Назначение — это том компьютера, который не разрешает локальную запись и реплицирует входящие данные. (также называется "вторичным").
Связь репликации — связь синхронизации между исходным и конечным компьютерами для одного или нескольких томов, при которой используется один журнал.
Группа репликации — группа томов и соответствующая конфигурация репликации в рамках связи на каждом сервере. Группа может состоять из одного или нескольких томов.
Новые возможности реплики хранилища
Список новых функций реплики хранилища в Windows Server 2019 см. в статье "Новые возможности в хранилище"