Optymalizowanie ciągłości działania i odzyskiwania po awarii

Podczas migracji zasobów Oracle na platformę Azure należy wziąć pod uwagę niezawodność bazy danych, a także niezawodność warstw na maszynach wirtualnych, podsieciach sieci wirtualnej i składnikach magazynu.

Oracle on Azure infrastructure as a service (IaaS) może spełnić wymagane cele odporności najbardziej wymagających obciążeń Oracle. Aby skutecznie użyć wskazówek w tym artykule, najpierw zdefiniuj kluczowe wskaźniki wydajności (KPI) odporności na podstawie wymagań biznesowych. Użyj wymagań celu czasu odzyskiwania (RTO) i celu punktu odzyskiwania (RPO) jako kluczowych wskaźników wydajności punktu odzyskiwania, aby określić najlepszą architekturę dla obciążenia Oracle na platformie Azure.

Cel czasu odzyskiwania to maksymalny czas niedostępności aplikacji po awarii, awarii lub porównywalnego zdarzenia.

Cel punktu odzyskiwania to maksymalna ilość utraty danych po awarii, awarii lub porównywalnego zdarzenia.

Metody tworzenia kopii zapasowych na potrzeby ochrony danych

Trzy metody tworzenia kopii zapasowych bazy danych Oracle dla obciążenia Oracle w usłudze Azure IaaS obejmują:

  • Przesyłanie strumieniowe kopii zapasowych. Użyj programu Oracle Recovery Manager (RMAN) dla tej metody. Funkcja RMAN przesyła kopie zapasowe na nośniki taśm sekwencyjnych.

    Miejsca docelowe kopii zapasowych na platformie Azure obejmują:

    • Biblioteki taśm wirtualnych innych firm, które można znaleźć w witrynie Azure Marketplace.
    • Lokalne i zdalne udziały plików, takie jak Usługa Azure Blob Storage z protokołem sieciowego systemu plików, usługą Azure Files i usługą Azure NetApp Files.
  • Migawki na poziomie magazynu. Użyj usługi Azure Backup dla tej metody. Ta metoda opiera się na typie magazynu używanego dla plików bazy danych. Jeśli na przykład używasz dysków zarządzanych platformy Azure, takich jak azure SSD w warstwie Premium, usługa Azure Backup integruje się z bazą danych Oracle. Jeśli używasz usługi Azure NetApp Files, możesz użyć funkcji ochrony danych usługi Azure NetApp Files, takich jak tworzenie kopii zapasowych usługi Azure NetApp Files i replikacja między regionami.

  • Kopie zapasowe na poziomie maszyny wirtualnej. Użyj usługi Azure Backup dla tej metody.

    Uwaga

    Upewnij się, że maszyny wirtualne w środowisku tworzenia kopii zapasowych korzystają z systemów operacyjnych, które mają możliwość obsługi. Dowiedz się więcej o obsługiwanych systemach operacyjnych.

Podczas przesyłania strumieniowego kopii zapasowych dużych baz danych czas potrzebny na skopiowanie danych do przywrócenia może przekroczyć wymagania celu czasu odzyskiwania. Migawki na poziomie magazynu są najlepszą opcją dla tego scenariusza.

Zalecenia

  • Dokładnie zastanów się, czy zaimplementować strategię tworzenia kopii zapasowych opartą na przesyłaniu strumieniowym, na migawkach na poziomie magazynu, czy na obu strategiach.

  • Oceń wpływ strategii tworzenia kopii zapasowych na wymagania dotyczące celu odzyskiwania i celu punktu odzyskiwania.

  • Przeanalizuj dostępne miejsca docelowe magazynu dla kopii zapasowych RMAN na podstawie udokumentowanych limitów przepływności dla każdej opcji. Wybierz opcję spełniającą twoje wymagania.

  • Rozważ użycie usługi Azure Backup dla migawek na poziomie magazynu i rozważ umieszczenie migawek w sparowanym regionie lub strefie dostępności w celu uzyskania dodatkowej ochrony.

  • Rozważ różne opcje przechowywania kopii zapasowych dziennika archiwum, które należy odzyskać bazy danych. Rozważ kwestie związane z wydajnością, replikacją i kosztami każdej opcji.

  • Twórz i regularnie testuj plany tworzenia i przywracania kopii zapasowych, aby zapobiec niepożądanym niespodzianiom w środowisku produkcyjnym.

Ochrona usług i ciągłość działania

W tej sekcji opisano sposób ulepszania ogólnej wysokiej dostępności (HA) i odzyskiwania po awarii obciążenia Oracle w usłudze Azure IaaS przez zaimplementowanie zagadnień dotyczących ochrony usług i ciągłości działania (BC).

Uwzględnij następujące zalecenia, aby poprawić nadmiarowość architektury i ostatecznie zmaksymalizować ilość czasu, przez jaki usługa jest dostępna. Należy zminimalizować przestoje usługi z powodu planowanych awarii, takich jak poprawki, aktualizacje i uaktualnienia oraz nieplanowane awarie, takie jak awarie. Skorzystaj z możliwości platformy Azure i oracle, aby ulepszyć odzyskiwanie po awariach obejmujących całą lokalizację geograficzną.

Platforma Azure oferuje wiele opcji wysokiej dostępności poszczególnych składników w architekturze IaaS firmy Oracle. Można na przykład:

  • Wdrażanie maszyn wirtualnych przy użyciu elastycznego zestawu skalowania maszyn wirtualnych, który automatycznie rozdziela maszyny wirtualne między domeny błędów.
  • Utwórz strefy dostępności, aby chronić przed awariami centrum danych.
  • Umieść wdrożenia w różnych regionach, aby chronić przed awariami w pełnym regionie.

Różne możliwości usługi Azure Storage zapewniają różne poziomy nadmiarowości magazynu, takie jak magazyn lokalnie nadmiarowy, magazyn strefowo nadmiarowy i magazyn geograficznie nadmiarowy. Podczas planowania wdrożenia obciążenia Oracle w usłudze Azure IaaS należy wziąć pod uwagę każdą opcję.

Możesz również użyć funkcji Oracle Data Guard, która jest narzędziem do konfigurowania ochrony usługi bazy danych Oracle. Funkcja Data Guard przekazuje dzienniki transakcji i stosuje je do co najmniej jednej bazy danych rezerwowych. Ten proces obsługuje dokładne kopie podstawowej bazy danych, do której można przejść w tryb failover, jeśli planowana konserwacja lub scenariusz awarii.

Funkcja Data Guard ma trzy tryby replikacji danych: maksymalną ochronę, maksymalną dostępność i maksymalną wydajność. Każdy tryb replikacji oferuje inną kombinację trybów transportu dziennika i różne gwarancje transakcyjne dla aplikacji w pomocniczej bazie danych.

W zależności od strategii, takiej jak zero-latency lub zero strategii utraty danych, można wybrać konfigurację synchroniczną lub asynchroniczną. Możesz również zaimplementować tryb failover szybkiego uruchamiania, w zależności od wymagań dotyczących maksymalnego przestoju. Dostępne są architektury referencyjne, które zapewniają odzyskiwanie w mniej niż jedną minutę lub mniej niż pięć minut i maksymalnie cztery godziny. Wersja Enterprise Edition bazy danych Oracle Database obejmuje usługę Data Guard.

Oracle GoldenGate to inne narzędzie, którego można użyć do replikowania danych między dwiema bazami danych i włączenia scenariuszy obejmujących wiele podstawowych. Musisz kupić GoldenGate oddzielnie.

Zalecenia

  • Weź pod uwagę możliwości zapewniane przez platformę Azure wysoką dostępność różnych składników infrastruktury w ramach implementacji rozwiązania IaaS platformy Azure.

  • Starannie wybierz tryb ochrony bazy danych, który spełnia twoje wymagania podczas korzystania z funkcji Data Guard dla wysokiej dostępności i odzyskiwania po awarii. Na przykład maksymalny tryb wydajności minimalizuje wpływ na źródło, ale ma najwyższy potencjał utraty danych. Aby uzyskać więcej informacji, zobacz BCDR for Oracle on Azure Virtual Machines landing zone accelerator (Akcelerator strefy docelowej bcDR for Oracle on Azure Virtual Machines) i Oracle Data Guard protection modes (Tryby ochrony funkcji Oracle Data Guard).

  • Rozważ zautomatyzowanie procesu pracy w trybie failover. Możesz na przykład użyć trybu failover szybkiego uruchamiania.

  • Ustanów procedury testowe dla procesów trybu failover i przeprowadzaj regularne testowanie, aby uniknąć problemów.

  • Całościowe tworzenie architektury rozwiązania przy użyciu natywnych funkcji platformy Azure, takich jak strefy dostępności i narzędzia natywne dla firmy Oracle, takie jak Data Guard, spełniają wymagania dotyczące wysokiej dostępności i odzyskiwania po awarii. W poniższych dwóch przykładach użyto składników natywnych dla platformy Azure i natywnych dla firmy Oracle.

Tworzenie trybu failover z pasywnym trybem wstrzymania

W tej sekcji opisano przykład scenariusza trybu failover dla aplikacji Oracle o krytycznym znaczeniu dla działania firmy we wdrożeniu w strefie dostępności z pasywnym wstrzymaniem.

Aplikacje Oracle krytyczne dla działania firmy, takie jak Oracle E-Business Suite, wymagają zapobiegania awariom, a tym samym całościowej architektury.

Ten przykład:

  • Ma wdrożenie z dwiema strefami dostępności. Warstwa aplikacji używa usługi Azure Site Recovery z pasywną pomocniczą maszyną wirtualną.

  • Korzysta z funkcji szybkiego uruchamiania trybu failover funkcji Data Guard. Aby uzyskać najwyższą dostępność, zalecamy zainstalowanie dwóch obserwatorów. Podstawowy obserwator znajduje się w strefie dostępności 1, a pomocniczy obserwator znajduje się w strefie dostępności 2. Obserwatorzy monitorują i kierują ruch. Gdy podstawowa baza danych jest niedostępna, obserwator automatycznie przełączy się w tryb failover do pomocniczej bazy danych. Funkcja Data Guard wykonuje ponowną synchronizację. Przedział czasu synchronizacji ponownej synchronizacji zależy od konfiguracji ponownej konfiguracji.

  • Czy funkcja Data Guard jest skonfigurowana do trybu ochrony danych, takiego jak maksymalna dostępność, maksymalna wydajność lub maksymalna ochrona. Aby uzyskać więcej informacji na temat wybierania trybu dla wymagań dotyczących obciążenia, zobacz Tryby ochrony funkcji Oracle Data Guard.

Poniższa architektura ma na celu osiągnięcie progu przestoju wynoszącego mniej niż pięć minut.

Diagram przedstawiający architekturę trybu failover z pasywnym trybem wstrzymania.

Tworzenie trybu failover z aktywnym wstrzymaniem

W tej sekcji opisano przykład scenariusza trybu failover dla aplikacji Oracle o krytycznym znaczeniu dla działania firmy we wdrożeniu w strefie dostępności z aktywnym wstrzymaniem.

W tym przykładzie:

  • Warstwa serwera sieci Web, warstwa aplikacji i warstwa bazy danych znajdują się we własnej podsieci sieci wirtualnej.

  • Podstawowa baza danych znajduje się w strefie dostępności 1.

  • Baza danych, która używa funkcji Active Data Guard do replikowania podstawowej bazy danych do aktywnej rezerwy, znajduje się w strefie dostępności trzy.

Uwaga

Ta konfiguracja wymaga licencji usługi Active Data Guard.

Poniższa architektura ma na celu osiągnięcie progu przestoju wynoszącego mniej niż jedną minutę. Ten scenariusz trybu failover ma aktywną konfigurację rezerwową, ale ma możliwości tylko do odczytu.

Diagram przedstawiający architekturę trybu failover z aktywnym wstrzymaniem.

Następny krok