設計和建構 Azure ExpressRoute 以進行復原

Azure ExpressRoute 是一項基本混合式連線服務,廣泛用於內部部署網路與 Azure 工作負載之間的低延遲、復原能力、高輸送量私人連線能力。 其可讓您在內部部署與 Azure 之間的網路連線中實現可靠性、復原能力和災害復原,以確保業務和任務關鍵性工作負載的可用性。 這項功能也會以可調整且符合成本效益的方式擴充對 Azure 資源的存取。

圖表說明透過 ExpressRoute 的內部部署網路與 Azure 之間的連線。

具有高可靠性、高復原能力和高可用性的網路連線,是結構完善的系統的基礎。 可靠性包含兩個原則:復原能力可用性。 復原能力的目標是要防止失敗,並在發生失敗時,將應用程式還原為完全運作狀態。 可用性的目標是提供應用程式或工作負載始終如一的存取。 請務必根據業務需求和應用程式需求主動規劃可靠性。

ExpressRoute 的使用者依賴邊緣網站、WAN 和可用性區域的可用性和效能,以維持其與 Azure 的連線能力。 不過,這些元件或網站可能會因為各種原因而失敗,例如設備故障、網路中斷、天氣狀況或自然災害。 因此,規劃可靠性、復原能力和可用性是使用者與其雲端提供者共同的責任。

ExpressRoute 的網站復原能力

有三種 ExpressRoute 復原架構可用來確保內部部署與 Azure 之間的網路連線具有高可用性和復原能力。 這些架構設計包括:

最大復原

ExpressRoute 中的「最大復原能力」架構旨在消除 Microsoft 網路路徑內的任何單一失敗點。 此設定是透過使用 ExpressRoute 在兩個不同的位置設定一對線路,以實現網站多樣性。 「最大復原能力」的目標是要增強可靠性、復原能力和可用性,以確保業務和/或任務關鍵性工作負載的最高復原層級。 針對這類作業,建議您設定「最大復原能力」。 建議將此架構設計作為可靠性支柱下建構良好架構的一部分。 ExpressRoute 工程小組開發了引導式入口網站體驗,可協助您設定「最大復原能力」。

圖表說明在內部部署網路與 Microsoft 之間兩個不同的對等互連位置設定的一對 ExpressRoute 線路。

高復原能力 (預覽版)

「高復原能力」也稱為 ExpressRoute Metro,可讓您使用相同大都市 (Metro) 區域內的多個網站,透過 ExpressRoute 將內部部署網路連線到 Azure。 高復原能力透過將單一線路分割到兩個網站,以提供網站多樣性。 第一個連線會建立在一個網站上,第二個連線則會在另一個網站上建立。 ExpressRoute Metro 的目標是引進啟用網站多樣性的功能,以減輕邊緣網站隔離和失敗的影響。 網站多樣性是透過在大都市內配對的網站之間使用單一線路來達成,這可提供邊緣與地區之間失敗的復原能力。 ExpressRoute Metro 提供高於「標準復原能力」的網站復原層級,但不如「最大復原能力」。 ExpressRoute Metro 架構可用於地區內的業務和任務關鍵性工作負載。 如需詳細資訊,請參閱 ExpressRoute Metro

圖表說明單一 ExpressRoute 線路上,每個連結都設定在兩個不同的對等互連位置。

標準復原

ExpressRoute 中的標準復原能力是在單一線路的單一網站上設定了兩個連線。 已設定內建備援 (主動-主動) 來協助跨此線路上的兩個連線進行容錯移轉。 目前,ExpressRoute 會在單一對等互連位置提供兩個連線。 如果此網站發生失敗,使用者可能會遇到無法連線到其 Azure 工作負載的情況。 此設定也稱為單一定址,因為代表使用者使用只以一個對等互連位置設定的 ExpressRoute 線路。 因為此設定不提供網站復原能力,被視為最不具復原性,不建議用於業務或任務關鍵性工作負載。

圖表說明單一 ExpressRoute 線路上,每個連結都設定在單一對等互連位置。

ExpressRoute 的區域性復原能力

Azure 地區是 ExpressRoute 設計和復原策略不可或缺的一部分。 這些地區是裝載 Azure 服務的資料中心的地理位置。 「地區」會透過專用的低延遲網路進行互連,專門設計來提供高可用性、容錯及可調整性。

Azure 提供數項功能,以確保地區性復原能力。 其中一項功能是可用性區域。 可用性區域透過跨越一個地區內的多個實體位置來保護應用程式和資料免受資料中心失敗的影響。 「地區」和「可用性區域」是應用程式設計和復原策略的核心。 藉由利用可用性區域,您可以在部署中實現更高的可用性和復原能力。 如需詳細資訊,請參閱地區和可用性區域

建議您將 ExpressRoute 虛擬網路閘道部署為跨地區內可用性區域的區域備援。 這些可用性區域是具有獨立基礎結構 (電源、冷卻和網路功能) 的個別實體位置。 目的是要保護您的內部部署網路到 Azure 的連線能力,避免發生區域層級失敗。 區域備援 ExpressRoute 閘道提供復原能力、可擴縮性和更高的可用性,以便能存取 Azure 上的任務關鍵性服務。

地區性和區域性資料中心的設備故障或災害可能會影響虛擬網路中的 ExpressRoute 閘道部署。 如果未將閘道部署為區域備援,Azure 資料中心內的這類失敗可能會影響使用者存取其 Azure 工作負載的能力。

如有現有的非區域備援 ExpressRoute 閘道,現在可以移轉至已啟用可用性區域的閘道

建議

以下是確保 ExpressRoute 網路架構中高可用性、復原能力和可靠性的建議:

ExpressRoute 線路建議

規劃 ExpressRoute 線路或 ExpressRoute Direct

在初始規劃階段,請務必確定是要設定 ExpressRoute 線路ExpressRoute Direct 連線。 ExpressRoute 線路可透過連線提供者的協助,允許透過私人專用連線連接到 Azure。 ExpressRoute Direct 可讓內部部署網路直接延伸至對等互連位置的 Microsoft 網路。 您也必須識別頻寬需求和線路 SKU 類型需求,以符合您的業務需求。

評估多站台備援 ExpressRoute 線路的復原能力

部署具有最大復原能力的多網站備援 ExpressRoute 線路之後,請務必確保內部部署路由透過備援線路進行公告,以充分利用多網站備援的優勢。 若要評估復原能力,並測試備援線路和路由的容錯移轉,請在這裡深入了解。

規劃主動/主動設定

為了改善復原能力和可用性,Microsoft 建議以主動-主動模式運作 ExpressRoute 線路的兩個連線。 藉由允許兩個連線在此模式中運作,Microsoft 可以基於每個流程對連線之間的網路流量進行負載平衡。

實體層多樣性

為了獲得更好的復原能力,請規劃在內部部署邊緣與對等互連位置之間建立多個路徑 (提供者/Microsoft 邊緣位置)。 您可以使用不同的服務提供者,或透過來自內部部署網路的另一個對等互連位置進行路由傳送,來達成此設定。 為了達到高可用性,必須在整個端對端網路架構上維護 ExpressRoute 線路的備援。 這包括在內部部署網路內維護備援,以及在服務提供者內維護備援。 確保具有架構中這些部分的備援,表示您不應該有單一失敗點。

確定已啟用並設定 BFD (雙向轉送偵測)

透過 ExpressRoute 啟用雙向轉送偵測 (BFD) 可以加速 MSEE 裝置與 ExpressRoute 線路設定所在的路由器之間的連結失敗偵測。 Microsoft 建議設定客戶場所邊緣 (CPE) 裝置使用 BFD。 您可以透過邊緣路由裝置或合作夥伴邊緣路由裝置來設定ExpressRoute。 預設會在 Microsoft 端的 MSEE 裝置上啟用 BFD。

ExpressRoute 閘道建議

規劃虛擬網路閘道

建立區域備援虛擬網路閘道,以提升復原能力,並針對不同地區中的虛擬網路閘道規劃災害復原和高可用性。 使用區域備援閘道時,您可以受益於區域復原能力,以便能存取 Azure 上任務關鍵性且可調整的服務。

移轉至區域備援 ExpressRoute 閘道

引導式閘道移轉體驗可協助您從非 Az-Enabled SKU 移轉至 Az-Enabled SKU 閘道。 此功能允許在相同的閘道子網路內建立額外的虛擬網路閘道。 在移轉程序期間,Azure 會將控制平面和資料路徑組態從現有的閘道傳輸到新的閘道。

災害復原和高可用性建議

啟用高可用性和災害復原

為了大幅提高可用性,ExpressRoute 線路上的客戶和服務提供者區段都應該針對可用性和復原能力進行架構。 針對災害復原,請規劃因自然災害而造成地區性服務中斷等案例。 針對透過不同地區中不同對等互連位置設定的多個線路,實作強固的災害復原設計。 若要深入了解,請參閱:設計提供災害復原

規劃異地備援

針對災害復原規劃,建議您在多個對等互連位置和地區中設定 ExpressRoute 線路。 ExpressRoute 線路可以在相同的大都市區域或不同的大都市區域中建立,而不同的服務提供者可透過每個線路用於不同的路徑。 異地備援 ExpressRoute 線路可用來建立強固的後端網路連線,以進行災害復原。 若要深入了解,請參閱專為高可用性而設計

注意

在處理延遲敏感、任務關鍵性或耗用大量頻寬的工作負載時,不建議使用站對站 VPN 作為 ExpressRoute 連線的備份解決方案。 在這種情況下,建議設計具有 ExpressRoute 多網站復原能力的災害復原,以確保具有最大可用性。

虛擬網路對等互連以提供虛擬網路之間的連線

虛擬網路 (VNet) 對等互連提供更有效率且直接的方法,可讓 Azure 服務跨虛擬網路通訊,而不需要虛擬網路閘道、額外的躍點,或透過公用網際網路傳輸。 若要建立虛擬網路之間的連線,應實作 VNet 對等互連以取得最佳效能。 如需詳細資訊,請參閱關於虛擬網路對等互連管理 VNet 對等互連

監視和警示建議

設定 ExpressRoute 線路的監視和警示

作為基準,建議您在 Azure 監視器內設定網路深入解析,以檢視所有 ExpressRoute 線路計量,包括 ExpressRoute Direct 和 Global Reach。 在線路卡內,您可以將對等互連、連線和閘道的拓撲和相依性視覺化。 線路可用的深入解析包括可用性、輸送量和封包捨棄。

設定 ExpressRoute 線路維護通知的服務健康情況警示

ExpressRoute 會使用 Azure 服務健康情況來向您通知計劃性和即將進行的 ExpressRoute 線路維護。 透過 [服務健康情況],您可以在 Azure 入口網站中檢視計劃性和過去的維護,以及設定最符合您需求的警示和通知。 在 [服務健康情況] 中,您可以看到計劃性和過去的維護。 您也可以設定 [服務健康情況] 內的警示,以通知即將進行的維護。

設定 ExpressRoute 的連線監視器

連線監視器是一個雲端式網路監視解決方案,可監視 Azure 雲端部署與內部部署位置 (分公司等) 之間的連線。 線上監視器是以代理程式為基礎的解決方案。

設定閘道健康情況監視和警示

使用 Azure 監視器設定監視,以取得 ExpressRoute 閘道的可用性、效能和可擴縮性。 在部署 ExpressRoute 閘道時,Azure 會管理閘道的計算和功能。 有多個閘道計量可供您進一步了解閘道的效能。