Progettazione per la disponibilità elevata con ExpressRoute

ExpressRoute è progettato per la disponibilità elevata per fornire connettività di rete privata di livello carrier alle risorse Microsoft. In altre parole, non esiste un singolo punto di errore nel percorso ExpressRoute all'interno della rete Microsoft. Per ottimizzare la disponibilità, è necessario progettare anche il segmento del cliente e del provider di servizi del circuito ExpressRoute per la disponibilità elevata. In questo articolo verranno esaminate innanzitutto le considerazioni sull’architettura di rete per la creazione di una connettività di rete affidabile tramite ExpressRoute, quindi verranno esaminate le funzionalità di ottimizzazione che consentono di migliorare la disponibilità elevata del circuito ExpressRoute.

Nota

I concetti descritti in questo articolo si applicano allo stesso modo sia che il circuito ExpressRoute venga creato nella rete WAN virtuale o all'esterno di essa.

Considerazioni sull'architettura

La figura seguente illustra il modo consigliato per connettersi usando un circuito ExpressRoute per ottimizzare la disponibilità di un circuito ExpressRoute.

1

Per la disponibilità elevata, è essenziale mantenere la ridondanza del circuito ExpressRoute in tutta la rete end-to-end. In altre parole, è necessario mantenere la ridondanza all’interno della rete locale e non comprometterla all’interno della rete del provider di servizi. Mantenere la ridondanza al minimo implica evitare errori di singoli punti di rete. L’alimentazione e il raffreddamento ridondanti per i dispositivi di rete migliorano ulteriormente la disponibilità elevata.

Considerazioni sulla progettazione del livello fisico del primo miglio

Se si terminano sia le connessioni primarie che secondarie di un circuito ExpressRoute nella stessa attrezzatura locale del cliente (CPE), si compromette la disponibilità elevata all’interno della rete locale. Inoltre, se si configurano sia le connessioni primarie che secondarie usando la stessa porta della CPE, si impone al partner di compromettere anche la sua disponibilità elevata nel segmento di rete. Questo evento può verificarsi terminando le due connessioni in sottointerfacce diverse o unendo le due connessioni all’interno della rete partner. Questa compromissione viene illustrata nella figura seguente.

2

D’altra parte, se si terminano le connessioni primarie e secondarie di un circuito ExpressRoute in posizioni geografiche diverse, è possibile compromettere le prestazioni di rete della connettività. Se il traffico viene attivamente bilanciato tra le connessioni primarie e secondarie che vengono terminate in posizioni geografiche diverse, la differenza sostanziale nella latenza di rete tra i due percorsi comporta prestazioni di rete non ottimali.

Per considerazioni sulla progettazione con ridondanza geografica, vedere Progettare per il ripristino di emergenza con ExpressRoute.

Connessioni active-active

La rete Microsoft è configurata per il funzionamento delle connessioni primarie e secondarie dei circuiti ExpressRoute in modalità attivo-attivo. Tuttavia, tramite gli annunci della route, è possibile forzare il funzionamento delle connessioni ridondanti di un circuito ExpressRoute in modalità attivo-passivo. Annunciare percorsi più specifici e anteporre il percorso AS BGP è alla base delle comuni tecniche usate per rendere un percorso preferito rispetto all'altro.

Per migliorare la disponibilità elevata, è consigliabile usare entrambe le connessioni di un circuito ExpressRoute in modalità attivo-attivo. Se si consente il funzionamento delle connessioni in modalità attivo/attivo, la rete Microsoft bilancerà il carico del traffico tra le connessioni in base al flusso.

L'esecuzione delle connessioni primarie e secondarie di un circuito ExpressRoute in modalità attivo/passivo comporta il rischio che entrambe le connessioni non riescano a causa di un errore nel percorso attivo. Le cause comuni dell'errore di commutazione sono la mancanza di gestione attiva della connessione passiva e le route non aggiornate della connessione passiva.

In alternativa, l'esecuzione delle connessioni primarie e secondarie di un circuito ExpressRoute in modalità attivo/attivo comporta solo circa la metà dei flussi con esito negativo e reindirizzamento. Pertanto, una connessione attiva/attiva contribuisce significativamente a migliorare il tempo medio di recupero (MTTR).

Nota

Durante un'attività di manutenzione o in caso di eventi non pianificati che incidono su una delle connessioni, Microsoft preferisce usare l'anteposizione del percorso AS per trasferire il traffico sulla connessione integra. È necessario assicurarsi che il traffico possa essere instradato sul percorso integro quando è configurata l'anteposizione del percorso da Microsoft e che gli annunci di route necessari siano configurati in modo appropriato per evitare interruzioni del servizio.

NAT per il peering Microsoft

Il peering Microsoft è progettato per la comunicazione tra endpoint pubblici. Pertanto, in genere, gli endpoint privati locali sono Network Address Translated (NATed) con indirizzo IP pubblico nella rete del cliente o partner prima di comunicare tramite peering Microsoft. Supporre di usare sia le connessioni primarie che secondarie in una configurazione active-active. Dove e come NAT (Network Address Translation) influisce sulla velocità di ripristino in seguito a un errore in una delle connessioni ExpressRoute. Nella figura seguente vengono illustrate due diverse opzioni NAT:

3

Opzione 1:

NAT viene applicato dopo la suddivisione del traffico tra le connessioni primarie e secondarie del circuito ExpressRoute. Per soddisfare i requisiti con stato di NAT, vengono usati pool NAT indipendenti per i dispositivi primari e secondari. Il traffico di ritorno arriva sullo stesso dispositivo perimetrale attraverso il quale il flusso è uscito.

Se si verifica un errore con la connessione ExpressRoute, la possibilità di raggiungere il pool NAT corrispondente viene interrotta. Pertanto, tutti i flussi di rete interrotti devono essere ristabiliti da TCP (Transmission Control Protocol) o dal livello applicazione in seguito al timeout della finestra corrispondente. Durante l’errore, Azure non riesce a raggiungere i server locali usando il NAT corrispondente fino a quando non viene ripristinata la connettività per le connessioni primarie o secondarie del circuito ExpressRoute.

Opzione 2:

Un pool NAT comune viene usato prima di suddividere il traffico tra le connessioni primarie e secondarie del circuito ExpressRoute. È importante fare questa distinzione: il pool NAT comune prima della suddivisione del traffico non significa introdurre un singolo punto di errore e quindi compromettere la disponibilità elevata.

Il pool NAT è raggiungibile anche dopo l’errore della connessione primaria o secondaria. Quindi il livello di rete stesso può reindirizzare i pacchetti e contribuire a un recupero più rapido dopo un errore.

Nota

  • Se si usa l’opzione NAT 1 (pool NAT indipendenti per le connessioni ExpressRoute primarie e secondarie) e si esegue il mapping di una porta di un indirizzo IP da uno del pool NAT a un server locale, il server non sarà raggiungibile tramite il circuito ExpressRoute quando si verifica un errore con la connessione corrispondente.
  • L'interruzione delle connessioni BGP ExpressRoute nei dispositivi con stato può causare problemi con il failover durante le operazioni di manutenzione pianificate o non pianificate da Microsoft o dal provider ExpressRoute. È consigliabile testare la configurazione per assicurarsi che il failover del traffico venga eseguito correttamente e, quando possibile, terminare le sessioni BGP nei dispositivi senza stato.

Funzionalità di ottimizzazione per il peering privato

In questa sezione verranno esaminate le funzionalità facoltative, a seconda della distribuzione di Azure e della sensibilità delle funzionalità MTTR (tempo medio di riparazione), che consentono di migliorare la disponibilità elevata del circuito ExpressRoute. In particolare, verranno esaminate la distribuzione con riconoscimento della zona dei gateway di rete virtuale ExpressRoute e il rilevamento dell’inoltro bidirezionale (BFD).

Gateway di rete virtuale ExpressRoute con riconoscimento della zona di disponibilità

Una zona di disponibilità in un'area di Azure è una combinazione di un dominio di errore e un dominio di aggiornamento. Per ottenere la massima resilienza e disponibilità, è necessario configurare un gateway di rete virtuale ExpressRoute con ridondanza della zona. Per altre informazioni, vedere Informazioni sui gateway di rete virtuale con ridondanza della zona nelle zone di disponibilità di Azure. Per configurare un gateway di rete virtuale con ridondanza della zona, vedere Creare un gateway di rete virtuale con ridondanza della zona nelle zone di disponibilità di Azure.

Miglioramento del tempo di rilevamento degli errori

ExpressRoute supporta il BFD tramite peering privato. Il BFD riduce il tempo di rilevamento degli errori nella rete di livello 2 tra Microsoft Enterprise Edge (MSEE) e i relativi vicini BGP (Border Gateway Protocol) a lato locale da circa 3 minuti (impostazione predefinita) a meno di un secondo. Un tempo di rilevamento rapido degli errori consente di accelerare il ripristino degli errori. Per altre informazioni, vedere Configurare BFD tramite ExpressRoute.

Passaggi successivi

In questo articolo è stato illustrato come progettare per la disponibilità elevata di una connettività del circuito ExpressRoute. Un punto di peering del circuito ExpressRoute viene aggiunto a una posizione geografica e quindi viene influenzato da un errore irreversibile che influisce sull’intera posizione.

Per considerazioni di progettazione per creare connettività di rete con ridondanza geografica al backbone Microsoft che può resistere a errori irreversibili che interessano un’intera area, vedere Progettazione per il ripristino di emergenza con il peering privato di ExpressRoute.