Differenze tra Istanza gestita di Azure per Apache Cassandra e Azure Cosmos DB for Apache Cassandra

Questo articolo illustra le differenze tra Istanza gestita di Azure per Apache Cassandra e Azure Cosmos DB for Apache Cassandra basato su UR. Questo articolo fornisce consigli su come scegliere tra i due servizi o quando ospitare il proprio ambiente Apache Cassandra.

Differenze principali

Istanza gestita di Azure per Apache Cassandra è un servizio completamente gestito per cluster Apache Cassandra open source puri. Il servizio consente anche di eseguire l'override delle configurazioni, a seconda delle esigenze specifiche di ogni carico di lavoro, consentendo la massima flessibilità e controllo dove necessario. Offre anche la possibilità di aumentare la capacità dei cluster Apache Cassandra locali o self-hosted su cloud esistenti. L'aumento avviene aggiungendo data center Cassandra gestiti all'anello del cluster esistente.

Azure Cosmos DB for Apache Cassandra basato sulle UR in Azure Cosmos DB è un livello di compatibilità rispetto al servizio di database nativo del cloud distribuito a livello globale di Microsoft, Azure Cosmos DB.

Come scegliere?

La tabella seguente illustra gli scenari comuni, i requisiti del carico di lavoro e le aspirazioni adatti a ognuno di questi approcci di distribuzione:

Apache Cassandra self-hosted in locale o in Azure Istanza gestita di Azure per Apache Cassandra Azure Cosmos DB for Apache Cassandra
Tipo di distribuzione È disponibile una distribuzione Apache Cassandra altamente personalizzata con patch o snitch personalizzate. È disponibile una distribuzione Apache Cassandra open source standard senza codice personalizzato. Ci si accontenta di una piattaforma che non è Apache Cassandra, ma è conforme a tutti i driver client open source a livello di protocollo di trasmissione.
Sovraccarico operativo Sono disponibili esperti di Cassandra che possono distribuire, configurare ed effettuare la manutenzione dei cluster. Si vuole eliminare il sovraccarico operativo usando un database come servizio completamente gestito per Apache Cassandra open source, ma è possibile controllare le configurazioni specifiche di Cassandra, ad esempio la replica e la coerenza quando necessario. Si vuole eliminare il sovraccarico operativo usando un database piattaforma come servizio completamente gestito nel cloud.
Supporto per l'ambiente di produzione Gli eventi imprevisti e le interruzioni in tempo reale vengono gestiti personalmente, tra cui contattare i team dell'infrastruttura pertinenti per il calcolo, la rete, l'archiviazione e così via. Si vuole un'esperienza di servizio gestita direttamente che fungerà da punto di accesso centralizzato per supportare eventi imprevisti e interruzioni live. Si vuole un'esperienza di servizio gestita direttamente che fungerà da punto di accesso centralizzato per eventi imprevisti e interruzioni live.
Supporto tecnico software​ Si gestiscono tutte le patch e ci si assicura che il software venga aggiornato prima della fine del ciclo di vita. Si vuole un'esperienza di servizio gestita direttamente che offrirà supporto a livello di software Cassandra oltre la fine del ciclo di vita, l'applicazione automatica delle patch e gli aggiornamenti chiavi in mano per le versioni principali Si vuole un'esperienza di servizio gestita direttamente in cui il supporto a livello di software è completamente astratto.
Requisiti per il sistema operativo È necessario gestire immagini personalizzate o Golden del sistema operativo della macchina virtuale. È possibile usare immagini "vanilla", ma si vuole avere il controllo sulla selezione di SKU, memoria, dischi e operazioni di I/O al secondo. Si vuole che il provisioning della capacità sia semplificato ed espresso come singola metrica normalizzata, con una relazione uno-a-uno con la velocità effettiva, ad esempio unità richiesta in Azure Cosmos DB.
Modello di determinazione prezzi Si vuole usare un software di gestione come gli strumenti Datastax si è soddisfatti dei costi di licenza. Si preferisce una licenza open source pura e prezzi basati su istanze di macchine virtuali. Si vogliono usare i prezzi nativi del cloud, che includono offerte di scalabilità automatica e serverless.
Analisi Si vuole avere il controllo completo sul provisioning delle pipeline analitiche indipendentemente dal sovraccarico per compilare e gestirle. Si vogliono usare servizi analitici basati sul cloud come Azure Databricks. Si vuole un'analisi transazionale ibrida near real-time integrata nella piattaforma con Collegamento ad Azure Synapse per Azure Cosmos DB.
Criterio del carico di lavoro Il carico di lavoro è abbastanza stabile e non è necessario ridimensionare spesso i nodi nel cluster. Il carico di lavoro è volatile ed è necessario essere in grado di aumentare o ridurre facilmente i nodi in un data center o aggiungere/rimuovere i data center. Il carico di lavoro è spesso volatile ed è necessario essere in grado di effettuare rapidamente operazioni di aumento o riduzione e a un volume significativo.
Contratti di servizio Si è soddisfatti dei processi per la gestione dei contratti di servizio in termini di coerenza, velocità effettiva, disponibilità e ripristino di emergenza. Si è soddisfatti dei processi per la gestione dei contratti di servizio in termini di coerenza e velocità effettiva, ma si vuole un contratto di servizio per la disponibilità ed è necessario ricevere assistenza per i backup. Si vogliono contratti di servizio completi in termini di coerenza, velocità effettiva, disponibilità e ripristino di emergenza.
Replica e coerenza È necessario essere in grado di configurare la matrice completa di impostazioni di coerenza ottimizzabili disponibili in Apache Cassandra per il percorso di lettura e scrittura. È necessario essere in grado di configurare la matrice completa di impostazioni di coerenza ottimizzabili disponibili in Apache Cassandra per il percorso di lettura e scrittura. Una coerenza del percorso di lettura con valore ONE (finale) o ALL (forte) è sufficiente per tutte le applicazioni (vedere anche Mapping dei livelli di coerenza Cassandra)
Modello di dati Si sta eseguendo la migrazione dei carichi di lavoro con una combinazione di distribuzione uniforme dei dati e dati asimmetrici (rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione) che richiedono flessibilità in termini di scalabilità verticale dei nodi. Si sta eseguendo la migrazione dei carichi di lavoro con una combinazione di distribuzione uniforme dei dati e dati asimmetrici (rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione) che richiedono flessibilità in termini di scalabilità verticale dei nodi. Si sta creando una nuova applicazione o l'applicazione esistente ha una distribuzione relativamente uniforme dei dati rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione.

Passaggi successivi