Differenze tra Istanza gestita di Azure per Apache Cassandra e Azure Cosmos DB for Apache Cassandra
Questo articolo illustra le differenze tra Istanza gestita di Azure per Apache Cassandra e Azure Cosmos DB for Apache Cassandra basato su UR. Questo articolo fornisce consigli su come scegliere tra i due servizi o quando ospitare il proprio ambiente Apache Cassandra.
Differenze principali
Istanza gestita di Azure per Apache Cassandra è un servizio completamente gestito per cluster Apache Cassandra open source puri. Il servizio consente anche di eseguire l'override delle configurazioni, a seconda delle esigenze specifiche di ogni carico di lavoro, consentendo la massima flessibilità e controllo dove necessario. Offre anche la possibilità di aumentare la capacità dei cluster Apache Cassandra locali o self-hosted su cloud esistenti. L'aumento avviene aggiungendo data center Cassandra gestiti all'anello del cluster esistente.
Azure Cosmos DB for Apache Cassandra basato sulle UR in Azure Cosmos DB è un livello di compatibilità rispetto al servizio di database nativo del cloud distribuito a livello globale di Microsoft, Azure Cosmos DB.
Come scegliere?
La tabella seguente illustra gli scenari comuni, i requisiti del carico di lavoro e le aspirazioni adatti a ognuno di questi approcci di distribuzione:
Apache Cassandra self-hosted in locale o in Azure | Istanza gestita di Azure per Apache Cassandra | Azure Cosmos DB for Apache Cassandra | |
---|---|---|---|
Tipo di distribuzione | È disponibile una distribuzione Apache Cassandra altamente personalizzata con patch o snitch personalizzate. | È disponibile una distribuzione Apache Cassandra open source standard senza codice personalizzato. | Ci si accontenta di una piattaforma che non è Apache Cassandra, ma è conforme a tutti i driver client open source a livello di protocollo di trasmissione. |
Sovraccarico operativo | Sono disponibili esperti di Cassandra che possono distribuire, configurare ed effettuare la manutenzione dei cluster. | Si vuole eliminare il sovraccarico operativo usando un database come servizio completamente gestito per Apache Cassandra open source, ma è possibile controllare le configurazioni specifiche di Cassandra, ad esempio la replica e la coerenza quando necessario. | Si vuole eliminare il sovraccarico operativo usando un database piattaforma come servizio completamente gestito nel cloud. |
Supporto per l'ambiente di produzione | Gli eventi imprevisti e le interruzioni in tempo reale vengono gestiti personalmente, tra cui contattare i team dell'infrastruttura pertinenti per il calcolo, la rete, l'archiviazione e così via. | Si vuole un'esperienza di servizio gestita direttamente che fungerà da punto di accesso centralizzato per supportare eventi imprevisti e interruzioni live. | Si vuole un'esperienza di servizio gestita direttamente che fungerà da punto di accesso centralizzato per eventi imprevisti e interruzioni live. |
Supporto tecnico software | Si gestiscono tutte le patch e ci si assicura che il software venga aggiornato prima della fine del ciclo di vita. | Si vuole un'esperienza di servizio gestita direttamente che offrirà supporto a livello di software Cassandra oltre la fine del ciclo di vita, l'applicazione automatica delle patch e gli aggiornamenti chiavi in mano per le versioni principali | Si vuole un'esperienza di servizio gestita direttamente in cui il supporto a livello di software è completamente astratto. |
Requisiti per il sistema operativo | È necessario gestire immagini personalizzate o Golden del sistema operativo della macchina virtuale. | È possibile usare immagini "vanilla", ma si vuole avere il controllo sulla selezione di SKU, memoria, dischi e operazioni di I/O al secondo. | Si vuole che il provisioning della capacità sia semplificato ed espresso come singola metrica normalizzata, con una relazione uno-a-uno con la velocità effettiva, ad esempio unità richiesta in Azure Cosmos DB. |
Modello di determinazione prezzi | Si vuole usare un software di gestione come gli strumenti Datastax si è soddisfatti dei costi di licenza. | Si preferisce una licenza open source pura e prezzi basati su istanze di macchine virtuali. | Si vogliono usare i prezzi nativi del cloud, che includono offerte di scalabilità automatica e serverless. |
Analisi | Si vuole avere il controllo completo sul provisioning delle pipeline analitiche indipendentemente dal sovraccarico per compilare e gestirle. | Si vogliono usare servizi analitici basati sul cloud come Azure Databricks. | Si vuole un'analisi transazionale ibrida near real-time integrata nella piattaforma con Collegamento ad Azure Synapse per Azure Cosmos DB. |
Criterio del carico di lavoro | Il carico di lavoro è abbastanza stabile e non è necessario ridimensionare spesso i nodi nel cluster. | Il carico di lavoro è volatile ed è necessario essere in grado di aumentare o ridurre facilmente i nodi in un data center o aggiungere/rimuovere i data center. | Il carico di lavoro è spesso volatile ed è necessario essere in grado di effettuare rapidamente operazioni di aumento o riduzione e a un volume significativo. |
Contratti di servizio | Si è soddisfatti dei processi per la gestione dei contratti di servizio in termini di coerenza, velocità effettiva, disponibilità e ripristino di emergenza. | Si è soddisfatti dei processi per la gestione dei contratti di servizio in termini di coerenza e velocità effettiva, ma si vuole un contratto di servizio per la disponibilità ed è necessario ricevere assistenza per i backup. | Si vogliono contratti di servizio completi in termini di coerenza, velocità effettiva, disponibilità e ripristino di emergenza. |
Replica e coerenza | È necessario essere in grado di configurare la matrice completa di impostazioni di coerenza ottimizzabili disponibili in Apache Cassandra per il percorso di lettura e scrittura. | È necessario essere in grado di configurare la matrice completa di impostazioni di coerenza ottimizzabili disponibili in Apache Cassandra per il percorso di lettura e scrittura. | Una coerenza del percorso di lettura con valore ONE (finale) o ALL (forte) è sufficiente per tutte le applicazioni (vedere anche Mapping dei livelli di coerenza Cassandra) |
Modello di dati | Si sta eseguendo la migrazione dei carichi di lavoro con una combinazione di distribuzione uniforme dei dati e dati asimmetrici (rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione) che richiedono flessibilità in termini di scalabilità verticale dei nodi. | Si sta eseguendo la migrazione dei carichi di lavoro con una combinazione di distribuzione uniforme dei dati e dati asimmetrici (rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione) che richiedono flessibilità in termini di scalabilità verticale dei nodi. | Si sta creando una nuova applicazione o l'applicazione esistente ha una distribuzione relativamente uniforme dei dati rispetto all'archiviazione e alla velocità effettiva tra chiavi di partizione. |