Hanteringsåtgärder i Azure Managed Instance för Apache Cassandra

Artikel
10/16/2024

Azure Managed Instance för Apache Cassandra är en fullständigt hanterad tjänst för rena Apache Cassandra-kluster med öppen källkod. Tjänsten tillåter också att konfigurationer åsidosätts, beroende på de specifika behoven för varje arbetsbelastning, vilket ger maximal flexibilitet och kontroll där det behövs. Den här artikeln definierar de hanteringsåtgärder och funktioner som tillhandahålls av tjänsten. Det förklarar också ansvarsfördelningen mellan Azure Support-teamet och kunderna när du underhåller hybridkluster.

Packning

Det finns olika typer av komprimering. Vi utför för närvarande en mindre komprimering via reparation (se Underhåll). Detta utför en Merkle-trädkomprimering, vilket är en speciell typ av komprimering.
Beroende på komprimeringsstrategin som angavs i tabellen med hjälp av CQL (till exempel WITH compaction = { 'class' : 'LeveledCompactionStrategy' }) komprimeras Cassandra automatiskt när tabellen når en viss storlek. Vi rekommenderar att du noggrant väljer en komprimeringsstrategi för din arbetsbelastning och inte utför några manuella komprimeringar utanför strategin.

Korrigering

Korrigeringar på operativsystemnivå görs automatiskt vid ungefär 2 veckors takt.
Apache Cassandra-korrigeringar på programvarunivå görs när säkerhetsrisker identifieras. Uppdateringsfrekvensen kan variera.
Under korrigeringen startas datorerna om ett rack i taget. Du bör inte uppleva någon försämring på programsidan så länge kvorum all-inställningen inte används och replikeringsfaktorn är 3 eller högre.
Versionen i Apache Cassandra är i formatet X.Y.Z. Du kan styra distributionen av större (X) och mindre (Y) versioner manuellt via tjänstverktyg. Cassandra-korrigeringar (Z) som kan krävas för den kombination av större/mindre versioner görs automatiskt.

Kommentar

Tjänsten stöder för närvarande Cassandra-versionerna 3.11 och 4.0. Båda versionerna är GA. Se vår Azure CLI-snabbstart (steg 5) för att ange Cassandra-versionen under klusterdistributionen.

Underhåll

Nodetool-reparationen körs automatiskt av tjänsten med hjälp av reaper. Det här verktyget körs en gång i veckan. Du kanske vill inaktivera den om du använder din egen tjänst för en hybriddistribution.
Övervakning av nodhälsa består av:
- Övervaka aktivt varje nods medlemskap i Cassandra-ringen.
- Identifiera och automatiskt identifiera infrastrukturproblem som virtuell dator, nätverk, lagring, Linux och stöd för programvarufel.
- Övervaka processor-, disk-, kvorumförlust och andra resursproblem proaktivt.
- Ta automatiskt upp misslyckade noder där det är möjligt och manuellt ta upp noder som svar på automatiskt genererade varningar.

Support

Azure Managed Instance för Apache Cassandra tillhandahåller ett serviceavtal för tillgängligheten av datacenter i ett hanterat kluster. Om du stöter på problem med att använda tjänsten skickar du en supportbegäran i Azure Portal.

Våra supportförmåner är:

Enskild kontaktpunkt för problem med Cassandra-infrastrukturen – du behöver inte skapa supportärenden med IaaS-team (disk, beräkning, nätverk) separat.
Proaktiv rådgivning via e-post om prestandaflaskhalsar, storleksändring och andra problem med resursbegränsningar.
24 x 7 supporttäckning, inklusive automatiskt genererade incidenter för allvarliga avbrottsproblem.
Stöd för communitygodkänd korrigering (se Korrigering).
Internt stöd för Java JDK/JVM-teknikteamet.
Stöd för Linux-operativsystem med säkerhet i programvaruförsörjningskedjan.

Viktigt!

Vi undersöker och diagnostiserar eventuella problem som rapporteras via supportärende och löser eller minimerar när det är möjligt. Du är dock ytterst ansvarig för all användning på Apache Cassandra-konfigurationsnivå som orsakar processor-, disk- eller nätverksproblem.

Exempel på sådana problem är:

Ineffektiva frågeåtgärder.
Dataflöde som överskrider kapaciteten.
Mata in data som överskrider lagringskapaciteten.
Felaktiga inställningar för nyckelrymdskonfiguration.
Dålig datamodell eller partitionsnyckelstrategi.

Om vi undersöker ett supportärende och upptäcker att rotorsaken till problemet ligger på Apache Cassandra-konfigurationsnivån (och inte några underliggande plattformsnivåaspekter som vi underhåller), kommer vi fortfarande att ge rekommendationer och vägledning om reparation eller åtgärd (när det är möjligt) innan vi avslutar ärendet.

Vi rekommenderar att du aktiverar mått och/eller bekanta dig med vår Azure Monitor-integrering för att förhindra vanliga problem på program-/konfigurationsnivå i Apache Cassandra, till exempel ovanstående.

Varning

Azure Managed Instance för Apache Cassandra låter dig också köra nodetool och sstable kommandon för rutinmässig DBA-administration – se artikeln här. Vissa av dessa kommandon kan destabilisera cassandra-klustret och bör endast köras noggrant och efter att ha testats i icke-produktionsmiljöer. Om möjligt bör ett --dry-run alternativ distribueras först. Microsoft kan inte erbjuda något serviceavtal eller stöd för problem med att köra kommandon som ändrar standarddatabaskonfigurationen och/eller tabellerna.

Säkerhetskopiering och återställning

Säkerhetskopior av ögonblicksbilder aktiveras som standard och tas var 24:e timme. Säkerhetskopior lagras i ett internt Azure Blob Storage-konto och behålls i upp till 2 dagar (48 timmar). Det kostar ingenting för de första 2 säkerhetskopiorna. Extra säkerhetskopior debiteras, se priser. Om du vill ändra säkerhetskopieringsintervallet eller kvarhållningsperioden kan du redigera principen i portalen:

Om du vill återställa från en befintlig säkerhetskopia skickar du en supportbegäran i Azure Portal. När du skickar in supportärendet måste du:

Ange säkerhetskopierings-ID:t från portalen för den säkerhetskopia som du vill återställa. Detta finns i portalen:
Meddela oss om källdatacentret har tagits bort. Detta är viktigt för att identifiera rätt säkerhetskopieringskonto att återställa från.
Om återställning av hela klustret inte krävs anger du nyckelområdet och tabellen (om tillämpligt) som måste återställas.
Ange om du vill att säkerhetskopian ska återställas i det befintliga klustret eller i ett nytt kluster.
Om du vill återställa till ett nytt kluster måste du först skapa det nya klustret. Kontrollera att målklustret matchar källklustret när det gäller antalet datacenter och att motsvarande datacenter har samma antal noder. Du kan också bestämma om du vill behålla autentiseringsuppgifterna (användarnamn/lösenord) i det nya målklustret eller tillåta återställning för att åsidosätta användarnamn/lösenord med det som ursprungligen skapades.
Du kan också bestämma om du vill behålla system_auth nyckelutrymmet i det nya målklustret eller tillåta att återställningen skriver över den med data från säkerhetskopian. Nyckelområdet system_auth i Cassandra innehåller auktoriseringsdata och interna autentiseringsdata, inklusive roller, rollbehörigheter och lösenord. Observera att vår standardåterställningsprocess skriver system_auth över nyckelområdet.

Kommentar

Hur lång tid det tar att svara på en begäran om återställning från säkerhetskopian beror både på hur allvarligt supportärende du skapar (och motsvarande serviceavtal för svarstid) och hur mycket data som ska återställas. Vi tillhandahåller dock inget serviceavtal för tid för att slutföra återställningen, eftersom detta är mycket beroende av mängden data som återställs.

Varning

Säkerhetskopior är avsedda för scenarier med oavsiktlig borttagning och är inte geo-redundanta. De rekommenderas därför inte för användning som en strategi för haveriberedskap (DR) vid totalt regionalt avbrott. För att skydda mot regionomfattande avbrott rekommenderar vi en distribution i flera regioner. Ta en titt på vår snabbstart för distributioner i flera regioner.

Säkerhet

Azure Managed Instance för Apache Cassandra innehåller många inbyggda explicita säkerhetskontroller och funktioner:

Härdade avbildningar av virtuella Linux-datorer med en kontrollerad leveranskedja.
Vanlig övervakning av sårbarhet och exponering (CVE) på operativsystemnivå.
Certifikatrotation för både Apache Cassandra- och Prometheus-programvara som finns på de hanterade virtuella datorerna.
Aktiv sårbarhetsgenomsökning.
Aktiv virusgenomsökning.
Säkra kodningsmetoder.

Mer information om säkerhetsfunktioner finns i vår artikel här.

Hybridstöd

När ett hybridkluster har konfigurerats gynnar automatiserade reaper-åtgärder som körs i tjänsten hela klustret. Detta inkluderar datacenter som inte etableras av tjänsten. Utanför detta är det ditt ansvar att underhålla ditt lokala eller externt värdbaserade datacenter.

Nästa steg

Kom igång med någon av våra snabbstarter:

Dela via