İş yükleri için sistem durumu modelleme

Bulut uygulamaları yüksek hacimli işletimsel veriler oluşturur ve bu da sorunları hızla belirlemeyi ve çözmeyi zorlaştırır. Bu sınamanın yaygın nedenlerinden biri, iş yükünün işlevselliğine göre özelleştirilmiş bir sistem durumu temelinin olmaması ve bu temelden kaymayı algılayamamadır.

Sistem durumu modellemesi, bir iş yükünün genel durumunu ölçmek için iş bağlamını ham izleme verileriyle birleştiren bir gözlemlenebilirlik alıştırmasıdır. İş yükünü izleyebildiğiniz bir taban çizgisi ayarlamanıza yardımcı olur. Altyapı ve uygulama bileşenlerinden telemetri gibi verileri dikkate almanız gerekir. Sistem durumu modellemesi, iş yükünün kalite hedeflerine ulaşmak için gereken diğer bilgileri de içerebilir.

Performans sorunları veya operasyonel düşüş beklenen operasyonel durumdan kaymaya neden olabilir. bir iş yükünün durumunu modelleyerek, kaymayı tanımlayabilir ve iş etkisini göz önünde bulunduran bilinçli operasyonel kararlar alabilirsiniz.

Sağlık modellemesi, aşiret operasyonel bilgisi ile eyleme dönüştürülebilir içgörüler arasındaki boşluğu kapatır. Kritik sorunları etkili bir şekilde yönetmenize yardımcı olur. Bu kavram, güvenilirliği ve operasyonel verimliliği en üst düzeye çıkarmak için gereklidir.

Bu kılavuz, bir iş yükünün ve tüm alt sistemlerinin çalışma zamanı durumunu değerlendiren bir modelin nasıl derlenmesi de dahil olmak üzere sistem durumu modellemesi hakkında pratik yönergeler sunar.

Terminoloji Tanım
Sistem durumu modelleme İzleme verilerini sistem durumu olarak yorumlamak için iş bağlamı kullanan bir gözlemlenebilirlik alıştırması.
Sistem durumu modeli Belirli bir kapsam için mantıksal varlıkların ve bunların ilişkilerinin grafik gösterimi. Her düğümün, model genelinde izleme verilerini rasyonalize etmek için bir sistem durumu tanımı vardır.
Sistem durumu varlığı Sistemin tek bir birimini, birden çok ilgili varlığın mantıksal birleşimini veya sistemin genelini temsil eden mantıksal bileşen.
Sistem durumu Bir varlığın durumu hakkında anlamlı operasyonel içgörüler sağlayan tanımlı ve ölçülebilir durum.
Sistem durumu sinyali Bir varlığın işletimsel davranışı hakkında içgörü sağlayan tek tek veri akışları.
Model modeli Varlıkların bileşen sistemleri için farklı sistem durumu modellerini temsil ettiği bir toplu modelleme kapsamı.

Sistem durumu modellemesi hakkında üst düzey bir anlayış elde etmek için bu videoyu izlemenizi öneririz.

Sağlık, sağlık modelleme ve sağlık modeli nedir?

Sistem durumu terimi, bir varlığın işletimsel durumunu ve bağımlılıklarını ifade eder. Bu varlık bir sistemin tek bir birimi, birden çok ilgili varlığın mantıksal bir bileşimi veya genel sistem olabilir.

Sistem durumunu üç durumdan birinde temsil ettiğinizi öneririz:

  • Sağlıklı: En iyi şekilde çalışır ve kalite beklentilerini karşılar

  • Düzeyi Düşürülmüş: Olası sorunları gösteren iyi durumdan daha az davranış sergiler

  • İyi durumda değil: Kritik bir durumda ve hemen ilgilenilmesi gerekiyor

Not

Daha fazla veri ayrıntı düzeyi sağlamak için durum yerine bir puanla sistem durumunu temsil edebilirsiniz.

Sistem durumu durumları, izleme verileri etki alanı bilgileriyle birleştirilerek türetilir. Her durum tanımlanmalıdır ve ölçülebilir olmalıdır. Sistem durumu durumları, bir varlığın işletimsel davranışı hakkında içgörü sağlayan tek tek veri akışları olan sistem durumu sinyalleri kullanılarak hesaplanır. Sinyaller ölçümler, günlükler, izlemeler veya diğer kalite özelliklerini içerebilir. Örneğin, bir sanal makine (VM) varlığı için sistem durumu sinyali CPU kullanım ölçümünü izleyebilir. Bu varlık için diğer sinyaller bellek kullanımı, ağ gecikme süresi veya hata oranlarını içerebilir.

Sistem durumu sinyallerini tanımlarken iş yükü için işlev dışı gereksinimleri dikkate alabilirsiniz. CPU kullanımı örneğine her sistem durumu için beklenen eşikleri ekleyin. Kullanım, iş yükü gereksinimlerine uygun olarak tolere edilen eşiği aşarsa sistem, İyi Durumdan Düzeyi Düşürülmüş veya İyi Durumda Olmayan durumuna geçer. Bu durum değişiklikleri uygun uyarıları veya eylemleri tetikler.

Sistem durumu modellemesi, varlıkların birden çok sistem durumu sinyalinden türetilmiş ve iş yükü için bağlamsallaştırılmış iyi tanımlanmış durumlara sahip olmasını gerektirir. Örneğin, bir VM'nin sistem durumu tanımı şu olabilir:

  • Sağlıklı: Yanıt süresi, kaynak kullanımı ve genel sistem performansı gibi önemli işlevsiz gereksinimler ve hedefler tam olarak karşılanmıştır. Örneğin, isteklerin %95'i 500 milisaniye içinde işlenir. İş yükü CPU, bellek ve depolama gibi VM kaynaklarını en iyi şekilde kullanır ve iş yükü talepleri ile kullanılabilir kapasite arasında bir denge sağlar. Kullanıcı deneyimi beklenen düzeylerde.

  • Düzeyi düşürüldü: Kaynaklar en iyi performansı göstermiyor, ancak çalışmaya devam ediyor. Örneğin, depolama diskinde azaltma sorunları yaşanıyor. Kullanıcılar yavaş yanıtlarla karşılaşabilir.

  • İyi durumda değil: Bozulma, tolere edilen sınırların ötesindedir. Kaynaklar artık yanıt vermiyor veya kullanılamıyor ve sistem artık kabul edilebilir performans düzeylerini karşılamıyor. Kullanıcı deneyimi ciddi şekilde etkilenir.

Sistem durumu modellemesinin sonucu, bir iş yükü mimarisi için mantıksal varlıkların ve bunların ilişkilerinin bir modeli veya grafik gösterimidir. Her düğümün bir sistem durumu tanımı vardır.

Önemli

Sistem durumu modellemesi , iş senaryolarını iyi anladığınızda farklı kapsamlarda uygulayabileceğiniz ve uygulayabileceğiniz soyut bir kavramdır.

Sistem durumu modeli tanımını gösteren diyagram.

Görüntüde:

  • Varlıklar , iş yükünün sistemin yönlerini temsil eden mantıksal bileşenleridir. Bunlar sunucular, veritabanları ve ağlar gibi altyapı bileşenleri olabilir. Bunlar belirli uygulama modülleri, podlar, hizmetler veya mikro hizmetler de olabilir. Öte yandan varlıklar, iş yükündeki kullanıcı etkileşimlerini ve sistem akışlarını yakalayabilir.

    Not

    Kullanıcı ve sistem akışları, uygulama ve altyapı bileşenlerini içeren iş senaryolarında işlev dışı gereksinimleri özetler. Bu özet, uygulamanın iş değerini yansıtır.

  • Varlıklar arasındaki ilişkiler , sistem içindeki bağımlılık zincirlerini yansıtır. Örneğin, bir uygulama modülü ilişki oluşturan belirli altyapı bileşenlerini çağırabilir.

Bir e-ticaret iş yükünün Azure Service Bus kuyruğunda başarısız iletilerde ani bir artış yaşadığı ve bu da ödemelerin başarısız olmasına neden olan bir senaryo düşünün. Bu sorun, zımni gelir kaybı nedeniyle kuruluş için kritik öneme sahiptir. Bir uygulama geliştiricisi bu ölçüm artışının ödemeler üzerindeki etkisini anlayabilir, ancak bu kabile bilgisi genellikle operasyon ekibi arasında paylaşılmayabilir.

Sistem durumu modeli, operatörlere sorun ve etkileri hakkında anında görünürlük sağlayabilir. Ödeme akışı, iş yükü bileşenlerinden biri olan Service Bus'a bağlıdır. Görsel gösterim, Service Bus örneğinin düşürülmüş durumunu ve ödeme akışı üzerindeki etkisini gösterir. Operatörler sorunun önemini anlayabilir ve düzeltme çalışmalarını bu bileşene odaklayabilir.

Sistem durumu modellemesi önceki senaryoda aşağıdaki yollarla önemliydi:

  • Sorunların ve olası düzeltmelerin daha hızlı algılanmasına yol açan daha hızlı sorun yalıtımı sağlayarak algılama süresini (TTD) ve azaltma süresini (TTM) geliştirdi.

  • Operatörler, gereksiz gürültüyü azaltan durum durumlarına göre uyarılar aldı. Operatörler, ödemeler üzerindeki iş etkisi hakkında belirli bir bağlam sağlayan bildirimler aldı.

  • Bağımlılık zincirleri, operatörlerin operasyonel sorunların kapsamını tam olarak anlamasına yardımcı oldu. Bu bilgi, etki değerlendirmelerini hızlandırdı ve öncelikli yanıtlara yol açtı. İşleçler ayrıca basamaklı veya bağıntılı sorunları kolayca tanımlar.

  • Sistem durumu modeli anomalilerin kök nedenleri ve söz konusu olan belirli sistem durumu sinyalleri hakkında içgörüler sağladığından operatörler olay sonrası etkinlikleri doğrulukla yürütür.

  • İzleme verilerini tüm ekip üyeleri için anlamlı hale getirdi. Kabile bilgisi ile paylaşılan içgörüler arasındaki boşluğu kapatmıştı.

  • Kuruluş, akıllı içgörüler elde etmek için yapay zeka temelli operasyonlara gelecekteki yatırımlar için temel olarak sistem durumu modelini kullanmıştı.

Sistem durumu modeli şeması

Sistem durumu modelleri, gözlemlenebilirlik kullanım örnekleri için iyileştirilmiş ayrı bir veri şeması sağlar. Bu şema, sistem durumu modellemesini soyut bir kavramdan ölçülebilir bir çözüme götürür. Özel gereksinimlerinizi, hedeflerinizi ve mimari bağlamınızı modelleyerek sistem durumu verilerini benzersiz senaryonuza göre uyarlayabilirsiniz.

Sistem durumu tanımını gösteren diyagram.

Sistem durumu, göreli bir veri kavramıdır. Her model, aynı varlık kümesini kullansa bile bağlamsal kapsamı için benzersiz ve önceliklendirilmiş sistem durumu verilerini temsil eder. Belirli bir senaryoda iyi durumda olan şey diğer bağlamlarda önemli ölçüde farklılık gösterebilir.

Örneğin, iş yükünüz içinde aynı türdeki Azure kaynaklarını göz önünde bulundurun.

  • VM A, CPU'ya duyarlı bir uygulama çalıştırır.
  • VM B yoğun bellek kullanan bir hizmeti işler.

Bu makinelerin sistem durumu tanımları farklıdır. CPU kullanım ölçümleri büyük olasılıkla VM A'nın sistem durumunu etkiler ve VM B bellekle ilgili ölçümlerin önceliğini belirleyebilir.

Önemli

Sistem durumu modeli tüm hataları aynı şekilde ele almamalıdır. Beklenen veya geçici ancak kurtarılabilir hatalar ile gerçek bir olağanüstü durum arasında net bir şekilde ayrım yapmalıdır.

Sistem durumu modeli oluşturma

Sistem durumu modeli oluşturmanın ilk adımı, genellikle aşağıdaki bölümlerde açıklanan etkinlikleri içeren mantıksal bir tasarım alıştırmasıdır.

Sistem durumu modelleme etkinliklerini gösteren diyagram.

İş yükü tasarımınızı değerlendirme

İş yükü tasarımınızın aşağıdaki bileşenlerini değerlendirerek bu mantıksal tasarım alıştırmasını başlatın.

  • İşlem kümeleri ve veritabanları gibi altyapı bileşenleri

  • İşlem üzerinde çalışan uygulama bileşenleri ve ilgili bileşenleri

  • Bileşenler arasındaki mantıksal veya fiziksel bağımlılıklar

  • Kullanıcı ve sistem akışları

Örneğin, bir e-ticaret uygulamasının sistem durumu modeli, kullanıcı oturum açma, ödeme ve ödemeler gibi kritik işlemlerin geçerli durumunu temsil etmelidir.

İş gereksinimlerini kullanarak bağlamsallaştırma

Her akışın kuruluşunuz üzerindeki göreli önemini ve genel etkisini değerlendirin. Kullanıcı deneyimi, güvenlik ve operasyonel verimlilik gibi faktörleri göz önünde bulundurun. Örneğin çoğu senaryoda ödeme işleminin başarısız olması, raporlama işleminin başarısızlığından daha önemlidir.

Her akışla ilgili sorunları işlemek için yükseltme yollarını belirleyin. Daha fazla bilgi için bkz . Akışları kullanarak iş yükü tasarımını iyileştirme.

Not

Sağlık modellemesinin değerini yalnızca iş senaryolarınızı ve bağlamınızı birleştirdiğinizde fark edebilirsiniz. Ardından işletmenin operasyonel sorunlardan etkisini rasyonalize edebilirsiniz.

Güvenilirlik ölçümleriyle eşleme

Uygulama tasarımında ilgili güvenilirlik ölçümlerini arayın.

Uygulamanın tamamı ve tek tek iş süreçleri için hizmet düzeyi göstergeleri (SLI) ve hizmet düzeyi hedefleri (SLO) tanımlamayı göz önünde bulundurun. Bu SLI'ler ve SLO'lar, sistem durumu modeliniz için dikkate alınması gereken belirli sistem durumu sinyalleriyle uyumlu olmalıdır. Bunu yaparak, uygulama için kabul edilebilir bir hizmet düzeyinin başarısını doğru bir şekilde yansıtan kapsamlı bir sistem durumu tanımı oluşturursunuz.

Önemli

SLI'ler ve SLO'lar kritik sistem durumu sinyalleridir. Diğer kalite öznitelikleriyle birlikte istediğiniz hizmet düzeyini yansıtan anlamlı bir sistem durumu tanımı oluşturur. Ayrıca, toplu bir zaman aralığında elde etmek istediğiniz sistem durumunu yakalamak için hizmet durumu hedeflerini (SCO' lar) tanımlayabilirsiniz.

Sistem durumu sinyallerini tanımlama

Kapsamlı bir sistem durumu modeli oluşturmak için ölçümler, günlükler ve izlemeler dahil olmak üzere çeşitli izleme verileri türlerini ilişkilendirin. Bunu yaparak, sistem durumu kavramının belirli bir varlığın veya iş yükünün tamamının çalışma zamanı durumunu doğru bir şekilde yansıtmasını sağlarsınız.

Platform ölçümlerini ve günlüklerini kullanma

Sistem durumu modellemesi bağlamında, temel Alınan Azure kaynaklarından platform düzeyinde ölçümler ve günlükler toplamak çok önemlidir. Bu ölçümler CPU yüzdesi, ağ içinde ve ağ çıkışı ile saniye başına disk işlemlerini içerir. Güvenilir bir ortamı korurken olası sorunları algılamak ve tahmin etmek için bu verileri sistem durumu modelinizde kullanabilirsiniz.

Ayrıca, bu yaklaşım geçici hatalar veya geçici kesintiler ile geçici olmayan hatalar veya kalıcı sorunlar arasında ayrım yapmanıza yardımcı olur.

Not

En iyi yöntem olarak, tüm uygulama kaynaklarını tanılama günlüklerini ve ölçümlerini seçilen günlük toplama teknolojisine yönlendirecek şekilde yapılandırmanız gerekir. Uygulama genelinde tutarlı tanılama ayarları sağlamak ve her Azure hizmeti için seçilen yapılandırmayı zorunlu kılmak için Azure İlkesi kullanarak korumalar oluşturun.

Uygulama günlükleri ekleme

Uygulama günlükleri, sistem durumu modeliniz için tanılama verilerinin önemli bir kaynağıdır. Uygulama günlüğü için bazı en iyi yöntemler şunlardır:

  • Anlamsal veya yapılandırılmış günlüğe kaydetmeyi kullanın. Yapılandırılmış günlükler, günlük verilerinin büyük ölçekte otomatik olarak tüketilip analiz edilmesine olanak sağlar.

    Azure kaynak ölçümlerini ve tanılama verilerini depolama hesabı yerine Azure İzleyici Günlükleri çalışma alanında depolamayı göz önünde bulundurun. Bu yöntemi kullanarak, verimli değerlendirme için Kusto sorgularını kullanarak sistem durumu sinyalleri oluşturabilirsiniz.

  • Üretim ortamındaki günlük verileri. Uygulama üretim ortamında çalışırken kapsamlı verileri yakalayın. Sistem durumu değerlendirmesi ve algılanan üretim sorunlarını tanılamak için yeterli bilgi gereklidir.

  • Hizmet sınırlarında olayları günlüğe kaydedin. Hizmet sınırlarını geçen bir bağıntı kimliği ekleyin. Bir işlem birden çok hizmet içeriyorsa ve bunlardan biri başarısız olursa, bağıntı kimliği tüm uygulamanızda istekleri izlemenize ve hatanın nedenini saptamanıza yardımcı olur.

  • Zaman uyumsuz günlüğe kaydetmeyi kullanın. Uygulama kodunu engelleyebilecek zaman uyumlu günlük işlemlerinden kaçının. Zaman uyumsuz günlük, günlük yazma işlemleri sırasında istek kapsamlarını engelleyerek kullanılabilirlik sağlar.

  • Uygulama günlüğünü denetimden ayırın. Denetim günlüklerini tanılama günlüklerinden ayrı olarak koruyun. Denetim kayıtları uyumluluk veya mevzuat gereksinimlerine hizmet etse de, bunların ayrı tutulması bırakılan işlemleri önler.

Dağıtılmış izleme uygulama

Telemetriyi kritik sistem akışları arasında ilişkilendirerek dağıtılmış izleme uygulayın. Bağıntılı telemetri, uçtan uca işlemler hakkında içgörüler sağlar ve hatalar oluştuğunda etkili kök neden analizi (RCA) için gereklidir.

Sistem durumu yoklamalarını kullanma

Uygulamanızın sistem durumunu ve yanıt hızını açıkça denetlemek için uygulama dışında sistem durumu yoklamaları uygulayın ve çalıştırın. Sistem durumu modelinizde sinyal olarak yoklama yanıtlarını kullanın.

Uygulamadan gelen yanıt süresini bir bütün olarak veya tek tek bileşenlerinden ölçerek sistem durumu yoklamalarını uygulayabilirsiniz. Yoklamalar gecikme süresini ölçmek ve kullanılabilirliği denetlemek veya uygulamadan bilgi ayıklamak için işlemler çalıştırabilir. Daha fazla bilgi için bkz . Sistem Durumu Uç Noktası İzleme düzeni.

Yük dengeleyicilerin çoğu, uygulama uç noktalarına yapılandırılmış aralıklarla ping işlemi yapabilen sistem durumu yoklamalarının çalıştırılmasını destekler. Alternatif olarak, bir dış watchdog hizmeti de kullanabilirsiniz. Watchdog hizmeti, iş yükündeki birden çok bileşenden sistem durumu denetimlerini toplar. Watchdogs, bilinen sistem durumu koşulları için anında düzeltmeler yapabilen kodu da barındırabilir.

Yapısal ve işlevsel izleme tekniklerini benimseme

Yapısal izleme, uygulamanın anlamsal günlükler ve ölçümlerle donatılmasını içerir. Uygulama, geçerli bellek tüketimi, istek gecikme süresi ve diğer ilgili uygulama düzeyi verileri içeren bu ölçümleri doğrudan toplar.

İşlevsel izleme kullanarak izleme süreçlerinizi güçlendirin. Bu yaklaşım, platform hizmetlerini ölçmeye ve bunların genel kullanıcı deneyimi üzerindeki etkisine odaklanır. Yapısal izlemeden farklı olarak, işlevsel izleme, sistem hakkında ayrıntılı bilgi gerektirmez. Uygulamanın dışarıdan görünen davranışını test eder. Bu yaklaşım, SLO'ları ve SLI'leri değerlendirmek için kullanışlıdır.

Tasarımı modelleme

Tanımlanan uygulama tasarımını varlıklar ve ilişkiler olarak temsil eder. Varlık düzeyinde sistem durumu durumlarını ölçmek için sistem durumu sinyallerini belirli bileşenlerle eşleyin. Sistem durumu durumlarının model aracılığıyla nasıl yayılması gerektiğini belirlemek için bileşenlerin kritikliğini göz önünde bulundurun. Örneğin, raporlama bileşenleri diğer bileşenler kadar kritik olmayabilir ve bu da genel iş yükü durumu üzerinde farklı etkilere neden olabilir.

Eyleme dönüştürülebilir uyarılar ayarlama

Uyarıları ve otomatik eylemi tetikleme amacıyla değerlendirilen sistem durumu durumlarını kullanın. Sistem durumu, çekirdek gözlemlenebilirlik verisi tenet'i olarak mevcut operasyonel runbook'larla tümleştirilmelidir.

Genellikle, izleme verileriyle uyarı kuralları arasında bire bir eşleme yapılır ve bu da uyarı fırtınaları ve çevresel uyarı gürültüsü gibi istenmeyen sonuçlara yol açabilir. Örneğin, bir işlem kümesinde CPU kullanımına ve hata sayısına dayalı yüksek hacimli VM düzeyinde uyarılar, hatalar sırasında işleçleri zorlayabilir ve çözümde gecikmelere neden olabilir. Benzer şekilde, çok sayıda yapılandırılmış uyarı olduğunda ortam uyarısı gürültüsü genellikle göz ardı edilen veya yoksayılan uyarılarla sonuçlanır.

Sistem durumu modeli, izleme verileriyle uyarı kuralları arasında ayrım sağlar. Sistem durumu tanımı, birçok sinyali tek bir sistem durumu halinde toplar ve bu da operatörlerin yalnızca kuruluş için kritik öneme sahip yüksek değerli uyarılara odaklanmasını sağlayan uyarı sayısını azaltır. E-ticaret senaryolarını göz önünde bulundurun. Service Bus kuyruğu gibi temel kaynaklardaki değişiklikler yerine süreç ödeme akışı sistem durumundaki değişiklikler hakkında bildirim göndermek için bir uyarı ayarlayabilirsiniz.

Not

Sistem durumu modelinin tüm katmanlarında uyarı verebilmek, farklı iş yükü kişilikleri için esneklik sağlar. Uygulama sahipleri ve ürün yöneticileri, önemli iş senaryolarındaki veya iş yükünün tamamında sistem durumu değişiklikleri konusunda uyarılabilir. İşleçler, altyapı veya uygulama bileşenlerinin durumuna göre uyarılabilir.

Modeli görselleştirme

Sistem durumu modelinin geçerli durumunu ve geçmişini etkili bir şekilde iletmek için tablolar veya grafikler gibi görsel gösterimler oluşturun. Görselleştirmenin iş bağlamıyla uyumlu olduğundan ve eyleme dönüştürülebilir içgörüler sağladığından emin olun.

Sistem durumu modelinizi görselleştirdiğinizde, bağımlılık zincirleri arasında sağlık durumlarının hemen içgörü sahibi olmasını sağlamak için bir trafik ışığı yaklaşımını benimsemeyi göz önünde bulundurun.

Sağlıklı için yeşil, düzeyi düşürülmüş için kehribar ve iyi durumda olmayanlar için kırmızı atayın. Renk kodlu durumları hızla tanımlayarak, herhangi bir uygulama düşüşünün kök nedenini verimli bir şekilde bulabilirsiniz.

Diyagramda trafik ışığı yaklaşımı kullanan bir sistem durumu modeli gösterilmektedir.

Not

Sağlık modeliniz için bir pano oluştururken görme engelli kişiler için erişilebilirlik gereksinimlerini göz önünde bulundurmanızı öneririz. En iyi diyagram oluşturma yöntemleri için bkz . Mimari tasarım diyagramları.

Sağlık modelinizi benimseme

Bir sistem durumu modeli derledikten sonra, hataların veya operasyonel sorunların algılanması ve yorumlanması için aşağıdaki kullanım örneklerini göz önünde bulundurun.

Çeşitli rollere uygulanabilirlik

Sistem durumu modellemesi, iş işlevlerine veya iş yükünün aynı bağlamındaki rollere özgü bilgiler sağlayabilir. Örneğin DevOps rolünün işletimsel sistem durumu bilgilerine ihtiyacı olabilir. Bir güvenlik görevlisi izinsiz giriş sinyalleri ve güvenlik açığa çıkarma konusunda daha fazla endişe duyabilir. Veritabanı yöneticisi büyük olasılıkla veritabanı kaynakları aracılığıyla uygulama modelinin yalnızca bir alt kümesiyle ilgilenir.

Farklı paydaşlar için sistem durumu içgörülerini uyarlayın. Çakışan veri kümelerinden ayrı modeller oluşturmayı göz önünde bulundurun.

Sürekli doğrulama

Yük testi ve kaos testi gibi test ve doğrulama süreçlerini iyileştirmek için sistem durumu modelinizi kullanın. Test sırasında çalışma zamanı işletim durumunu doğrulayabilir ve sistem durumu modellerini mühendislik yaşam döngünüze ekleyerek modelinizin ölçek ve hata senaryolarındaki etkinliğini değerlendirebilirsiniz.

Kuruluş durumu

Sistem durumu modellemesi genellikle tek tek uygulamalar için durum durumlarının nicelenmesiyle ilişkili olsa da, uygulanabilirliği bu kapsamın ötesine uzanır.

Sistem durumu modelleri, tek bir iş yükü düzeyinde uygulama gözlemlenebilirliği ve operasyonel içgörüler için bir temel sağlar. Her uygulamanın kendi bağlamında her sistem durumu ne anlama geldiğini yakalayan kendi sistem durumu modeli olabilir.

Bir model modeli oluşturarak birden çok sistem durumu modelini üst düzey bir yapıda birleştirebilirsiniz. Örneğin, sistem durumu modellerini daha büyük bir modelde bileşen olarak kullanarak bir iş biriminin veya bulut varlığının tamamının gözlemlenebilirlik ayak izini oluşturabilirsiniz. Sistem durumu modelleri, varlık içindeki iş yüklerini en üst düzey grafın içindeki düğümler olarak temsil eder. Veri akışları, hizmet etkileşimleri ve paylaşılan altyapı gibi uygulamalar arası bağımlılıkları yakalamak için bu modeldeki ilişkileri kullanın.

E-ticaret, ödemeler ve sipariş işleme için çeşitli uygulamaları olan bir perakende şirketi düşünün. Bu uygulamaların her birini bağımsız bir sistem durumu modeli olarak tanımlayıp bu iş yükü için sistem durumunun ne anlama geldiğini belirleyebilirsiniz. Ardından, bu bileşen durumu modellerinin tümünü varlık olarak eşlemek ve bağımlılık zincirleri aracılığıyla uygulamalar arası operasyonel etkiyi yakalamak için bir üst model kullanabilirsiniz. Örneğin, e-ticaret uygulaması iyi durumda değilse, ödeme uygulaması üzerinde basamaklı bir etkisi olur.

Sistem durumu modellemesi, belirli bir iş bağlamı için ayarlanmış, ölçülebilir bir işlem temeli sağlar. BT operasyonları için yapay zeka (AIOps), operasyonel verimliliği artırmanın popüler bir yoludur. Sistem durumu verileri, makine öğrenmesi modellerinin sistem durumu eğilimlerini analiz etmek için temel bir giriştir. Örneğin, makine öğrenmesi modelleri şunları yapabilir:

  • Durum değişikliklerinden daha fazla içgörü ayıklayın ve eylemler önerin.

  • Sorun tahmini ve model iyileştirmesi sağlamak için zaman içindeki sistem durumu eğilimlerini analiz edin.

Sistem durumu modelinizi koruma

Heath modelini korumak, uygulamanızın geliştirme ve işlemleriyle uyumlu sürekli bir mühendislik etkinliğidir. Uygulamanız geliştikçe sağlık modelinizin paralel olarak geliştiğine emin olun.

Ayrıca, sistem durumu modellerini geliştirme yaşam döngünüzle tümleştirilmesi gereken iş yükü yapıtları gibi değerlendirin. Sistem durumu modelinizin tutarlı, sürüm denetimli yönetimi için kod olarak altyapıyı (IaC) benimseyin. İş yüküne altyapı ve uygulama bileşenleri eklerken veya kaldırırken modelin güncel kalması için otomasyonu kullanın.

Sistem durumu verileri zaman içinde değer olarak yavaş yavaş azalır. Operasyonel verimliliği iyileştirmek ve maliyetleri en aza indirmek için sistem durumu verilerini 30 günden fazla tutmaktan kaçının. Gerekirse, denetim gereksinimlerini karşılamak için veya BT işlemleri için yapay zekada uzun vadeli desen analizi içeren senaryolarda verileri arşivleyebilirsiniz.

Not

Sistem durumu verilerini arşivlerken modelin yapılandırma durumuyla ilişkilendirdiğinizden emin olun. Durum değişikliklerini yorumlamak bu bağlam olmadan zor olabilir.

Sonraki adım