Operasyon için tasarlama
Uygulamayı, operasyon ekibinin ihtiyaç duyduğu araçlara sahip olacağı şekilde tasarlayın
Bulut, operasyon ekibinin rolünü önemli ölçüde değiştirdi. Artık uygulamayı barındıran donanım ve altyapıyı yönetmekten sorumlu değiller. Yine de operasyon ekibi, başarılı bir bulut uygulaması çalıştırmanın kritik bir parçası. Operasyon ekibinin önemli işlevlerinden bazıları şunlardır:
- Dağıtım
- İzleme
- Önem Yükseltme
- Olay yanıtı
- Güvenlik denetimi
Bulut uygulamalarında güçlü günlük kayıtları ve izleme olanakları özellikle önemlidir. Uygulamanın başarılı olmaları için ihtiyaç duydukları verileri ve içgörüleri sağladığından emin olmak için operasyon ekibini tasarım ve planlamaya dahil edin.
Öneriler
Her şeyin takip edilebilir olmasını sağlayın. Bir çözüm dağıtılmış ve çalışır durumdaysa sistem hakkında öncelikli bilgileri günlükler ve izlemeler sağlar. İzleme sistemde bir yolu takip eder. Performans sorunlarını ve hata noktalarını saptamak için yararlıdır. Günlük kaydı uygulama durumu değişiklikleri, hatalar ve özel durumlar gibi tek tek olayları yakalar. Üretim sürecinde günlük kaydı tutmazsanız en çok ihtiyaç duyacağınız bilgileri kaybedersiniz.
İzleme için işaretleyin. İzleme, bir uygulamanın, kullanılabilirlik, performans ve sistem durumu bakımından ne kadar iyi ya da kötü çalıştığı hakkında bilgi sağlar. İzleme ile örneğin SLA’nızı karşılayıp karşılamadığınızı görebilirsiniz. İzleme, sistemin normal işleyişi sırasında gerçekleşir. Personelin sorunlara hızlıca yanıt verebilmesi için gerçek zamanlıya olabildiğince yakın olmalıdır. İdeal olarak, izleme, sorunları kritik bir hataya neden olmadan önce engellemeye yardımcı olur. Daha fazla bilgi için bkz. İzleme ve tanılama.
Kök neden analizi için işaretleyin. Kök neden analizi, hataların temel nedenini bulma işlemidir. Bir hata zaten oluştuktan sonra gerçekleşir.
Dağıtılmış izlemeyi kullanın. Eşzamanlılık, desenkronizasyon ve bulut ölçeği için tasarlanmış bir dağıtılmış izleme sistemi kullanın. İzlemeler, hizmet sınırları boyunca akan bir bağıntı kimliği içermelidir. Tek bir işlemde birden çok uygulama hizmetine çağrılar olabilir. Bir işlem başarısız olursa, bağıntı kimliği hatanın nedenini belirlemenize yardımcı olur.
Günlükleri ve ölçümleri standartlaştırın. İşlemler ekibinin, çözümünüzün çeşitli hizmetlerinden günlükleri toplaması gerekir. Her hizmet kendi günlük biçimini kullanıyorsa, onlardan faydalı bilgiler almak zor veya imkansız olur. Bağıntı kimliği, olay adı, gönderenin IP adresi gibi alanlar içeren ortak bir şema tanımlayın. Tek tek hizmetler temel şemayı devralan özel şemalar türetebilir ve ek alanlar içerebilir.
Sağlama, dağıtım ve izleme dahil olmak üzere yönetim görevlerini otomatikleştirin. Bir görevin otomatikleştirilmesi bu görevi yinelenebilir hale getirir ve insan hatası olasılığını azaltır.
Yapılandırmayı kod olarak işleyin. Yapılandırma dosyalarını bir sürüm denetim sistemine dahil edin, böylece değişiklikleri ve sürüm farklarını izleyebilir, gerekirse geri alabilirsiniz.