Wzorce referencyjne aplikacji danych

Podczas dołączania aplikacji danych do strefy docelowej danych zespół otrzyma dostęp do dedykowanej grupy zasobów, podsieci i zasobów udostępnionych. Od tego momentu własność środowiska jest przekazywana odpowiednio do zespołu aplikacji danych. Te zespoły muszą przejąć odpowiedzialność od kompleksowej implementacji i własności kosztów.

Aby uprościć sposób rozpoczęcia pracy i skrócić czas realizacji w celu utworzenia środowiska dla określonego przypadku użycia, organizacje mogą udostępniać wzorce referencyjne wewnętrznie. Te implementacje referencyjne składają się z definicji infrastruktury jako kodu (IaC), aby pomyślnie utworzyć zestaw usług dla określonego przypadku użycia, takiego jak przetwarzanie danych wsadowych, przetwarzanie danych przesyłanych strumieniowo lub nauka o danych i zademonstrowanie ścieżki do sukcesu. Potencjalnie te wzorce obejmują również ogólny kod aplikacji, który może być używany jako punkt odniesienia podczas implementowania rozwiązań danych. Wzorce referencyjne aplikacji danych mogą się różnić w zależności od używanych narzędzi i wzorców implementacji danych wielokrotnie używanych w strefach docelowych danych. Analiza w skali chmury udostępnia również zestaw wyselekcjonowanych projektów referencyjnych aplikacji danych, których można używać jako punktu odniesienia i które można dodatkowo ulepszyć przez przedsiębiorstwa w zależności od ich wymagań. Można je znaleźć tutaj:

Inne automatyzacje mogą służyć do dalszego zmniejszania potencjalnych punktów tarć i automatyzowania nawet początkowego wdrożenia wzorca dla zespołów aplikacji danych. Aby uzyskać więcej informacji, zapoznaj się z tematem Automatyzacja platformy i Metodyka DevOps na potrzeby analizy w skali chmury.

Ostatecznie celem powinno być przekazanie tych implementacji referencyjnych zespołom aplikacji danych, ponieważ powinny one być właścicielem ogólnej bazy kodu rozwiązania. Dodatkowe warstwy abstrakcji, takie jak specyfikacje szablonów platformy Azure, są również opcją, ale po prostu zwiększ liczbę punktów tarcia, ponieważ wymagane zmiany muszą zostać ponownie zażądane od centralnego zespołu, który jest właścicielem tych zasobów i utrzymuje je. Centralny zespół musi następnie podjąć działania w celu przetestowania i wydania zmian. Ponadto bardziej złożony proces zarządzania wydaniami może być wymagany, aby nie wpływać na innych użytkowników specyfikacji szablonu. Ponadto szablony staną się bardziej złożone wraz z upływem czasu, ponieważ każdy zespół może wymagać udostępnienia różnych parametrów w celu zastosowania pewnych zmian w szablonie. W związku z tym przekazanie wzorców referencyjnych jest najprostszym i najbardziej efektywnym rozwiązaniem, ponieważ umożliwia to zespołom aplikacji danych wprowadzanie niezbędnych zmian, jeśli zajdzie taka potrzeba. Ujawnienie tych zespołów koncepcji IaC jest dobrym podejściem, które może zająć trochę czasu, ale ostatecznie spowoduje lepsze praktyki inżynieryjne na platformie danych.

Aby uzyskać więcej informacji, zobacz Scaling Cloud-scale analytics (Skalowanie analizy w skali chmury).