Zarządzanie danymi głównymi w siatkach danych

Przedsiębiorstwa korzystające z architektury siatki danych często mają dużą liczbę domen, z których każda zawiera unikatowe systemy i dane.

Ten szeroki zakres danych zwiększa złożoność, ponieważ w tej konfiguracji może istnieć wiele wersji tych samych danych. Integracja wymaga większego nakładu pracy, ponieważ właściciele muszą zintegrować i zharmonizować wszystkie różne części tych samych danych z wielu domen. Dane mogą być niespójne w kontekstach między tymi różnymi domenami. Jakość danych może się również różnić. Zastosuj zarządzanie danymi głównymi (MDM), aby sprostać tym wyzwaniom.

Zarządzanie danymi głównymi zorientowanymi na domenę

Główne numery identyfikacyjne są ważnym aspektem zarządzania urządzeniami przenośnymi. Główne numery identyfikacyjne łączą dane master i dane z domen. Te liczby mają kluczowe znaczenie dla możliwości śledzenia danych, które zostały opanowane i jakie dane należą do siebie. Unikatowe dane można identyfikować tylko i przypisywać główne numery identyfikacyjne centralnie, a nie lokalnie w systemie. Dane główne z różnych systemów muszą być razem w rozwiązaniu MDM.

Rozwiązanie MDM działa inaczej w architekturach zorientowanych na domenę ze względu na ich rozproszony charakter. Spójność jest trudniejsza do osiągnięcia, ponieważ polegasz na rozwiązaniu MDM w domenach.

Jednym ze sposobów osiągnięcia spójności jest pytanie, aby domeny były zgodne z centralnie zarządzanymi danymi głównymi podczas dystrybucji produktów danych. Listę danych głównych można opublikować w głównym magazynie danych lub w centralnym repozytorium. Domena może klasyfikować dane przy użyciu identyfikatorów referencyjnych przedsiębiorstwa z danych referencyjnych przedsiębiorstwa podczas dystrybucji produktów danych w innych domenach. Dzięki temu inne domeny szybko rozpoznają wszystkie dane główne w tych produktach danych.

Domena Zarządzanie danymi master

Możesz również utworzyć nowe domeny MDM podczas grupowania działań MDM i używania głównego magazynu danych jako scentralizowanego repozytorium. Każda nowa domena MDM powinna zawierać określony podmiot danych, na który koncentruje się identyfikacja i kontrola danych głównych. Niektóre znane przykłady tych danych obejmują klientów, produkty, pracowników, lokalizacje geograficzne oraz informacje o finansach i ryzyku. Dane mastered z tych domen MDM muszą znaleźć drogę powrotną do innych domen. Ta dystrybucja danych jest podobna do rozkładu produktów danych.

Możesz określić zakres zarządzania danymi głównymi i zezwolić na różne podejścia do dystrybucji produktów danych. W granicach określonego zakresu produkty danych nie muszą być zgodne z danymi głównymi przedsiębiorstwa, ale poza granicami zakresu produkty danych muszą być zgodne. Ten wzorzec można również zastosować odwrotnie, wymagając przestrzegania danych głównych tylko w określonym zakresie, a nie poza nim. W tych konfiguracjach dane mastered są centralnie zarządzane w rozwiązaniu MDM. Domeny muszą wymieniać dane główne, aby wiedzieć, które dane lokalne mają być mapowanie na centralne dane główne. Zidentyfikuj i zachowaj te relacje, aby wiedzieć, które dane zostały opanowane i które dane można szybko połączyć ze sobą. Jeśli lokalne klucze domeny w systemie operacyjnym zmienią się, identyfikator główny jest jedynym elementem powiązania wszystkiego razem.

W przypadku dystrybucji identyfikatorów głównych nie należy ekstrapolować identyfikatorów wzorca MDM do wszystkich systemów źródłowych. Może to spowodować problemy ze spójnością. Tylko aplikacje lub systemy, które podlegają rozwiązaniu MDM, powinny uzyskać identyfikator główny z centrum MDM. Systemy, które nie podlegają rozwiązaniu MDM, powinny używać własnej integralności lokalnej (domeny).

Zarządzanie danymi głównymi na poziomie domeny

Jeśli szukasz nakładających się danych, prawdopodobnie odkryjesz różne stopnie nakładania się. Niektóre dane są ogólne i obejmują wiele domen. Inne dane mają ograniczone nakładanie się i obejmuje tylko kilka domen. Rozróżnianie ilości danych nakładających się i ich znaczenia przez rozszerzenie zarządzania urządzeniami przenośnymi na zarządzanie urządzeniami przenośnymi na poziomie domeny. Można to zrobić, tworząc częściowe widoki danych głównych w określonym zakresie. Jest to przydatne, gdy dane są udostępniane między niektórymi, ale nie wszystkimi domenami.

Zarządzanie danymi wzorca na poziomie domeny

Ważne jest, aby nakładające się domeny zarządzały danymi, ale nie mają centralnej zależności. Rozwiązania MDM mogą pomóc w osiągnięciu tego celu. Użycie można znacznie uprościć, abstrahując infrastrukturę i udostępniając rozwiązanie MDM jako usługę do domen. Jeśli używasz centralnego rozwiązania, zastosuj segregowane widoki dla każdej domeny lub zakresu.

Osiągnięcie spójności ze składnikami wielokrotnego użytku

Udostępnianie kodu to kolejny sposób zapewnienia współpracy i możliwości ponownego stosowania danych głównych. Zamiast udostępniać dane główne, udostępniasz podstawowy kod (fragmenty kodu i skrypty), aby wygenerować dane wyjściowe i promować skuteczne ponowne użycie. Zapisz ten podstawowy kod w centralnym repozytorium i otwórz go za pomocą kontroli wersji. Wszystkie zespoły mogą współtworzyć i ulepszać kod, który znajduje się w tym repozytorium.

W tym modelu stosuje się logikę biznesową tylko w domenach. Twoje zespoły mogą odejść, wprowadzić ulepszenia lub użyć nieco zoptymalizowanych wersji logiki, jak widzą dopasowanie. Dane wyjściowe można ponownie wygenerować, ponieważ ulepszenia społeczności zostaną dodane do centralnego repozytorium kodu.

Należy pamiętać, że umożliwienie zespołom modyfikowania kodu może utrudnić porównywanie wyników między różnymi zespołami, co może mieć wpływ na spójność.

Podsumowanie zarządzania danymi głównymi

Użytkownicy mogą podejmować prawidłowe decyzje tylko wtedy, gdy używane dane są spójne i poprawne. Za pomocą rozwiązania MDM można zapewnić spójność i jakość danych na poziomie przedsiębiorstwa.

Twoja organizacja musi znaleźć poprawną równowagę dla zarządzania urządzeniami przenośnymi. Zbyt wiele obszarów danych głównych lub wartości referencyjnych prowadzi do zbyt dużego wyrównania między domenami. Brak danych przedsiębiorstwa sprawia, że nie można porównać żadnych wyników. Praktycznym sposobem rozpoczęcia korzystania z rozwiązania MDM w zrównoważony sposób jest zaimplementowanie repozytorium. Jest to najprostszy sposób zarządzania danymi głównymi organizacji. W repozytorium nie trzeba dostosowywać systemów domeny, aby dowiedzieć się, jakie dane są niskiej jakości lub muszą być dopasowane. Dzięki repozytorium ułatwiającemu uzyskanie tych informacji można szybciej dostarczać wartość.

Po zaimplementowaniu repozytorium należy określić jasny zakres. Nie wpadaj w pułapkę zjednoczenia danych przedsiębiorstwa, wybierając wszystkie dane. Tylko dane główne z najważniejszych pól. Zacznij od wybrania tematów, które dodają największą wartość, na przykład klientów, kontraktów, produktów i jednostek organizacyjnych. Liczba atrybutów powinna znajdować się w dziesiątkach, a nie setkach lub tysiącach.

Dostosuj procesy i ład po osiągnięciu umowy z domenami. Uściślij wszelkie umowy dotyczące osi czasu i przeglądów dla wszystkich domen. Upewnij się również, że pracujesz nad metadanymi. Wykaz danych głównych. Upewnij się, że domeny wiedzą, które elementy danych są kandydatami do systemów źródłowych i jak te elementy przepływają przez potoki danych.

Ostatnim krokiem i ostatecznym celem jest osiągnięcie współistnienia. Ulepszenia powinny przepływać bezpośrednio do domen. Jest to najtrudniejsza część procesu, ponieważ wymaga wprowadzenia wielu zmian architektury. Twoje domeny muszą mieć możliwość obsługi poprawek i ulepszeń wysyłanych z centralnie zarządzanego rozwiązania MDM.

Następne kroki