Azure Cosmos DB: przypadki użycia analizy no-ETL

DOTYCZY: NoSQL MongoDB Gremlin

Usługa Azure Cosmos DB oferuje różne opcje analizy dla analizy bez etL, niemal w czasie rzeczywistym na danych operacyjnych. Analizę danych usługi Azure Cosmos DB można włączyć przy użyciu następujących opcji:

  • Dublowanie usługi Azure Cosmos DB w usłudze Microsoft Fabric
  • Usługa Azure Synapse Link dla usługi Azure Cosmos DB

Aby dowiedzieć się więcej o tych opcjach, zobacz "Analiza i analiza biznesowej w danych usługi Azure Cosmos DB".

Ważne

Dublowanie usługi Azure Cosmos DB w usłudze Microsoft Fabric jest teraz dostępne w wersji zapoznawczej dla interfejsu API NoSql. Ta funkcja zapewnia wszystkie możliwości usługi Azure Synapse Link z lepszą wydajnością analityczną, możliwość ujednolicenia majątku danych za pomocą usługi Fabric OneLake i otwierania dostępu do danych w usłudze OneLake w formacie Delta Parquet. Jeśli rozważasz usługę Azure Synapse Link, zalecamy wypróbowanie dublowania w celu oceny ogólnego dopasowania organizacji. Aby rozpocząć dublowanie, kliknij tutaj.

Analiza niemal w czasie rzeczywistym nie może otwierać różnych możliwości dla Twoich firm. Oto trzy przykładowe scenariusze:

  • Analiza łańcucha dostaw, prognozowanie i raportowanie
  • Personalizacja w czasie rzeczywistym
  • Konserwacja predykcyjna, wykrywanie anomalii w scenariuszach IOT

Analiza łańcucha dostaw, prognozowanie i raportowanie

Badania naukowe pokazują, że osadzanie analizy danych big data w operacjach łańcucha dostaw prowadzi do ulepszeń w czasie dostarczania w kolejności do cyklu i wydajności łańcucha dostaw.

Producenci dołączają do technologii natywnych dla chmury, aby przełamać ograniczenia starszych systemów planowania zasobów przedsiębiorstwa (ERP) i zarządzania łańcuchem dostaw (SCM). W przypadku łańcuchów dostaw generujących coraz większe ilości danych operacyjnych co minutę (zamówienie, przesyłka, dane transakcji) producenci potrzebują operacyjnej bazy danych. Ta operacyjna baza danych powinna być skalowana w celu obsługi woluminów danych, a także platformy analitycznej, aby uzyskać poziom analizy kontekstowej w czasie rzeczywistym, aby wyprzedzać krzywą.

Poniższa architektura przedstawia możliwości korzystania z usługi Azure Cosmos DB jako natywnej dla chmury operacyjnej bazy danych w analizie łańcucha dostaw:

Diagram analizy w czasie rzeczywistym dla usługi Azure Cosmos DB w łańcuchu dostaw.

Na podstawie poprzedniej architektury można uzyskać następujące przypadki użycia:

  • Przygotowywanie i trenowanie potoku predykcyjnego: generowanie szczegółowych informacji na temat danych operacyjnych w łańcuchu dostaw przy użyciu tłumaczenia uczenia maszynowego. Dzięki temu można obniżyć koszty zapasów, operacji i skrócić czas realizacji zamówień dla klientów.

Dublowanie i usługa Synapse Link umożliwiają analizowanie zmieniających się danych operacyjnych w usłudze Azure Cosmos DB bez ręcznych procesów ETL. Te oferty pozwalają zaoszczędzić na dodatkowych kosztach, opóźnieniach i złożoności operacyjnej. Umożliwiają inżynierom danych i analitykom danych tworzenie niezawodnych potoków predykcyjnych:

  • Wykonywanie zapytań dotyczących danych operacyjnych z usługi Azure Cosmos DB przy użyciu natywnej integracji z pulami platformy Apache Spark w usłudze Microsoft Fabric lub Azure Synapse Analytics. Dane można wykonywać w notesie interaktywnym lub zaplanowanych zadaniach zdalnych bez złożonej inżynierii danych.

  • Tworzenie modeli uczenia maszynowego (ML) przy użyciu algorytmów spark ML i integracji usługi Azure Machine Learning (AML) w usłudze Microsoft Fabric lub Azure Synapse Analytics.

  • Odnotuj wyniki po wnioskowaniu modelu w usłudze Azure Cosmos DB w celu uzyskania operacyjnego oceniania niemal w czasie rzeczywistym.

  • Raportowanie operacyjne: zespoły łańcucha dostaw potrzebują elastycznych i niestandardowych raportów w czasie rzeczywistym, dokładnych danych operacyjnych. Te raporty są wymagane do uzyskania migawki widoku skuteczności łańcucha dostaw, rentowności i produktywności. Umożliwia ona analitykom danych i innym kluczowym uczestnikom projektu ciągłe ponowne ocenianie firmy i identyfikowanie obszarów w celu zmniejszenia kosztów operacyjnych.

Dublowanie i usługa Synapse Link dla usługi Azure Cosmos DB umożliwiają zaawansowane scenariusze analizy biznesowej (BI)/raportowania:

  • Wykonywanie zapytań dotyczących danych operacyjnych z usługi Azure Cosmos DB przy użyciu natywnej integracji z pełną ekspresyjnością języka T-SQL.

  • Modelowanie i publikowanie automatycznie odświeżanych pulpitów nawigacyjnych analizy biznesowej w usłudze Azure Cosmos DB za pośrednictwem usługi Power BI zintegrowanej z usługą Microsoft Fabric lub Azure Synapse Analytics.

Poniżej przedstawiono wskazówki dotyczące integracji danych dla danych wsadowych i przesyłanych strumieniowo do usługi Azure Cosmos DB:

  • Integracja i aranżacja danych wsadowych: łańcuchy dostaw coraz bardziej złożone, platformy danych łańcucha dostaw muszą być zintegrowane z różnymi źródłami danych i formatami. Usługi Microsoft Fabric i Azure Synapse są wbudowane z tym samym aparatem integracji danych i środowiskami co usługa Azure Data Factory. Ta integracja umożliwia inżynierom danych tworzenie rozbudowanych potoków danych bez oddzielnego aparatu aranżacji:

  • Integracja i przetwarzanie danych przesyłanych strumieniowo: wraz ze wzrostem przemysłowych IoT (czujniki śledzące zasoby z "podłogi do sklepu", połączone floty logistyczne itp.), istnieje eksplozja danych w czasie rzeczywistym generowanych w sposób przesyłania strumieniowego, który musi być zintegrowany z tradycyjnymi wolno poruszającymi się danymi w celu generowania szczegółowych informacji. Usługa Azure Stream Analytics to zalecana usługa do przesyłania strumieniowego etL i przetwarzania na platformie Azure z szeroką gamą scenariuszy. Usługa Azure Stream Analytics obsługuje usługę Azure Cosmos DB jako natywny ujście danych.

Personalizacja w czasie rzeczywistym

Sprzedawcy detaliczni muszą dziś tworzyć bezpieczne i skalowalne rozwiązania do handlu elektronicznego, które spełniają wymagania zarówno klientów, jak i firm. Te rozwiązania do handlu elektronicznego muszą angażować klientów za pośrednictwem dostosowanych produktów i ofert, szybko i bezpiecznie przetwarzać transakcje oraz skupiać się na realizacji i obsłudze klienta. Usługa Azure Cosmos DB wraz z najnowszą wersją usługi Synapse Link dla usługi Azure Cosmos DB umożliwia sprzedawcom detalicznym generowanie spersonalizowanych zaleceń dla klientów w czasie rzeczywistym. Używają ustawień spójności o małych opóźnieniach i dostrajania, aby uzyskać natychmiastowe szczegółowe informacje, jak pokazano w następującej architekturze:

Diagram usługi Azure Cosmos DB w personalizacji w czasie rzeczywistym.

  • Przygotowywanie i trenowanie potoku predykcyjnego: możesz wygenerować szczegółowe informacje na temat danych operacyjnych w jednostkach biznesowych lub segmentach klientów przy użyciu modeli usługi Fabric lub Synapse Spark i uczenia maszynowego. Przekłada się to na spersonalizowane dostarczanie do docelowych segmentów klientów, predykcyjne środowiska użytkownika końcowego i ukierunkowanego marketingu w celu dopasowania do wymagań użytkownika końcowego. )

Konserwacja predykcyjna IOT

Innowacje przemysłowe IOT znacząco zmniejszyły przestoje maszyn i zwiększyły ogólną wydajność we wszystkich dziedzinach przemysłu. Jedną z takich innowacji jest analiza konserwacji predykcyjnej maszyn na brzegu chmury.

Poniżej przedstawiono architekturę korzystającą z natywnych funkcji HTAP chmury w konserwacji predykcyjnej IoT:

Diagram usługi Azure Cosmos DB w konserwacji predykcyjnej IOT.

  • Przygotowywanie i trenowanie potoku predykcyjnego: historyczne dane operacyjne z czujników urządzeń IoT mogą służyć do trenowania modeli predykcyjnych, takich jak detektory anomalii. Te detektory anomalii są następnie wdrażane z powrotem do krawędzi na potrzeby monitorowania w czasie rzeczywistym. Taka cnotliwa pętla umożliwia ciągłe ponowne trenowanie modeli predykcyjnych.

  • Raportowanie operacyjne: wraz ze wzrostem inicjatyw cyfrowych reprezentacji bliźniaczych firmy zbierają ogromne ilości danych operacyjnych z dużej liczby czujników w celu utworzenia cyfrowej kopii poszczególnych maszyn. Te dane umożliwiają usłudze BI zrozumienie trendów dotyczących danych historycznych oprócz ostatnich gorących danych.