Kurz: Nastavení dávky datového produktu

V tomto kurzu se dozvíte, jak nastavit datové služby produktů, které jsou už nasazené. Pomocí služby Azure Data Factory můžete integrovat a orchestrovat data a používat Microsoft Purview ke zjišťování, správě a řízení datových prostředků.

Naučte se:

  • Vytvoření a nasazení požadovaných prostředků
  • Přiřazení rolí a přístupových oprávnění
  • Připojení prostředků pro integraci dat

Tento kurz vám pomůže seznámit se se službami nasazenými ve skupině prostředků ukázkového datového <DMLZ-prefix>-dev-dp001 produktu. Vyzkoušejte si, jak se služby Azure vzájemně provedou a jaká bezpečnostní opatření se používají.

Při nasazování nových komponent budete mít možnost prozkoumat, jak Purview spojuje zásady správného řízení služeb, abyste vytvořili ucelenou a aktuální mapu vaší datové krajiny. Výsledkem je automatizované zjišťování dat, klasifikace citlivých dat a kompletní rodokmen dat.

Požadavky

Než začnete s nastavením dávky datového produktu, ujistěte se, že splňujete tyto požadavky:

  • Předplatné Azure. Pokud ještě nemáte předplatné Azure, vytvořte si ještě dnes bezplatný účet Azure.

  • Oprávnění k předplatnému Azure Pokud chcete pro nasazení nastavit Purview a Azure Synapse Analytics, musíte mít v předplatném Azure roli Správce uživatelských přístupů nebo roli Vlastník . V tomto kurzu nastavíte další přiřazení rolí pro služby a instanční objekty.

  • Nasazené prostředky. K dokončení kurzu už musí být tyto prostředky nasazené ve vašem předplatném Azure:

    • Cílová zóna správy dat Další informace najdete v úložišti GitHubu cílové zóny správy dat.
    • Cílová zóna dat Další informace najdete v úložišti GitHubu cílové zóny dat.
    • Datová dávka produktu. Další informace najdete v úložišti GitHub batch datového produktu.
  • Účet Microsoft Purview. Účet se vytvoří jako součást nasazení cílové zóny správy dat.

  • Místní prostředí Integration Runtime Modul runtime se vytvoří jako součást nasazení cílové zóny dat.

Poznámka:

V tomto kurzu zástupné symboly odkazují na požadované prostředky, které nasadíte před zahájením kurzu:

  • <DMLZ-prefix> odkazuje na předponu, kterou jste zadali při vytváření nasazení cílové zóny správy dat.
  • <DLZ-prefix> odkazuje na předponu, kterou jste zadali při vytváření nasazení cílové zóny dat.
  • <DP-prefix> odkazuje na předponu, kterou jste zadali při vytváření dávkového nasazení datového produktu.

Vytváření instancí azure SQL Database

Pro zahájení tohoto kurzu vytvořte dvě ukázkové instance služby SQL Database. Databáze použijete k simulaci zdrojů dat CRM a ERP v dalších částech.

  1. Na webu Azure Portal v globálních ovládacích prvcích portálu vyberte ikonu Cloud Shellu a otevřete terminál Azure Cloud Shellu. Jako typ terminálu vyberte Bash .

    Snímek obrazovky znázorňující ikonu Cloud Shellu na webu Azure Portal

  2. V Cloud Shellu spusťte následující skript. Skript najde <DLZ-prefix>-dev-dp001 skupinu prostředků a <DP-prefix>-dev-sqlserver001 server Azure SQL, který je ve skupině prostředků. Pak skript vytvoří na serveru dvě instance <DP-prefix>-dev-sqlserver001 služby SQL Database. Databáze jsou předem vyplněné ukázkovými daty AdventureWorks. Data zahrnují tabulky, které používáte v tomto kurzu.

    Nezapomeňte nahradit zástupnou hodnotu parametru subscription vlastním ID předplatného Azure.

    # Azure SQL Database instances setup
    # Create the AdatumCRM and AdatumERP databases to simulate customer and sales data.
    
    # Use the ID for the Azure subscription you used to deployed the data product.
    az account set --subscription "<your-subscription-ID>"
    
    # Get the resource group for the data product.
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, 'dp001')==\`true\`].name")
    
    # Get the existing Azure SQL Database server name.
    sqlServerName=$(az sql server list -g $resourceGroupName -o tsv  --query "[?contains(@.name, 'sqlserver001')==\`true\`].name")
    
    # Create the first SQL Database instance, AdatumCRM, to create the customer's data source.
    az sql db create --resource-group $resourceGroupName --server $sqlServerName --name AdatumCRM --service-objective Basic --sample-name AdventureWorksLT
    
    # Create the second SQL Database instance, AdatumERP, to create the sales data source.
    az sql db create --resource-group $resourceGroupName --server $sqlServerName --name AdatumERP --service-objective Basic --sample-name AdventureWorksLT
    

Po dokončení spuštění skriptu na <DP-prefix>-dev-sqlserver001 serveru Azure SQL máte dvě nové instance AdatumCRM služby SQL Database a AdatumERP. Obě databáze jsou na výpočetní úrovni Basic. Databáze se nacházejí ve stejné <DLZ-prefix>-dev-dp001 skupině prostředků, kterou jste použili k nasazení dávky datového produktu.

Nastavení Purview pro katalog datové dávky produktu

Dále dokončete kroky nastavení Purview pro katalog datové dávky produktu. Začnete vytvořením instančního objektu. Potom nastavíte požadované prostředky a přiřadíte role a přístupová oprávnění.

Vytvoření instančního objektu služby

  1. Na webu Azure Portal v globálních ovládacích prvcích portálu vyberte ikonu Cloud Shellu a otevřete terminál Azure Cloud Shellu. Jako typ terminálu vyberte Bash .

  2. Revidujte následující skript:

    • Nahraďte hodnotu zástupného symbolu parametru subscriptionId vlastním ID předplatného Azure.
    • Nahraďte zástupnou hodnotu parametru spname názvem, který chcete použít pro instanční objekt. Název instančního objektu musí být v předplatném jedinečný.

    Po aktualizaci hodnot parametrů spusťte skript v Cloud Shellu.

    # Replace the parameter values with the name you want to use for your service principal name and your Azure subscription ID.
    spname="<your-service-principal-name>"
    subscriptionId="<your-subscription-id>"
    
    # Set the scope to the subscription.
    scope="/subscriptions/$subscriptionId"
    
    # Create the service principal.
    az ad sp create-for-rbac \
      --name $spname \
      --role "Contributor" \
      --scope $scope
    
  3. Ve výstupu JSON zkontrolujte výsledek podobný následujícímu příkladu. Poznamenejte si nebo zkopírujte hodnoty ve výstupu, které chcete použít v pozdějších krocích.

    {
      "appId": "<your-app-id>",
      "displayName": "<service-principal-display-name>",
      "name": "<your-service-principal-name>",
      "password": "<your-service-principal-password>",
      "tenant": "<your-tenant>"
    }
    

Nastavení přístupu a oprávnění instančního objektu

Z výstupu JSON vygenerovaného v předchozím kroku získejte následující vrácené hodnoty:

  • ID instančního objektu (appId)
  • Klíč instančního objektu (password)

Instanční objekt musí mít následující oprávnění:

  • Role Čtenář dat objektů blob služby Storage v účtech úložiště
  • Oprávnění čtečky dat k instancím služby SQL Database

Pokud chcete nastavit instanční objekt s požadovanou rolí a oprávněními, proveďte následující kroky.

Oprávnění účtu služby Azure Storage

  1. Na webu Azure Portal přejděte do <DLZ-prefix>devraw účtu Azure Storage. V nabídce prostředků vyberte Řízení přístupu (IAM).

    Snímek obrazovky znázorňující podokno oprávnění instančního objektu účtu úložiště se zvýrazněnou možností Řízení přístupu

  2. Vyberte Přidat>Přidat přiřazení role.

    Snímek obrazovky znázorňující podokno řízení přístupu k instančnímu objektu účtu úložiště, které ukazuje, jak přidat přiřazení role

  3. V části Přidat přiřazení role na kartě Role vyhledejte a vyberte Čtenář dat objektů blob služby Storage. Pak vyberte Další.

    Snímek obrazovky znázorňující hledání čtečky dat objektů blob služby Storage v části Přidat přiřazení role

  4. V oblasti Členové zvolte Vybrat členy.

    Snímek obrazovky znázorňující podokno vybrat členy v části Přidat přiřazení role

  5. V části Vybrat členy vyhledejte název instančního objektu, který jste vytvořili.

    Snímek obrazovky, který ukazuje, jak vyhledat název instančního objektu

  6. Ve výsledcích hledání vyberte instanční objekt a pak zvolte Vybrat.

    Snímek obrazovky znázorňující podokno výsledků po vyhledání hlavního názvu služby

  7. Přiřazení role dokončíte tak, že dvakrát vyberete Zkontrolovat a přiřadit .

Opakujte kroky v této části pro zbývající účty úložiště:

  • <DLZ-prefix>devencur
  • <DLZ-prefix>devwork

Oprávnění služby SQL Database

Pokud chcete nastavit oprávnění služby SQL Database, připojte se k virtuálnímu počítači Azure SQL pomocí editoru dotazů. Vzhledem k tomu, že všechny prostředky jsou za privátním koncovým bodem, musíte se nejprve přihlásit k webu Azure Portal pomocí hostitelského virtuálního počítače služby Azure Bastion.

Na webu Azure Portal se připojte k virtuálnímu počítači, který je nasazený ve <DMLZ-prefix>-dev-bastion skupině prostředků. Pokud nevíte, jak se připojit k virtuálnímu počítači pomocí hostitelské služby Bastion, přečtěte si téma Připojení k virtuálnímu počítači.

Pokud chcete přidat instanční objekt jako uživatele v databázi, možná budete muset nejprve přidat sebe jako správce Microsoft Entra. V krocích 1 a 2 přidáte sami sebe jako správce Microsoft Entra. V krocích 3 až 5 udělíte instančnímu objektu oprávnění k databázi. Po přihlášení k portálu z hostitelského virtuálního počítače Bastion vyhledejte virtuální počítače Azure SQL na webu Azure Portal.

  1. Přejděte na <DP-prefix>-dev-sqlserver001 virtuální počítač Azure SQL. V nabídce prostředků v části Nastavení vyberte Microsoft Entra ID.

    Snímek obrazovky znázorňující podokno Microsoft Entra na serveru Azure SQL Database

  2. Na panelu příkazů vyberte Nastavit správce. Vyhledejte a vyberte svůj vlastní účet. Zvolte Vybrat.

    Snímek obrazovky, který ukazuje, jak vyhledat účet, aby byl uživatel správcem

  3. V nabídce prostředků vyberte databáze SQL a pak databázi AdatumCRM .

    Snímek obrazovky znázorňující hledání správné databáze se zvýrazněnou možností AdatumCRM

  4. V nabídce prostředků AdatumCRM vyberte Editor dotazů (Preview). V části Ověřování služby Active Directory vyberte tlačítko Pokračovat jako , abyste se přihlásili.

    Snímek obrazovky, který ukazuje, jak se přihlásit k editoru dotazů pomocí ověřování Active Directory

  5. V editoru dotazů upravte následující příkazy tak, aby se nahradily <service principal name> názvem vytvořeného instančního objektu (například purview-service-principal). Potom spusťte příkazy.

    
    CREATE USER [<service principal name>] FROM EXTERNAL PROVIDER
    GO
    
    EXEC sp_addrolemember 'db_datareader', [<service principal name>]
    GO
    
    

    Snímek obrazovky znázorňující, jak provádět příkazy v editoru dotazů

Opakujte kroky 3 až 5 pro AdatumERP databázi.

Nastavení trezoru klíčů

Purview načte klíč instančního objektu z instance služby Azure Key Vault. Trezor klíčů se vytvoří v nasazení cílové zóny správy dat. K nastavení trezoru klíčů jsou potřeba následující kroky:

  1. Přidejte klíč instančního objektu do trezoru klíčů jako tajný klíč.

  2. Udělte v trezoru klíčů oprávnění čtenáře tajných kódů MSI purview.

  3. Přidejte trezor klíčů do Purview jako připojení trezoru klíčů.

  4. Vytvořte v Purview přihlašovací údaje, které odkazují na tajný klíč trezoru klíčů.

Přidání oprávnění pro přidání tajného kódu do trezoru klíčů

  1. Na webu Azure Portal přejděte do služby Azure Key Vault. Vyhledejte <DMLZ-prefix>-dev-vault001 trezor klíčů.

    Snímek obrazovky znázorňující podokno služby Key Vault pro řízení přístupu

  2. V nabídce prostředků vyberte Řízení přístupu (IAM). Na panelupříkazůch

    Snímek obrazovky znázorňující přidání přiřazení role v Purview

  3. Na kartě Role vyhledejte a pak vyberte Správce služby Key Vault. Vyberte Další.

    Snímek obrazovky, který ukazuje, jak vyhledat roli správce služby Key Vault

  4. V části Členové zvolte Vybrat členy a přidejte účet, který je aktuálně přihlášený.

    Snímek obrazovky se zvýrazněným tlačítkem Vybrat členy

  5. V části Vybrat členy vyhledejte účet, který je aktuálně přihlášený. Vyberte účet a pak zvolte Vybrat.

    Snímek obrazovky s vyhledávacím polem pro výběr člena

  6. Proces přiřazení role dokončíte tak, že dvakrát vyberete Zkontrolovat a přiřadit .

Přidání tajného klíče do trezoru klíčů

Pomocí následujících kroků se přihlaste k webu Azure Portal z hostitelského počítače Bastion.

  1. V nabídce prostředků trezoru <DMLZ-prefix>-dev-vault001 klíčů vyberte Tajné kódy. Na panelu příkazů vyberte Generovat/Importovat a vytvořte nový tajný kód.

    Snímek obrazovky se zvýrazněným tlačítkem Generovat/Importovat trezor klíčů

  2. V části Vytvořit tajný klíč vyberte nebo zadejte následující hodnoty:

    Nastavení Akce
    Možnosti nahrávání Vyberte Ručně.
    Název Zadejte tajný klíč instančního objektu.
    Hodnota Zadejte heslo instančního objektu, které jste vytvořili dříve.

    Snímek obrazovky znázorňující podokno Vytvoření tajného kódu trezoru klíčů

    Poznámka:

    Tento krok vytvoří tajný klíč pojmenovaný service-principal-secret v trezoru klíčů pomocí klíče hesla instančního objektu. Purview používá tajný kód pro připojení ke zdrojům dat a prohledávání. Pokud zadáte nesprávné heslo, nebudete moct dokončit následující části.

  3. Vyberte Vytvořit.

Nastavení oprávnění Purview v trezoru klíčů

Aby instance Purview četla tajné kódy uložené v trezoru klíčů, musíte purview přiřadit příslušná oprávnění v trezoru klíčů. Pokud chcete nastavit oprávnění, přidáte spravovanou identitu Purview do role Čtenář tajných kódů trezoru klíčů.

  1. V nabídce prostředků trezoru <DMLZ-prefix>-dev-vault001 klíčů vyberte Řízení přístupu (IAM).

  2. Na panelupříkazůch

    Snímek obrazovky znázorňující podokno Řízení přístupu se zvýrazněným tlačítkem přidat přiřazení role

  3. V roli vyhledejte a vyberte uživatele tajných kódů služby Key Vault. Vyberte Další.

    Snímek obrazovky znázorňující podokno Hledání tajného klíče služby Key Vault

  4. V oblasti Členové zvolte Vybrat členy.

    Snímek obrazovky znázorňující podokno pro přidání přiřazení role se zvýrazněným tlačítkem vybrat člena

  5. Vyhledejte <DMLZ-prefix>-dev-purview001 instanci Purview. Vyberte instanci, do které chcete přidat příslušný účet. Pak zvolte Vybrat.

    Snímek obrazovky znázorňující vyhledávací pole pro název instance Purview

  6. Proces přiřazení role dokončíte tak, že dvakrát vyberete Zkontrolovat a přiřadit .

    Snímek obrazovky znázorňující, jak dokončit přiřazení role

Nastavení připojení trezoru klíčů v Purview

Pokud chcete nastavit připojení trezoru klíčů k Purview, musíte se přihlásit k webu Azure Portal pomocí hostitelského virtuálního počítače služby Azure Bastion.

  1. Na webu Azure Portal přejděte na <DMLZ-prefix>-dev-purview001 účet Purview. V části Začínáme na portálu zásad správného řízení Microsoft Purview vyberte Otevřít.

    Snímek obrazovky znázorňující přehled účtu Microsoft Purview

  2. V nástroji Purview Studio vyberte Přihlašovací údaje pro správu>. Na panelu příkazů Přihlašovací údaje vyberte Spravovat připojení služby Key Vault a pak vyberte Nový.

    Snímek obrazovky znázorňující tlačítko Spravovat připojení ke službě Key Vault

  3. V okně Nové připojení trezoru klíčů vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte <DMLZ-prefix-dev-vault001>.
    Předplatné Azure Vyberte předplatné, které je hostitelem trezoru klíčů.
    Název služby Key Vault <Vyberte trezor klíčů DMLZ-prefix-dev-vault001>.

    Snímek obrazovky znázorňující nové podokno připojení služby Key Vault

  4. Vyberte Vytvořit.

  5. V možnosti Potvrdit udělení přístupu vyberte Potvrdit.

Vytvoření přihlašovacích údajů v Purview

Posledním krokem k nastavení trezoru klíčů je vytvoření přihlašovacích údajů v Purview, které odkazuje na tajný klíč, který jste vytvořili v trezoru klíčů pro instanční objekt.

  1. V nástroji Purview Studio vyberte Přihlašovací údaje pro správu>. Na panelu příkazů Přihlašovací údaje vyberte Nový.

    Snímek obrazovky znázorňující nové podokno Přihlašovací údaje Purview

  2. V části Nové přihlašovací údaje vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte purviewServicePrincipal.
    Metoda ověřování Vyberte instanční objekt.
    ID klientu Hodnota se vyplní automaticky.
    ID instančního objektu Zadejte ID aplikace nebo ID klienta instančního objektu.
    Připojení ke službě Key Vault Vyberte připojení trezoru klíčů, které jste vytvořili v předchozí části.
    Název tajného kódu Zadejte název tajného klíče do trezoru klíčů (service-principal-secret).

    Snímek obrazovky znázorňující nový formulář přihlašovacích údajů se zvýrazněnými hodnotami

  3. Vyberte Vytvořit.

Registrace zdrojů dat

V tomto okamžiku se Purview může připojit k instančnímu objektu. Teď můžete zaregistrovat a nastavit zdroje dat.

Registrace účtů Azure Data Lake Storage Gen2

Následující kroky popisují proces registrace účtu úložiště Azure Data Lake Storage Gen2.

  1. V Purview Studiu vyberte ikonu mapy dat, vyberte Zdroje a pak vyberte Zaregistrovat.

    Snímek obrazovky se zvýrazněným tlačítkem mapy dat v Purview

  2. V registru zdrojů vyberte Azure Data Lake Storage Gen2 a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující zdroj registrace Azure Data Lake Storage Gen2

  3. V části Registrovat zdroje (Azure Data Lake Storage Gen2) vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte <předponu>DLZ dldevraw.
    Předplatné Azure Vyberte předplatné, které je hostitelem účtu úložiště.
    Název účtu úložiště Vyberte příslušný účet úložiště.
    Endpoint Hodnota se automaticky vyplní na základě vybraného účtu úložiště.
    Výběr kolekce Vyberte kořenovou kolekci.

    Snímek obrazovky znázorňující podokno Registrace Azure Data Lake Storage Gen2 se zvýrazněnými hodnotami

  4. Výběrem možnosti Zaregistrovat vytvořte zdroj dat.

Opakujte tento postup pro následující účty úložiště:

  • <DMLZ-prefix>devencur
  • <DMLZ-prefix>devwork

Registrace instance služby SQL Database jako zdroje dat

  1. V Nástroji Purview Studio vyberte ikonu mapování dat, vyberte Zdroje a pak vyberte Zaregistrovat.

    Snímek obrazovky znázorňující tlačítko mapování dat zvýrazněné v rozhraní Purview

  2. V registru zdrojů vyberte Azure SQL Database a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující zdroj registrace služby Azure SQL Database

  3. V části Registrovat zdroje (Azure SQL Database) vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte databázi SQLDatabase (název databáze vytvořené v instanci Create Azure SQL Database).
    Předplatné Vyberte předplatné, které je hostitelem databáze.
    Název serveru Zadejte <DP-prefix-dev-sqlserver001>.

    Snímek obrazovky znázorňující formulář Pro registraci služby SQL Database se zvýrazněnými hodnotami

  4. Vyberte Zaregistrovat.

Nastavení kontrol

Dále nastavte vyhledávání zdrojů dat.

Kontrola zdroje dat Data Lake Storage Gen2

  1. V Nástroji Purview Studio přejděte na mapu dat. Ve zdroji dat vyberte ikonu Nová kontrola .

    Snímek obrazovky, který ukazuje, jak nastavit novou kontrolu Data Lake Storage Gen2

  2. V novém podokně skenování vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte Scan_<DLZ-prefix>devraw.
    Připojení přes prostředí Integration Runtime Vyberte místní prostředí Integration Runtime, které se nasadilo s cílovou zónou dat.
    Pověření Vyberte instanční objekt, který jste nastavili pro Purview.

    Snímek obrazovky znázorňující formulář přihlašovacích údajů Data Lake Storage Gen2 se zadanými hodnotami

  3. Výběrem možnosti Test připojení ověřte připojení a příslušná oprávnění. Zvolte Pokračovat.

  4. V oboru kontroly vyberte jako obor kontroly celý účet úložiště a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující podokno Rozsah kontroly s vybranými účty úložiště

  5. V části Vyberte sadu pravidel kontroly, vyberte AdlsGen2 a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující výběr sady pravidel kontroly Data Lake Storage Gen2

  6. V nastavení triggeru kontroly vyberte Jednou a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující podokno triggeru kontroly s vybranou možností Jednou

  7. V části Kontrola kontroly zkontrolujte nastavení kontroly. Výběrem možnosti Uložit a Spustit spusťte kontrolu.

    Snímek obrazovky znázorňující kontrolu kontroly před uložením a spuštěním

Opakujte tento postup pro následující účty úložiště:

  • <DMLZ-prefix>devencur
  • <DMLZ-prefix>devwork

Kontrola zdroje dat služby SQL Database

  1. Ve zdroji dat Azure SQL Database vyberte Nová kontrola.

    Snímek obrazovky, který ukazuje, jak vytvořit novou kontrolu služby SQL Database

  2. V novém podokně skenování vyberte nebo zadejte následující informace:

    Nastavení Akce
    Název Zadejte Scan_Database001.
    Připojení přes prostředí Integration Runtime Vyberte Purview-SHIR.
    Název databáze Vyberte název databáze.
    Pověření Vyberte přihlašovací údaje trezoru klíčů, které jste vytvořili v Purview.
    Extrakce rodokmenu (Preview) Vyberte Vypnuto.

    Snímek obrazovky znázorňující formulář skenování přihlašovacích údajů se zadanými hodnotami

  3. Výběrem možnosti Test připojení ověřte připojení a příslušná oprávnění. Zvolte Pokračovat.

  4. Vyberte obor kontroly. Pokud chcete zkontrolovat celou databázi, použijte výchozí hodnotu.

    Snímek obrazovky, který ukazuje, jak nastavit obor kontroly na celou databázi

  5. V části Vyberte sadu pravidel kontroly, vyberte AzureSqlDatabase a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující výběr sady pravidel kontroly služby SQL Database

  6. V nastavení triggeru kontroly vyberte Jednou a pak vyberte Pokračovat.

    Snímek obrazovky znázorňující nastavení podokna spuštění s jednou vybranou možností

  7. V části Kontrola kontroly zkontrolujte nastavení kontroly. Výběrem možnosti Uložit a Spustit spusťte kontrolu.

Tento postup opakujte pro AdatumERP databázi.

Purview je teď nastavený pro zásady správného řízení dat pro registrované zdroje dat.

Kopírování dat sql Database do Data Lake Storage Gen2

V následujících krocích AdatumCRM pomocí nástroje Pro kopírování dat ve službě Data Factory vytvoříte kanál pro kopírování tabulek z instancí služby SQL Database a AdatumERP do souborů CSV v <DLZ-prefix>devraw účtu Data Lake Storage Gen2.

Prostředí je uzamčené pro veřejný přístup, takže nejdřív musíte nastavit privátní koncové body. Pokud chcete používat privátní koncové body, přihlásíte se k webu Azure Portal v místním prohlížeči a pak se připojíte k hostitelskému virtuálnímu počítači Bastion pro přístup k požadovaným službám Azure.

Vytváření privátních koncových bodů

Nastavení privátních koncových bodů pro požadované prostředky:

  1. <DMLZ-prefix>-dev-bastion Ve skupině prostředků vyberte <DMLZ-prefix>-dev-vm001.

    Snímek obrazovky znázorňující skupiny prostředků pro připojení k hostitelskému virtuálnímu počítači bastionu

  2. Na panelu příkazů vyberte Připojit a vyberte Bastion.

    Snímek obrazovky znázorňující podokno pro připojení k výběru bastionu

  3. Zadejte uživatelské jméno a heslo virtuálního počítače a pak vyberte Připojit.

    Snímek obrazovky znázorňující podokno pro zadání uživatelského jména a hesla

  4. Ve webovém prohlížeči virtuálního počítače přejděte na web Azure Portal. Přejděte do <DLZ-prefix>-dev-shared-integration skupiny prostředků a otevřete datovou továrnu <DLZ-prefix>-dev-integration-datafactory001 .

    Snímek obrazovky znázorňující, jak přejít do jiné skupiny prostředků a otevřít Azure Data Factory

  5. V části Začínáme v nástroji Open Azure Data Factory Studio vyberte Otevřít.

    Snímek obrazovky, který ukazuje, jak otevřít Azure Data Factory Studio

  6. V nabídce Data Factory Studio vyberte ikonu Spravovat (ikona vypadá jako čtvercový panel nástrojů s razítkem klíče). V nabídce prostředků vyberte spravované privátní koncové body a vytvořte privátní koncové body, které jsou potřeba k připojení služby Data Factory k jiným zabezpečeným službám Azure.

    Schválení žádostí o přístup pro privátní koncové body je popsáno v další části. Jakmile schválíte žádosti o přístup k privátnímu koncovému bodu, stav schválení se schválí, jak je znázorněno v následujícím příkladu <DLZ-prefix>devencur účtu úložiště.

    Snímek obrazovky, který ukazuje, jak přejít do podokna Spravovat privátní koncové body

  7. Než schválíte připojení privátního koncového bodu, vyberte Nový. Zadáním Azure SQL najděte konektor azure SQL Database, který použijete k vytvoření nového spravovaného privátního koncového <DP-prefix>-dev-sqlserver001 bodu pro virtuální počítač Azure SQL. Virtuální počítač obsahuje dříve AdatumCRM vytvořené databáze a AdatumERP databáze.

  8. Do pole Nový spravovaný privátní koncový bod (Azure SQL Database) zadejte jako název data-product-dev-sqlserver001. Zadejte předplatné Azure, které jste použili k vytvoření prostředků. Jako název serveru vyberte <DP-prefix>-dev-sqlserver001 , abyste se k němu mohli připojit z této datové továrny v dalších částech.

    Snímek obrazovky znázorňující název nového privátního koncového bodu

Schválení žádostí o přístup k privátním koncovým bodům

Pokud chcete službě Data Factory udělit přístup k privátním koncovým bodům pro požadované služby, máte několik možností:

  • Možnost 1: V každé službě, ke které požadujete přístup, přejděte na webu Azure Portal na možnost připojení k síti nebo privátnímu koncovému bodu a schvalte žádosti o přístup k privátnímu koncovému bodu.

  • Možnost 2: Spuštěním následujících skriptů v Azure Cloud Shellu v režimu Bash schvalte všechny žádosti o přístup k požadovaným privátním koncovým bodům najednou.

    
    # Storage managed private endpoint approval
    
    # devencur
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, '-dev-storage')==\`true\`].name")
    storageAcctName=$(az storage account list -g $resourceGroupName -o tsv  --query "[?contains(@.name, 'devencur')==\`true\`].name")
    endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $storageAcctName --type Microsoft.Storage/storageAccounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name")
    
    az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $storageAcctName --type Microsoft.Storage/storageAccounts --description "Approved"
    
    # devraw
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, '-dev-storage')==\`true\`].name")
    storageAcctName=$(az storage account list -g $resourceGroupName -o tsv  --query "[?contains(@.name, 'devraw')==\`true\`].name")
    endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $storageAcctName --type Microsoft.Storage/storageAccounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name")
    az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $storageAcctName --type Microsoft.Storage/storageAccounts --description "Approved"
    
    # SQL Database managed private endpoint approval
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, '-dev-dp001')==\`true\`].name")
    sqlServerName=$(az sql server list -g $resourceGroupName -o tsv  --query "[?contains(@.name, 'sqlserver001')==\`true\`].name")
    endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $sqlServerName --type Microsoft.Sql/servers -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name")
    az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $sqlServerName --type Microsoft.Sql/servers --description "Approved"
    
    # Key Vault private endpoint approval
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, '-dev-metadata')==\`true\`].name")
    keyVaultName=$(az keyvault list -g $resourceGroupName -o tsv  --query "[?contains(@.name, 'dev-vault001')==\`true\`].name")
    endPointConnectionID=$(az network private-endpoint-connection list -g $resourceGroupName -n $keyVaultName --type Microsoft.Keyvault/vaults -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].id")
    az network private-endpoint-connection approve -g $resourceGroupName --id $endPointConnectionID --resource-name $keyVaultName --type Microsoft.Keyvault/vaults --description "Approved"
    
    # Purview private endpoint approval
    resourceGroupName=$(az group list -o tsv  --query "[?contains(@.name, 'dev-governance')==\`true\`].name")
    purviewAcctName=$(az purview account list -g $resourceGroupName -o tsv  --query "[?contains(@.name, '-dev-purview001')==\`true\`].name")
    for epn in $(az network private-endpoint-connection list -g $resourceGroupName -n $purviewAcctName --type Microsoft.Purview/accounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name")
    do
        az network private-endpoint-connection approve -g $resourceGroupName -n $epn --resource-name $purviewAcctName --type Microsoft.Purview/accounts --description "Approved"
    done
    
    

Následující příklad ukazuje, jak <DLZ-prefix>devraw účet úložiště spravuje žádosti o přístup privátního koncového bodu. V nabídce prostředků pro účet úložiště vyberte Sítě. Na panelu příkazů vyberte připojení privátního koncového bodu.

Snímek obrazovky, který ukazuje, jak přejít do podokna připojení privátního koncového bodu

U některých prostředků Azure v nabídce prostředků vyberete připojení privátního koncového bodu. Příklad pro Azure SQL Server je zobrazený na následujícím snímku obrazovky.

Pokud chcete schválit žádost o přístup k privátnímu koncovému bodu, v připojeních privátních koncových bodů vyberte čekající žádost o přístup a pak vyberte Schválit:

Snímek obrazovky znázorňující schválení žádosti o přístup k privátnímu koncovému bodu

Po schválení žádosti o přístup v každé požadované službě může trvat několik minut, než se žádost v nástroji Data Factory Studio zobrazí jako schválená ve spravovaných privátních koncových bodech . I když na panelu příkazů vyberete Aktualizovat , může být stav schválení za několik minut zastaralý.

Po dokončení schvalování všech žádostí o přístup pro požadované služby ve spravovaných privátních koncových bodech je hodnota stavu Schválení pro všechny služby schválena:

Snímek obrazovky znázorňující připojení SQL privátního koncového bodu jako schválená

Přiřazení rolí

Po dokončení schvalování žádostí o přístup k privátním koncovým bodům přidejte příslušná oprávnění role pro službu Data Factory pro přístup k těmto prostředkům:

  • Instance AdatumCRM služby SQL Database a AdatumERP na <DP-prefix>-dev-sqlserver001 serveru Azure SQL
  • Účty <DLZ-prefix>devrawúložiště , <DLZ-prefix>devencura <DLZ-prefix>devwork
  • Účet Purview <DMLZ-prefix>-dev-purview001

Virtuální počítač Azure SQL

  1. Pokud chcete přidat přiřazení rolí, začněte virtuálním počítačem Azure SQL. Ve skupině <DMLZ-prefix>-dev-dp001 prostředků přejděte na <DP-prefix>-dev-sqlserver001.

  2. V nabídce prostředků vyberte Řízení přístupu (IAM). Na panelu příkazů vyberte Přidat>přiřazení role.

  3. Na kartě Role vyberte Přispěvatel a pak vyberte Další.

    Snímek obrazovky znázorňující podokno výběru role Přispěvatel

  4. V možnosti Členové vyberte možnost Přiřadit přístup ke spravované identitě. V případě členů zvolte Vybrat členy.

    Snímek obrazovky znázorňující podokno Vybrat členy spravované identity

  5. V části Vybrat spravované identity vyberte své předplatné Azure. U spravované identity vyberte Data Factory (V2) a zobrazte dostupné datové továrny. V seznamu datových továren vyberte Azure Data Factory <DLZ-prefix-dev-integration-datafactory001>. Zvolte Vybrat.

    Snímek obrazovky znázorňující podokno dokončení přiřazení role

  6. Proces dokončíte tak, že vyberete Zkontrolovat a přiřadit dvakrát.

Účty úložiště

Dále přiřaďte požadované role účtům , <DLZ-prefix>devencura <DLZ-prefix>devwork účtům <DLZ-prefix>devrawúložiště.

Pokud chcete přiřadit role, proveďte stejné kroky, které jste použili k vytvoření přiřazení role serveru Azure SQL. U této role ale místo přispěvatele vyberte Přispěvatel dat objektů blob služby Storage.

Po přiřazení rolí pro všechny tři účty úložiště se služba Data Factory může připojit k účtům úložiště a přistupovat k nim.

Microsoft Purview

Posledním krokem pro přidání přiřazení rolí je přidání role kurátora dat Purview v Microsoft Purview do účtu <DLZ-prefix>-dev-integration-datafactory001 spravované identity datové továrny. Proveďte následující kroky, aby data Factory mohl odesílat informace o prostředcích katalogu dat z více zdrojů dat do účtu Purview.

  1. Ve skupině <DMLZ-prefix>-dev-governanceprostředků přejděte na <DMLZ-prefix>-dev-purview001 účet Purview.

  2. V Purview Studiu vyberte ikonu mapy dat a pak vyberte Kolekce.

  3. Vyberte kartu Přiřazení rolí pro kolekci. V části Kurátoré dat přidejte spravovanou identitu pro <DLZ-prefix>-dev-integration-datafactory001:

    Snímek obrazovky, který ukazuje, jak přidat kurátory dat do přiřazení role Purview

Připojení služby Data Factory k Purview

Oprávnění jsou nastavená a Purview teď může zobrazit datová továrna. Dalším krokem je připojení <DMLZ-prefix>-dev-purview001 k <DLZ-prefix>-dev-integration-datafactory001.

  1. V Purview Studiu vyberte ikonu Správa a pak vyberte Data Factory. Výběrem možnosti Nový vytvořte připojení služby Data Factory.

  2. V podokně Připojení k nové službě Data Factory zadejte své předplatné Azure a vyberte datovou továrnu<DLZ-prefix>-dev-integration-datafactory001. Vyberte OK.

    Snímek obrazovky znázorňující vzhled podokna Purview Studio při výběru nového připojení

  3. <DLZ-prefix>-dev-integration-datafactory001 V instanci Data Factory Studio v části Spravovat>Azure Purview aktualizujte účet Azure Purview.

    Integrace Data Lineage - Pipeline teď zobrazuje zelenou ikonu Připojeno .

    Snímek obrazovky znázorňující podokno účtu Purview služby Azure Data Factory s připojeným kanálem rodokmenu dat

Vytvoření kanálu ETL

Teď, když <DLZ-prefix>-dev-integration-datafactory001 má požadovaná přístupová oprávnění, vytvořte ve službě Data Factory aktivitu kopírování, která přesune data z instancí služby SQL Database do nezpracovaného <DLZ-prefix>devraw účtu úložiště.

Použití nástroje pro kopírování dat s AdatumCRM

Tento proces extrahuje zákaznická data z AdatumCRM instance služby SQL Database a zkopíruje je do úložiště Data Lake Storage Gen2.

  1. V nástroji Data Factory Studio vyberte ikonu Autor a pak vyberte Prostředky továrny. Vyberte znaménko plus (+) a vyberte Nástroj pro kopírování dat.

    Snímek obrazovky znázorňující nástroj Pro kopírování dat v rámci prostředků továrny

    Proveďte každý krok v průvodci nástrojem pro kopírování dat:

    1. Pokud chcete vytvořit trigger pro spuštění kanálu každých 24 hodin, vyberte Plán.

      Snímek obrazovky znázorňující, jak naplánovat pravidelné spuštění triggeru v CRM

    2. Pokud chcete vytvořit propojenou službu pro připojení této datové továrny k AdatumCRM instanci služby SQL Database na <DP-prefix>-dev-sqlserver001 serveru (zdroj), vyberte Nové připojení.

      Snímek obrazovky znázorňující připojení k databázi AdatumCRM

      Poznámka:

      Pokud dojde k chybám při připojování k datům v instancích služby SQL Database nebo účtech úložiště nebo při přístupu k datům, zkontrolujte svá oprávnění v předplatném Azure. Ujistěte se, že datová továrna má požadované přihlašovací údaje a přístupová oprávnění k jakémukoli problematickému prostředku.

    3. Vyberte tyto tři tabulky:

      • SalesLT.Address
      • SalesLT.Customer
      • SalesLT.CustomerAddress

      Snímek obrazovky znázorňující podokno vybrat tabulky se zvýrazněnými tabulkami

    4. Vytvořte novou propojenou službu pro přístup k úložišti <DLZ-prefix>devraw Azure Data Lake Storage Gen2 (cíl).

      Snímek obrazovky znázorňující nezpracované připojení k úložišti

    5. Procházejte složky v úložišti <DLZ-prefix>devraw a jako cíl vyberte Data .

      Snímek obrazovky znázorňující cíl jako nezpracovaná data

    6. Změňte příponu názvu souboru na .csv a použijte další výchozí možnosti.

      Snímek obrazovky znázorňující pole přípony názvu souboru se zadaným sdíleným svazkem clusteru

    7. Přejděte do dalšího podokna a vyberte Přidat záhlaví do souboru.

      Snímek obrazovky, který ukazuje, jak přidat záhlaví do souboru

    8. Po dokončení průvodce vypadá podokno Dokončení nasazení podobně jako v tomto příkladu:

      Snímek obrazovky znázorňující dokončené nasazení nástroje pro kopírování dat

Nový kanál je uvedený v Pipelines.

Spuštění kanálu

Tento proces vytvoří ve složce Data\CRM tři .csv soubory, jeden pro každou vybranou tabulku v AdatumCRM databázi.

  1. Přejmenujte kanál CopyPipeline_CRM_to_Raw.

  2. Přejmenujte datové sady CRM_Raw_Storage a CRM_DB.

  3. Na panelu příkazů Prostředky továrny vyberte Publikovat vše.

  4. Vyberte kanál a na panelu CopyPipeline_CRM_to_Raw příkazů kanálu vyberte Trigger a zkopírujte tři tabulky ze služby SQL Database do Data Lake Storage Gen2.

    Snímek obrazovky, který ukazuje, jak pomocí nástroje triggeru kopírovat data z SQL Database do Data Lake Storage Gen2

Použití nástroje pro kopírování dat s AdatumERP

Dále extrahujte data z AdatumERP databáze. Data představují prodejní data pocházející ze systému ERP.

  1. Ve službě Data Factory Studio vytvořte nový kanál pomocí nástroje pro kopírování dat. Tentokrát odesíláte prodejní data ze AdatumERP <DLZ-prefix>devraw složky s daty účtu úložiště stejným způsobem jako s daty CRM. Proveďte stejné kroky, ale jako zdroj použijte AdatumERP databázi.

    1. Vytvořte plán, který se má aktivovat každou hodinu.

    2. Vytvořte propojenou službu s AdatumERP instancí služby SQL Database.

      Snímek obrazovky znázorňující dokončené podokno připojení Adatum ERP

    3. Vyberte tyto sedm tabulek:

      • SalesLT.Product
      • SalesLT.ProductCategory
      • SalesLT.ProductDescription
      • SalesLT.ProductModel
      • SalesLT.ProductModelProductDescription
      • SalesLT.SalesOrderDetail
      • SalesLT.SalesOrderHeader

      Snímek obrazovky znázorňující možnosti tabulky Adatum ERP

    4. Použijte existující propojenou službu k <DLZ-prefix>devraw účtu úložiště a nastavte příponu souboru na .csv.

      Snímek obrazovky znázorňující nezpracovaný účet úložiště s příponou souboru nastavenou na CSV

    5. Vyberte Přidat hlavičku do souboru.

      Snímek obrazovky znázorňující přidání záhlaví do souboru v části Nastavení formátu souboru

    6. Dokončete průvodce znovu a přejmenujte kanál CopyPipeline_ERP_to_DevRaw. Potom na panelu příkazů vyberte Publikovat vše. Nakonec spuštěním triggeru pro tento nově vytvořený kanál zkopírujte sedm vybraných tabulek z SQL Database do Data Lake Storage Gen2.

Po dokončení těchto kroků se 10 souborů CSV nachází v úložišti <DLZ-prefix>devraw Data Lake Storage Gen2. V další části budete spravovat soubory v úložišti <DLZ-prefix>devencur Data Lake Storage Gen2.

Kurátorování dat ve službě Data Lake Storage Gen2

Po dokončení vytváření 10 souborů CSV v nezpracovaném <DLZ-prefix>devraw úložišti Data Lake Storage Gen2 tyto soubory podle potřeby transformujte podle potřeby do kurátorovaného <DLZ-prefix>devencur úložiště Data Lake Storage Gen2.

Pokračujte v používání služby Azure Data Factory k vytvoření těchto nových kanálů pro orchestraci přesunu dat.

Curate CRM to customer data

Vytvořte tok dat, který získá soubory CSV ve složce Data\CRM ve <DLZ-prefix>devrawsložce . Transformujte soubory a zkopírujte transformované soubory ve formátu souboru .parquet do složky Data\Customer v <DLZ-prefix>devencursouboru .

  1. Ve službě Azure Data Factory přejděte do datové továrny a vyberte Orchestrate (Orchestrate).

    Snímek obrazovky znázorňující tlačítko Orchestrate ve službě Azure Data Factory

  2. V části Obecné pojmenujte kanál Pipeline_transform_CRM.

  3. V podokně Aktivity rozbalte položku Přesunout a transformovat. Přetáhněte aktivitu toku dat a přesuňte ji na plátno kanálu.

    Snímek obrazovky znázorňující podokno Aktivity a zvýrazněnou možnost Přesunout a transformovat

  4. V části Přidání Tok dat vyberte Vytvořit nový tok dat a pojmenujte tok CRM_to_Customerdat . Vyberte Dokončit.

    Poznámka:

    Na panelu příkazů na plátně kanálu zapněte ladění toku dat. V režimu ladění můžete interaktivně otestovat logiku transformace na živém clusteru Apache Spark. Zahřátí clusterů toků dat trvá 5 až 7 minut. Než začnete s vývojem toku dat, doporučujeme zapnout ladění.

    Snímek obrazovky s tlačítkem Otevřít Tok dat

    Po dokončení výběru možností v CRM_to_Customer toku Pipeline_transform_CRM dat vypadá kanál podobně jako v tomto příkladu:

    Snímek obrazovky znázorňující transformaci kanálu CRM

    Tok dat vypadá jako v tomto příkladu:

    Snímek obrazovky znázorňující tok dat CRM pro zákazníky

  5. Dále upravte tato nastavení ve toku dat pro CRMAddress zdroj:

    1. Vytvořte novou datovou sadu z Data Lake Storage Gen2. Použijte formát DelimitedText. Pojmenujte datovou sadu DevRaw_CRM_Address.

    2. Připojte propojenou službu k <DLZ-prefix>devraw.

    3. Data\CRM\SalesLTAddress.csv Vyberte soubor jako zdroj.

  6. Upravte tato nastavení v toku dat pro spárovanou CustAddress jímku:

    1. Vytvořte novou datovou sadu s názvem DevEncur_Cust_Address.

    2. Jako jímku vyberte složku <DLZ-prefix>devencur Data\Customer.

    3. V části Nastavení\Výstup na jeden soubor převeďte soubor na Address.parquet.

Pro zbytek konfigurace toku dat použijte informace v následujících tabulkách pro každou komponentu. Všimněte si, že CRMAddress a CustAddress jsou to první dva řádky. Použijte je jako příklady pro ostatní objekty.

Položka, která není v některé z následujících tabulek, je modifikátor schématu RemovePasswords . Předchozí snímek obrazovky ukazuje, že tato položka přechází mezi CRMCustomer a CustCustomer. Pokud chcete přidat tento modifikátor schématu, přejděte do části Vybrat nastavení a odeberte PasswordHash a PasswordSalt.

CRMCustomer vrátí schéma 15 sloupců ze souboru .crv. CustCustomer Zapíše pouze 13 sloupců poté, co modifikátor schématu odebere dva sloupce hesel.

Kompletní tabulka

Název Object type Název datové sady Úložiště dat Typ formátu Propojená služba Soubor nebo složka
CRMAddress Zdroj DevRaw_CRM_Address Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\CRM\SalesLTAddress.csv
CustAddress Jímka DevEncur_Cust_Address Azure Data Lake Storage Gen2 Parquet devencur Data\Customer\Address.parquet
CRMCustomer Zdroj DevRaw_CRM_Customer Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\CRM\SalesLTCustomer.csv
CustCustomer Jímka DevEncur_Cust_Customer Azure Data Lake Storage Gen2 Parquet devencur Data\Customer\Customer.parquet
CRMCustomerAddress Zdroj DevRaw_CRM_CustomerAddress Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\CRM\SalesLTCustomerAddress.csv
CustCustomerAddress Jímka DevEncur_Cust_CustomerAddress Azure Data Lake Storage Gen2 Parquet devencur Data\Customer\CustomerAddress.parquet

Tabulka ERP to Sales

Teď opakujte podobné kroky pro vytvoření Pipeline_transform_ERP kanálu, vytvořte ERP_to_Sales tok dat pro transformaci .csv souborů ve složce Data\ERP a <DLZ-prefix>devrawzkopírujte transformované soubory do složky Data\Sales v <DLZ-prefix>devencur.

V následující tabulce najdete objekty, které se mají vytvořit v ERP_to_Sales toku dat, a nastavení, která je potřeba upravit pro každý objekt. Každý soubor .csv je mapován na jímku .parquet .

Název Object type Název datové sady Úložiště dat Typ formátu Propojená služba Soubor nebo složka
ERPProduct Zdroj DevRaw_ERP_Product Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProduct.csv
SalesProduct Jímka DevEncur_Sales_Product Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\Product.parquet
ERPProductCategory Zdroj DevRaw_ERP_ProductCategory Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductCategory.csv
SalesProductCategory Jímka DevEncur_Sales_ProductCategory Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductCategory.parquet
ERPProductDescription Zdroj DevRaw_ERP_ProductDescription Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductDescription.csv
SalesProductDescription Jímka DevEncur_Sales_ProductDescription Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductDescription.parquet
ERPProductModel Zdroj DevRaw_ERP_ProductModel Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductModel.csv
SalesProductModel Jímka DevEncur_Sales_ProductModel Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductModel.parquet
ERPProductModelProductDescription Zdroj DevRaw_ERP_ProductModelProductDescription Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductModelProductDescription.csv
SalesProductModelProductDescription Jímka DevEncur_Sales_ProductModelProductDescription Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductModelProductDescription.parquet
ERPProductSalesOrderDetail Zdroj DevRaw_ERP_ProductSalesOrderDetail Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductSalesOrderDetail.csv
SalesProductSalesOrderDetail Jímka DevEncur_Sales_ProductSalesOrderDetail Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductSalesOrderDetail.parquet
ERPProductSalesOrderHeader Zdroj DevRaw_ERP_ProductSalesOrderHeader Azure Data Lake Storage Gen2 Text s oddělovači devraw Data\ERP\SalesLTProductSalesOrderHeader.csv
SalesProductSalesOrderHeader Jímka DevEncur_Sales_ProductSalesOrderHeader Azure Data Lake Storage Gen2 Parquet devencur Data\Sales\ProductSalesOrderHeader.parquet

Další kroky