Kopírování dat do Azure Data Exploreru nebo z Azure Data Exploreru pomocí služby Azure Data Factory nebo Synapse Analytics

Článek
05/15/2024

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Tento článek popisuje, jak pomocí aktivity kopírování v kanálech Azure Data Factory a Synapse Analytics kopírovat data do Azure Data Exploreru nebo z Azure Data Exploreru. Vychází z článku s přehledem aktivity kopírování, který nabízí obecný přehled aktivity kopírování.

Tip

Další informace o integraci Azure Data Exploreru se službou obecně najdete v tématu Integrace Azure Data Exploreru.

Podporované funkce

Tento konektor Azure Data Exploreru je podporovaný pro následující funkce:

Podporované funkce	IR
aktivita Copy (zdroj/jímka)	(1) (2)
Mapování toku dat (zdroj/jímka)	(1)
Aktivita Lookup	(1) (2)

(1) Prostředí Azure Integration Runtime (2) Místní prostředí Integration Runtime

Do Azure Data Exploreru můžete kopírovat data z libovolného podporovaného zdrojového úložiště dat. Data z Azure Data Exploreru můžete také zkopírovat do libovolného podporovaného úložiště dat jímky. Seznam úložišť dat, která aktivita kopírování podporuje jako zdroje nebo jímky, najdete v tabulce Podporované úložiště dat.

Poznámka:

Kopírování dat do Nebo z Azure Data Exploreru prostřednictvím místního úložiště dat pomocí místního prostředí Integration Runtime se podporuje ve verzi 3.14 a novější.

Pomocí konektoru Azure Data Exploreru můžete provést následující akce:

Kopírování dat pomocí ověřování tokenu aplikace Microsoft Entra s instančním objektem
Jako zdroj načtěte data pomocí dotazu KQL (Kusto).
Jako jímku připojte data k cílové tabulce.

Začínáme

Tip

Návod ke konektoru Azure Data Exploreru najdete v tématu Kopírování dat do a z Azure Data Exploreru a hromadného kopírování z databáze do Azure Data Exploreru.

K provedení aktivita Copy s kanálem můžete použít jeden z následujících nástrojů nebo sad SDK:

Vytvoření propojené služby do Azure Data Exploreru pomocí uživatelského rozhraní

Pomocí následujícího postupu vytvořte propojenou službu s Azure Data Explorerem v uživatelském rozhraní webu Azure Portal.

Přejděte na kartu Správa v pracovním prostoru Azure Data Factory nebo Synapse a vyberte Propojené služby a pak klikněte na Nový:
- Azure Data Factory
- Azure Synapse
Vyhledejte Průzkumníka a vyberte konektor Azure Data Exploreru (Kusto).
Nakonfigurujte podrobnosti o službě, otestujte připojení a vytvořte novou propojenou službu.

Podrobnosti konfigurace konektoru

Následující části obsahují podrobnosti o vlastnostech, které slouží k definování entit specifických pro konektor Azure Data Exploreru.

Vlastnosti propojené služby

Konektor Azure Data Exploreru podporuje následující typy ověřování. Podrobnosti najdete v odpovídajících částech:

Ověřování instančních objektů
Ověřování spravované identity přiřazené systémem
Ověřování spravované identity přiřazené uživatelem

Ověřování instančního objektu

Pokud chcete použít ověřování instančního objektu, získejte instanční objekt pomocí následujícího postupu a udělte oprávnění:

Zaregistrujte aplikaci na platformě Microsoft Identity Platform. Postup najdete v tématu Rychlý start: Registrace aplikace na platformě Microsoft Identity Platform. Poznamenejte si tyto hodnoty, které použijete k definování propojené služby:
- ID aplikace
- Klíč aplikace
- ID tenanta
Udělte instančnímu objektu správná oprávnění v Azure Data Exploreru. Podrobné informace o rolích a oprávněních a o správě oprávnění najdete v tématu Správa databázových oprávnění Azure Data Exploreru. Obecně platí, že musíte:
- Jako zdroj udělte databázi alespoň roli prohlížeče databáze.
- Jako jímku udělte databázi alespoň roli uživatele databáze.

Poznámka:

Při vytváření uživatelského rozhraní se ve výchozím nastavení používá váš přihlašovací uživatelský účet k výpisu clusterů, databází a tabulek Azure Data Exploreru. Objekty pomocí instančního objektu můžete zobrazit kliknutím na rozevírací seznam vedle tlačítka pro aktualizaci nebo ručně zadat název, pokud nemáte oprávnění k těmto operacím.

Propojená služba Azure Data Explorer podporuje následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost type musí být nastavena na AzureDataExplorer.	Ano
endpoint	Adresa URL koncového bodu clusteru Azure Data Exploreru s formátem jako `https://<clusterName>.<regionName>.kusto.windows.net`.	Ano
database	Název databáze.	Ano
tenant	Zadejte informace o tenantovi (název domény nebo ID tenanta), pod kterým se vaše aplikace nachází. To se v Kusto připojovací řetězec označuje jako ID autority. Načtěte ho tak, že najedete myší v pravém horním rohu webu Azure Portal.	Ano
servicePrincipalId	Zadejte ID klienta aplikace. To se v Kusto připojovací řetězec označuje jako ID klienta aplikace Microsoft Entra.	Ano
servicePrincipalKey	Zadejte klíč aplikace. To se v Kusto připojovací řetězec označuje jako "Klíč aplikace Microsoft Entra". Označte toto pole jako securestring pro bezpečné uložení nebo odkazování na zabezpečená data uložená ve službě Azure Key Vault.	Ano
connectVia	Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Pokud je vaše úložiště dat v privátní síti, můžete použít prostředí Azure Integration Runtime nebo místní prostředí Integration Runtime. Pokud není zadaný, použije se výchozí prostředí Azure Integration Runtime.	No

Příklad: Použití ověřování pomocí instančního klíče

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
            "tenant": "<tenant name/id e.g. microsoft.onmicrosoft.com>",
            "servicePrincipalId": "<service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<service principal key>"
            }
        }
    }
}

Ověřování spravované identity přiřazené systémem

Další informace o spravovaných identitách pro prostředky Azure najdete v tématu Spravované identity pro prostředky Azure.

Pokud chcete použít ověřování spravované identity přiřazené systémem, přidělte oprávnění následujícím postupem:

Načtěte informace o spravované identitě zkopírováním hodnoty ID objektu spravované identity vygenerovaného společně s pracovním prostorem objektu pro vytváření nebo Synapse.
Udělte spravované identitě správná oprávnění v Azure Data Exploreru. Podrobné informace o rolích a oprávněních a o správě oprávnění najdete v tématu Správa databázových oprávnění Azure Data Exploreru. Obecně platí, že musíte:
- Jako zdroj udělte vaší databázi roli Čtenář databáze.
- Jako jímku udělte databázovému ingestoru a databázovému prohlížeči role pro vaši databázi.

Poznámka:

Při vytváření uživatelského rozhraní se váš přihlašovací uživatelský účet použije k výpisu clusterů, databází a tabulek Azure Data Exploreru. Pokud nemáte oprávnění k těmto operacím, zadejte ho ručně.

Propojená služba Azure Data Explorer podporuje následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost type musí být nastavena na AzureDataExplorer.	Ano
endpoint	Adresa URL koncového bodu clusteru Azure Data Exploreru s formátem jako `https://<clusterName>.<regionName>.kusto.windows.net`.	Ano
database	Název databáze.	Ano
connectVia	Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Pokud je vaše úložiště dat v privátní síti, můžete použít prostředí Azure Integration Runtime nebo místní prostředí Integration Runtime. Pokud není zadaný, použije se výchozí prostředí Azure Integration Runtime.	No

Příklad: Použití ověřování spravované identity přiřazené systémem

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
        }
    }
}

Ověřování spravované identity přiřazené uživatelem

Další informace o spravovaných identitách pro prostředky Azure najdete v tématu Spravované identity pro prostředky Azure.

Pokud chcete použít ověřování spravované identity přiřazené uživatelem, postupujte takto:

Vytvořte jednu nebo více spravovaných identit přiřazených uživatelem a udělte oprávnění v Azure Data Exploreru. Podrobné informace o rolích a oprávněních a o správě oprávnění najdete v tématu Správa databázových oprávnění Azure Data Exploreru. Obecně platí, že musíte:
- Jako zdroj udělte databázi alespoň roli prohlížeče databáze.
- Jako jímku udělte databázi alespoň roli databázového ingestoru .
Přiřaďte jedné nebo více spravovaných identit přiřazených uživatelem k pracovnímu prostoru datové továrny nebo Synapse a vytvořte přihlašovací údaje pro každou spravovanou identitu přiřazenou uživatelem.

Propojená služba Azure Data Explorer podporuje následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost type musí být nastavena na AzureDataExplorer.	Ano
endpoint	Adresa URL koncového bodu clusteru Azure Data Exploreru s formátem jako `https://<clusterName>.<regionName>.kusto.windows.net`.	Ano
database	Název databáze.	Ano
přihlašovací údaje	Jako objekt přihlašovacích údajů zadejte spravovanou identitu přiřazenou uživatelem.	Ano
connectVia	Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Pokud je vaše úložiště dat v privátní síti, můžete použít prostředí Azure Integration Runtime nebo místní prostředí Integration Runtime. Pokud není zadaný, použije se výchozí prostředí Azure Integration Runtime.	No

Příklad: Použití ověřování spravované identity přiřazené uživatelem

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
            "credential": {
                "referenceName": "credential1",
                "type": "CredentialReference"
            }
        }
    }
}

Vlastnosti datové sady

Úplný seznam oddílů a vlastností dostupných pro definování datových sad najdete v tématu Datové sady. Tato část obsahuje seznam vlastností, které datová sada Azure Data Exploreru podporuje.

Pokud chcete kopírovat data do Azure Data Exploreru, nastavte vlastnost typu datové sady na AzureDataExplorerTable.

Podporují se následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost typu musí být nastavena na AzureDataExplorerTable.	Ano
table	Název tabulky, na kterou odkazuje propojená služba.	Ano pro jímku; Ne pro zdroj

Příklad vlastností datové sady:

{
   "name": "AzureDataExplorerDataset",
    "properties": {
        "type": "AzureDataExplorerTable",
        "typeProperties": {
            "table": "<table name>"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Azure Data Explorer linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Vlastnosti aktivity kopírování

Úplný seznam oddílů a vlastností dostupných pro definování aktivit najdete v tématu Kanály a aktivity. Tato část obsahuje seznam vlastností, které podporují zdroje a jímky Azure Data Exploreru.

Azure Data Explorer jako zdroj

Pokud chcete kopírovat data z Azure Data Exploreru, nastavte vlastnost typu ve zdroji aktivita Copy na AzureDataExplorerSource. Ve zdrojové části aktivity kopírování jsou podporovány následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost typu zdroje aktivity kopírování musí být nastavena na: AzureDataExplorerSource	Ano
query	Požadavek jen pro čtení zadaný ve formátu KQL. Jako referenci použijte vlastní dotaz KQL.	Ano
queryTimeout	Doba čekání před vypršením časového limitu požadavku dotazu. Výchozí hodnota je 10 min (00:10:00); Povolená maximální hodnota je 1 hodina (01:00:00).	No
noTruncation	Určuje, zda chcete zkrátit vrácenou sadu výsledků. Ve výchozím nastavení se výsledek zkrátí po 500 000 záznamech nebo po 64 megabajtech (MB). Zkrácení důrazně doporučujeme, aby se zajistilo správné chování aktivity.	No

Poznámka:

Ve výchozím nastavení má zdroj Azure Data Exploreru limit velikosti 500 000 záznamů nebo 64 MB. Pokud chcete načíst všechny záznamy bez zkrácení, můžete zadat set notruncation; na začátku dotazu. Další informace najdete v tématu Omezení dotazů.

Příklad:

"activities":[
    {
        "name": "CopyFromAzureDataExplorer",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "AzureDataExplorerSource",
                "query": "TestTable1 | take 10",
                "queryTimeout": "00:10:00"
            },
            "sink": {
                "type": "<sink type>"
            }
        },
        "inputs": [
            {
                "referenceName": "<Azure Data Explorer input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ]
    }
]

Azure Data Explorer jako jímka

Pokud chcete kopírovat data do Azure Data Exploreru, nastavte vlastnost typu v jímce aktivity kopírování na AzureDataExplorerSink. V části jímky aktivity kopírování jsou podporovány následující vlastnosti:

Vlastnost	Popis	Povinní účastníci
type	Vlastnost typu jímky aktivity kopírování musí být nastavena na: AzureDataExplorerSink.	Ano
ingestionMappingName	Název předem vytvořeného mapování v tabulce Kusto Pokud chcete namapovat sloupce ze zdroje do Azure Data Exploreru (který platí pro všechna podporovaná zdrojová úložiště a formáty, včetně formátů CSV/JSON/Avro), můžete použít mapování sloupců aktivity kopírování (implicitně podle názvu nebo explicitně podle konfigurace) a/nebo mapování Azure Data Exploreru.	No
additionalProperties	Taška vlastností, která se dá použít k určení libovolných vlastností příjmu dat, které ještě jímka Azure Data Exploreru nenastavuje. Konkrétně může být užitečné při zadávání značek příjmu dat. Další informace najdete v dokumentaci k ingestování dat v Azure Data.	No

Příklad:

"activities":[
    {
        "name": "CopyToAzureDataExplorer",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzureDataExplorerSink",
                "ingestionMappingName": "<optional Azure Data Explorer mapping name>",
                "additionalProperties": {<additional settings for data ingestion>}
            }
        },
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure Data Explorer output dataset name>",
                "type": "DatasetReference"
            }
        ]
    }
]

Mapování vlastností toku dat

Při transformaci dat při mapování toku dat můžete číst a zapisovat do tabulek v Azure Data Exploreru. Další informace najdete v tématu transformace zdroje a transformace jímky v mapování toků dat. Jako typ zdroje a jímky můžete použít datovou sadu Azure Data Exploreru nebo vloženou datovou sadu .

Transformace zdroje

Následující tabulka uvádí vlastnosti podporované zdrojem Azure Data Exploreru. Tyto vlastnosti můžete upravit na kartě Možnosti zdroje.

Název	Popis	Povinní účastníci	Povolené hodnoty	Vlastnost skriptu toku dat
Table	Pokud jako vstup vyberete tabulku, tok dat načte všechna data z tabulky zadané v datové sadě Azure Data Exploreru nebo ve zdrojových možnostech při použití vložené datové sady.	No	String	(pouze pro vloženou datovou sadu) tableName
Dotaz	Požadavek jen pro čtení zadaný ve formátu KQL. Jako referenci použijte vlastní dotaz KQL.	No	String	query
Timeout	Doba čekání před vypršením časového limitu požadavku dotazu. Výchozí hodnota je 172000 (2 dny)	No	Celé číslo	timeout

Příklady zdrojového skriptu Azure Data Exploreru

Pokud jako typ zdroje použijete datovou sadu Azure Data Exploreru, přidružený skript toku dat:

source(allowSchemaDrift: true,
	validateSchema: false,
	query: 'table | take 10',
	format: 'query') ~> AzureDataExplorerSource

Pokud používáte vloženou datovou sadu, přidružený skript toku dat je:

source(allowSchemaDrift: true,
    validateSchema: false,
    format: 'query',
    query: 'table | take 10',
    store: 'azuredataexplorer') ~> AzureDataExplorerSource

Transformace jímky

Následující tabulka uvádí vlastnosti podporované jímkou Azure Data Exploreru. Tyto vlastnosti můžete upravit na kartě Nastavení . Při použití vložené datové sady se zobrazí další nastavení, která jsou stejná jako vlastnosti popsané v části vlastností datové sady.

Název	Popis	Povinní účastníci	Povolené hodnoty	Vlastnost skriptu toku dat
Akce tabulky	Určuje, zda se mají před zápisem znovu vytvořit nebo odebrat všechny řádky z cílové tabulky. - Žádné: V tabulce se neprovede žádná akce. - Znovu vytvořte: Tabulka se přehodí a znovu vytvoří. Vyžaduje se při dynamickém vytváření nové tabulky. - Zkrácení: Odeberou se všechny řádky z cílové tabulky.	No	`true` nebo `false`	obnovit truncate
Skripty pre a post SQL	Zadejte několik skriptů řídicích příkazů Kusto, které se spustí před (před zpracováním) a po (po zpracování) dat zapisují do databáze jímky.	No	String	preSQLs; postSQLs
Timeout	Doba čekání před vypršením časového limitu požadavku dotazu. Výchozí hodnota je 172000 (2 dny)	No	Celé číslo	timeout

Příklady skriptů jímky Azure Data Exploreru

Pokud jako typ jímky použijete datovou sadu Azure Data Exploreru, přidružený skript toku dat:

IncomingStream sink(allowSchemaDrift: true,
	validateSchema: false,
	format: 'table',
	preSQLs:['pre SQL scripts'],
	postSQLs:['post SQL script'],
	skipDuplicateMapInputs: true,
	skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink

Pokud používáte vloženou datovou sadu, přidružený skript toku dat je:

IncomingStream sink(allowSchemaDrift: true,
    validateSchema: false,
    format: 'table',
    store: 'azuredataexplorer',
    skipDuplicateMapInputs: true,
    skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink

Vlastnosti aktivity vyhledávání

Další informace ovlastnostech

Seznam úložišť dat, která aktivita kopírování podporuje jako zdroje a jímky, najdete v podporovaných úložištích dat.
Přečtěte si další informace o kopírování dat z Azure Data Factory a Synapse Analytics do Azure Data Exploreru.

Sdílet prostřednictvím

Kopírování dat do Azure Data Exploreru nebo z Azure Data Exploreru pomocí služby Azure Data Factory nebo Synapse Analytics

Podporované funkce

Začínáme

Vytvoření propojené služby do Azure Data Exploreru pomocí uživatelského rozhraní

Podrobnosti konfigurace konektoru

Vlastnosti propojené služby

Ověřování instančního objektu

Ověřování spravované identity přiřazené systémem

Ověřování spravované identity přiřazené uživatelem

Vlastnosti datové sady

Vlastnosti aktivity kopírování

Azure Data Explorer jako zdroj

Azure Data Explorer jako jímka

Mapování vlastností toku dat

Transformace zdroje

Příklady zdrojového skriptu Azure Data Exploreru

Transformace jímky

Příklady skriptů jímky Azure Data Exploreru

Vlastnosti aktivity vyhledávání

Váš názor

Další materiály

Sdílet prostřednictvím

Kopírování dat do Azure Data Exploreru nebo z Azure Data Exploreru pomocí služby Azure Data Factory nebo Synapse Analytics

Podporované funkce

Začínáme

Vytvoření propojené služby do Azure Data Exploreru pomocí uživatelského rozhraní

Podrobnosti konfigurace konektoru

Vlastnosti propojené služby

Ověřování instančního objektu

Ověřování spravované identity přiřazené systémem

Ověřování spravované identity přiřazené uživatelem

Vlastnosti datové sady

Vlastnosti aktivity kopírování

Azure Data Explorer jako zdroj

Azure Data Explorer jako jímka

Mapování vlastností toku dat

Transformace zdroje

Příklady zdrojového skriptu Azure Data Exploreru

Transformace jímky

Příklady skriptů jímky Azure Data Exploreru

Vlastnosti aktivity vyhledávání

Související obsah

Váš názor

Další materiály