Kopírování dat do indexu Azure AI Search pomocí služby Azure Data Factory nebo Synapse Analytics

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Tento článek popisuje, jak pomocí aktivity kopírování v kanálu Služby Azure Data Factory nebo Synapse Analytics kopírovat data do indexu služby Azure AI Search. Vychází z článku s přehledem aktivity kopírování, který představuje obecný přehled aktivity kopírování.

Podporované funkce

Tento konektor Azure AI Search je podporovaný pro následující funkce:

Podporované funkce IR Spravovaný privátní koncový bod
aktivita Copy (-/jímka) (1) (2)

(1) Prostředí Azure Integration Runtime (2) Místní prostředí Integration Runtime

Do indexu vyhledávání můžete kopírovat data z libovolného podporovaného zdrojového úložiště dat. Seznam úložišť dat podporovaných jako zdroje nebo jímky aktivitou kopírování najdete v tabulce Podporované úložiště dat.

Začínáme

K provedení aktivita Copy s kanálem můžete použít jeden z následujících nástrojů nebo sad SDK:

Vytvoření propojené služby pro Azure Search pomocí uživatelského rozhraní

Pomocí následujících kroků vytvořte propojenou službu pro Azure Search v uživatelském rozhraní webu Azure Portal.

  1. Přejděte na kartu Správa v pracovním prostoru Azure Data Factory nebo Synapse a vyberte Propojené služby a pak klikněte na Nový:

  2. Vyhledejte hledání a vyberte konektor Služby Azure Search.

    Vyberte konektor služby Azure Search.

  3. Nakonfigurujte podrobnosti o službě, otestujte připojení a vytvořte novou propojenou službu.

    Nakonfigurujte propojenou službu pro Azure Search.

Podrobnosti konfigurace konektoru

Následující části obsahují podrobnosti o vlastnostech, které slouží k definování entit služby Data Factory specifických pro konektor Azure AI Search.

Vlastnosti propojené služby

Propojená služba Azure AI Search podporuje následující vlastnosti:

Vlastnost Popis Povinní účastníci
type Vlastnost typu musí být nastavená na: AzureSearch. Ano
url Adresa URL vyhledávací služby Ano
key Klíč správce vyhledávací služby. Označte toto pole jako securestring, abyste ho mohli bezpečně uložit, nebo odkazovat na tajný klíč uložený ve službě Azure Key Vault. Ano
connectVia Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Můžete použít prostředí Azure Integration Runtime nebo místní prostředí Integration Runtime (pokud je vaše úložiště dat umístěné v privátní síti). Pokud není zadaný, použije výchozí prostředí Azure Integration Runtime. No

Důležité

Při kopírování dat z cloudového úložiště dat do indexu vyhledávání musíte v propojené službě Azure AI Search odkazovat na prostředí Azure Integration Runtime s explicitní oblastí v connactVia. Nastavte oblast jako oblast, ve které se nachází vaše vyhledávací služba. Další informace najdete v prostředí Azure Integration Runtime.

Příklad:

{
    "name": "AzureSearchLinkedService",
    "properties": {
        "type": "AzureSearch",
        "typeProperties": {
            "url": "https://<service>.search.windows.net",
            "key": {
                "type": "SecureString",
                "value": "<AdminKey>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Vlastnosti datové sady

Úplný seznam oddílů a vlastností dostupných pro definování datových sad najdete v článku o datových sadách . Tato část obsahuje seznam vlastností podporovaných datovou sadou Azure AI Search.

Pokud chcete kopírovat data do služby Azure AI Search, podporují se následující vlastnosti:

Vlastnost Popis Povinní účastníci
type Vlastnost typu datové sady musí být nastavená na: AzureSearchIndex. Ano
indexName Název indexu vyhledávání Služba nevytvoří index. Index musí existovat ve službě Azure AI Search. Ano

Příklad:

{
    "name": "AzureSearchIndexDataset",
    "properties": {
        "type": "AzureSearchIndex",
        "typeProperties" : {
            "indexName": "products"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Azure AI Search linked service name>",
            "type": "LinkedServiceReference"
        }
   }
}

Vlastnosti aktivity kopírování

Úplný seznam oddílů a vlastností dostupných pro definování aktivit najdete v článku Pipelines . Tato část obsahuje seznam vlastností podporovaných zdrojem služby Azure AI Search.

Azure AI Search jako jímka

Pokud chcete kopírovat data do služby Azure AI Search, nastavte typ zdroje v aktivitě kopírování na AzureSearchIndexSink. V části jímky aktivity kopírování jsou podporovány následující vlastnosti:

Vlastnost Popis Povinní účastníci
type Vlastnost typu zdroje aktivity kopírování musí být nastavena na: AzureSearchIndexSink. Ano
writeBehavior Určuje, zda se má sloučit nebo nahradit, pokud dokument již v indexu existuje. Viz WriteBehavior vlastnost.

Povolené hodnoty jsou: Sloučit (výchozí) a Nahrát.
No
writeBatchSize Nahraje data do indexu vyhledávání, když velikost vyrovnávací paměti dosáhne writeBatchSize. Podrobnosti najdete ve vlastnosti WriteBatchSize.

Povolené hodnoty jsou: celé číslo 1 až 1 000; výchozí hodnota je 1000.
No
maxConcurrentConnections Horní limit souběžných připojení vytvořených k úložišti dat během spuštění aktivity. Zadejte hodnotu pouze v případech, kdy chcete omezit souběžná připojení. No

WriteBehavior – vlastnost

AzureSearchSink upsertuje při zápisu dat. Jinými slovy, pokud klíč dokumentu už v indexu vyhledávání existuje, Azure AI Search aktualizuje existující dokument místo vyvolání konfliktní výjimky.

AzureSearchSink poskytuje následující dvě chování upsertu (pomocí sady AzureSearch SDK):

  • Sloučení: Zkombinujte všechny sloupce v novém dokumentu s existujícím. U sloupců s hodnotou null v novém dokumentu se hodnota v existujícím dokumentu zachová.
  • Nahrání: Nový dokument nahradí existující dokument. U sloupců, které nejsou zadány v novém dokumentu, je hodnota nastavena na hodnotu null, zda je v existujícím dokumentu nenulová hodnota, nebo ne.

Výchozí chování je Sloučit.

WriteBatchSize – vlastnost

Azure AI Search podporuje psaní dokumentů jako dávky. Dávka může obsahovat 1 až 1 000 akcí. Akce zpracovává jeden dokument k provedení operace nahrání/sloučení.

Příklad:

"activities":[
    {
        "name": "CopyToAzureSearch",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure AI Search output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzureSearchIndexSink",
                "writeBehavior": "Merge"
            }
        }
    }
]

Podpora datových typů

Následující tabulka určuje, jestli je datový typ Azure AI Search podporovaný, nebo ne.

Datový typ Azure AI Search Podporováno v jímce azure AI Search
String Y
Int32 Y
Int64 Y
Hodnota s dvojitou přesností Y
Logická hodnota Y
DataTimeOffset Y
Pole řetězců N
GeographyPoint N

V současné době se nepodporují jiné datové typy, například ComplexType. Úplný seznam podporovaných datových typů azure AI Search najdete v tématu Podporované datové typy (Azure AI Search).

Seznam úložišť dat podporovaných jako zdroje a jímky aktivitou kopírování najdete v podporovaných úložištích dat.