Zjišťování a redakce osobních identifikačních údajů (PII)

Funkce PII dokáže vyhodnotit nestrukturovaný text, extrahovat a redigovat citlivé informace (PII) a informace o stavu (PHI) v textu napříč několika předem definovanými kategoriemi.

Možnosti vývoje

Pokud chcete použít detekci PII, odešlete text pro analýzu a zpracujete výstup rozhraní API ve vaší aplikaci. Analýza se provádí tak, jak je, bez přizpůsobení modelu používaného na vašich datech. Detekce PII se dá použít dvěma způsoby:

Možnost vývoje Popis
Language Studio Language Studio je webová platforma, která umožňuje vyzkoušet propojení entit s textovými příklady bez účtu Azure a vlastní data při registraci. Další informace najdete na webu language Studio nebo v rychlém startu language studio.
ROZHRANÍ REST API nebo klientská knihovna (Azure SDK) Integrujte detekci PII do svých aplikací pomocí rozhraní REST API nebo klientské knihovny dostupné v různých jazycích. Další informace najdete v rychlém startu detekce PII.

Určení způsobu zpracování dat (volitelné)

Určení modelu detekce PII

Ve výchozím nastavení bude tato funkce ve vašem textu používat nejnovější dostupný model AI. Můžete také nakonfigurovat požadavky rozhraní API tak, aby používaly konkrétní verzi modelu.

Vstupní jazyky

Při odesílání dokumentů, které se mají zpracovat, můžete určit, ve kterých podporovaných jazycích jsou napsané. Pokud neurčíte jazyk, extrahování bude ve výchozím nastavení angličtina. Rozhraní API může v reakci na podporu různých kódování vícejazyčných a emoji vracet posuny.

Odesílání dat

Analýza se provede po přijetí žádosti. Synchronní použití funkce detekce PII je bezstavové. Ve vašem účtu se neukládají žádná data a výsledky se vrátí okamžitě v odpovědi.

Při asynchronním použití této funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od doby, kdy se žádost ingestovala, a je uvedena v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.

Vyberte entity, které se mají vrátit.

Rozhraní API se pokusí rozpoznat definované kategorie entit pro daný jazyk dokumentu. Pokud chcete určit, které entity budou zjištěny a vráceny, použijte volitelný piiCategories parametr s příslušnými kategoriemi entit. Tento parametr vám také umožní rozpoznat entity, které nejsou ve výchozím nastavení povolené pro váš jazyk dokumentu. Následující příklad by zjistil pouze Person. Můžete zadat jeden nebo více typů entit, které se mají vrátit.

Tip

Pokud při zadávání kategorií entit nezadáte default , rozhraní API vrátí pouze vámi zadané kategorie entit.

Vstup:

Poznámka:

V tomto příkladu vrátí pouze typ entity osoby :

https://<your-language-resource-endpoint>/language/:analyze-text?api-version=2022-05-01

{
    "kind": "PiiEntityRecognition",
    "parameters": 
    {
        "modelVersion": "latest",
        "piiCategories" :
        [
            "Person"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Výstup:


{
    "kind": "PiiEntityRecognitionResults",
    "results": {
        "documents": [
            {
                "redactedText": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is ********) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!",
                "id": "1",
                "entities": [
                    {
                        "text": "John Doe",
                        "category": "Person",
                        "offset": 226,
                        "length": 8,
                        "confidenceScore": 0.98
                    }
                ],
                "warnings": []
            }
        ],
        "errors": [],
        "modelVersion": "2021-01-15"
    }
}

Získání výsledků PII

Když z detekce PII získáte výsledky, můžete výsledky streamovat do aplikace nebo uložit výstup do souboru v místním systému. Odpověď rozhraní API bude zahrnovat rozpoznané entity, včetně jejich kategorií a podkategorií a skóre spolehlivosti. Vrátí se také textový řetězec s entitami PII, které byly upraveny.

Limity služeb a dat

Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v článku o omezeních služeb.

Další kroky

Přehled rozpoznávání pojmenovaných entit