Zjišťování a redakce osobních identifikačních údajů (PII) v konverzacích

Funkce konverzačnní PII dokáže vyhodnocovat konverzace a vybírat z jejich obsahu citlivé informace (PII) v několika předem definovaných kategoriích a redigovat je. Toto rozhraní API funguje na přepisovaném textu (odkazovaném jako přepisy) i chatech. V případě přepisů rozhraní API také umožňuje redakci zvukových segmentů, které obsahují informace o PII poskytnutím informací o časování zvuku pro tyto zvukové segmenty.

Určení způsobu zpracování dat (volitelné)

Určení modelu detekce PII

Ve výchozím nastavení bude tato funkce na vašem vstupu používat nejnovější dostupný model AI. Můžete také nakonfigurovat požadavky rozhraní API tak, aby používaly konkrétní verzi modelu.

Podpora jazyků

Další podrobnosti najdete na stránce podpory jazyka PII. Aktuálně konverzační model PII GA podporuje pouze anglický jazyk. Model Preview a rozhraní API podporují stejné jazyky seznamů jako ostatní jazykové služby.

Podpora oblastí

Konverzační rozhraní API PII podporuje všechny oblasti Azure podporované službou Language.

Odesílání dat

Poznámka:

Informace o formátování konverzačního textu pro odeslání pomocí sady Language Studio najdete v článku o sadě Language Studio .

Vstup můžete odeslat do rozhraní API jako seznam položek konverzace. Analýza se provede po přijetí žádosti. Vzhledem k tomu, že rozhraní API je asynchronní, může dojít ke zpoždění mezi odesláním požadavku rozhraní API a příjmem výsledků. Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v následujících omezeních dat.

Při použití asynchronní funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od doby, kdy se žádost ingestovala, a je uvedena v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.

Když odesíláte data do konverzačních PII, můžete na žádost odeslat jednu konverzaci (chat nebo mluvený hovor).

Rozhraní API se pokusí zjistit všechny definované kategorie entit pro daný vstup konverzace. Pokud chcete určit, které entity budou zjištěny a vráceny, použijte volitelný piiCategories parametr s příslušnými kategoriemi entit.

U mluvených přepisů se zjištěné entity vrátí na zadanou hodnotu parametru redactionSource . V současné době jsou podporované hodnoty redactionSource , , lexicalitna maskedItn (které se mapují na speech na textové rozhraní REST API display\displayText, lexicalitn a maskedItn formát v uvedeném pořadí).text Kromě toho toto rozhraní API pro mluvený přepis poskytuje také informace o časování zvuku, které umožní redakci zvuku. Pro použití funkce audioRedaction použijte volitelný includeAudioRedaction příznak s true hodnotou. Redakce zvuku se provádí na základě lexikálního vstupního formátu.

Poznámka:

PiI konverzace teď podporuje jako velikost dokumentu 40 000 znaků.

Získání výsledků PII

Když z detekce PII získáte výsledky, můžete výsledky streamovat do aplikace nebo uložit výstup do souboru v místním systému. Odpověď rozhraní API bude zahrnovat rozpoznané entity, včetně jejich kategorií a podkategorií a skóre spolehlivosti. Vrátí se také textový řetězec s entitami PII, které byly upraveny.

Příklady

  1. Na webu Azure Portal přejděte na stránku přehledu prostředků.

  2. V nabídce na levé straně vyberte Klíče a koncový bod. K ověření požadavků rozhraní API budete potřebovat jeden z klíčů a koncový bod.

  3. Stáhněte a nainstalujte balíček klientské knihovny pro jazyk podle vašeho výběru:

    Jazyk Verze balíčku
    .NET 1.0.0
    Python 1.0.0
  4. Další informace o klientovi a návratovém objektu najdete v následující referenční dokumentaci:

Limity služeb a dat

Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v článku o omezeních služeb.