Como detetar e redigir Informações de Identificação Pessoal (PII) em conversas

O recurso PII conversacional pode avaliar conversas para extrair informações confidenciais (PII) no conteúdo em várias categorias predefinidas e editá-las. Esta API opera tanto em texto transcrito (referenciado como transcrições) como chats. Para transcrições, a API também permite a edição de segmentos de áudio, que contém as informações de PII, fornecendo as informações de temporização de áudio para esses segmentos de áudio.

Determinar como processar os dados (opcional)

Especificar o modelo de deteção de PII

Por padrão, esse recurso usará o modelo de IA mais recente disponível em sua entrada. Você também pode configurar suas solicitações de API para usar uma versão de modelo específica.

Suporte de idiomas

Consulte a página PII Language Support para obter mais detalhes. Atualmente, o modelo PII GA conversacional suporta apenas a língua inglesa. O modelo de visualização e a API suportam os mesmos idiomas de lista que os outros serviços de idiomas.

Suporte de região

A API PII conversacional dá suporte a todas as regiões do Azure suportadas pelo serviço de idiomas.

Envio de dados

Você pode enviar a entrada para a API como lista de itens de conversa. A análise é realizada aquando da receção do pedido. Como a API é assíncrona, pode haver um atraso entre o envio de uma solicitação de API e o recebimento dos resultados. Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte os limites de dados abaixo.

Ao usar o recurso assíncrono, os resultados da API ficam disponíveis por 24 horas a partir do momento em que a solicitação foi ingerida e são indicados na resposta. Após esse período de tempo, os resultados são limpos e não estão mais disponíveis para recuperação.

Ao enviar dados para PII conversacional, você pode enviar uma conversa (chat ou falada) por solicitação.

A API tentará detetar todas as categorias de entidade definidas para uma determinada entrada de conversa. Se desejar especificar quais entidades serão detetadas e retornadas, use o parâmetro opcional piiCategories com as categorias de entidades apropriadas.

Para transcrições faladas, as entidades detetadas serão retornadas no valor do redactionSource parâmetro fornecido. Atualmente, os valores suportados para são , , , e maskedItn (que mapeia para Fala para texto APIs REST , display\displayText, e maskedItn formato, itn lexicalrespectivamente). itnlexicaltextredactionSource Além disso, para a entrada de transcrição falada, essa API também fornecerá informações de temporização de áudio para capacitar a redação de áudio. Para usar o recurso audioRedaction, use o sinalizador opcional includeAudioRedaction com true valor. A redação de áudio é realizada com base no formato de entrada lexical.

Nota

A PII de conversação agora suporta 40.000 caracteres como tamanho do documento.

Obtendo resultados de PII

Quando você obtém resultados da deteção de PII, pode transmitir os resultados para um aplicativo ou salvar a saída em um arquivo no sistema local. A resposta da API incluirá entidades reconhecidas, incluindo suas categorias e subcategorias, e pontuações de confiança. A cadeia de caracteres de texto com as entidades PII editadas também será retornada.

Exemplos

  1. Vá para a página de visão geral dos recursos no portal do Azure

  2. No menu do lado esquerdo, selecione Teclas e Ponto de extremidade. Você precisará de uma das chaves e do ponto de extremidade para autenticar suas solicitações de API.

  3. Transfira e instale o pacote de biblioteca de cliente para o idioma da sua escolha:

    Idioma Versão de pacote
    .NET 1.0.0
    Python 1.0.0
  4. Consulte a documentação de referência a seguir para obter mais informações sobre o cliente e o objeto de retorno:

Limites de serviço e dados

Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte o artigo Limites de serviço.