Descrição geral do processamento de documentos não estruturados no Microsoft Syntex

Observação

Até junho de 2025, pode experimentar o processamento de documentos não estruturados e outros serviços Syntex selecionados sem custos se tiver a faturação pay as you go configurada. Para obter informações e limitações, consulte Experimentar o Microsoft Syntex e explorar os respetivos serviços.

Utilize o modelo de processamento de documentos não estruturado (método de ensino) para classificar automaticamente ficheiros e extrair informações. Funciona melhor para documentos não estruturados, como cartas ou contratos.

Observação

A Microsoft respeita a privacidade e a propriedade dos dados que utiliza para preparar e processar modelos no Syntex. Nenhum dos dados da sua organização é utilizado ou transferido pela Microsoft para preparar modelos de IA, modelos de linguagem grande ou outros modelos. Os seus dados permanecem em segurança no inquilino da sua organização. Para obter mais informações, consulte Proteção de dados e privacidade da Microsoft.

Introdução aos modelos não estruturados

O modelo de processamento de documentos não estruturado (anteriormente conhecido como modelo de compreensão de documentos) utiliza inteligência artificial (IA) para processar documentos. Esses documentos devem ter texto que pode ser identificado com base em frases ou padrões. O texto identificado designa o tipo de arquivo (sua classificação) e o que você deseja extrair (suas extrações).

Observação

Para obter mais informações sobre como utilizar o Syntex e exemplos de cenários, veja Introdução à adoção da Microsoft Syntex e Cenários e casos de utilização do Microsoft Syntex.

Os modelos de processamento de documentos não estruturados são criados e geridos num tipo de site do SharePoint denominado centro de conteúdos. Quando aplicada a uma biblioteca de documentos do SharePoint, o modelo é associado a um tipo de conteúdo que possui colunas para armazenar as informações que estão sendo extraídas. O tipo de conteúdo que você cria é armazenado na galeria de tipos de conteúdo do SharePoint. Você também pode optar por usar os tipos de conteúdo existentes para usar o esquema.

Observação

Os tipos de conteúdo só de leitura ou selados não podem ser atualizados, pelo que não podem ser utilizados num modelo.

Adicione classificadores e extratores aos modelos de processamento de documentos não estruturados para realizar as seguintes ações:

  • Os classificadores são usados para identificar e classificar os documentos que são carregados na biblioteca de documentos. Por exemplo, um classificador pode ser "treinado" para identificar toda a renovação de documentos que são carregados na biblioteca. O tipo de conteúdo de renovação de contrato é definido por você quando você cria seu classificador.

  • Os extratores recebem informações desses documentos. Por exemplo, para cada documento de renovação de contrato identificado na sua biblioteca de documentos, serão apresentadas colunas que mostram a Data de Início do Serviço e o Cliente para cada documento.

Você pode usar os arquivos de exemplo para treinar e testar seus separadores e extrações em seu modelo. Os arquivos de exemplo fornecem exemplos ao seu modelo sobre o que procurar ao tentar identificar e extrair dados de arquivos. Por exemplo, você treina os classificadores e os extratores da renovação de contrato com exemplos de documentos de renovação de contrato que a sua empresa usa. Você também pode usar arquivos de exemplo para testar a eficácia do seu modelo.

Depois de publicar seu modelo, use o centro de conteúdo para aplicá-lo a qualquer biblioteca de documentos do SharePoint à qual você tenha acesso.

Requisitos e limitações

Para obter informações sobre os requisitos a considerar ao escolher este modelo, veja Requisitos e limitações para modelos no Microsoft Syntex.