Modelo personalizado da Informação de Documentos

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão de visualização pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-07-31-preview.
  • Atualmente, a versão de visualização pública 2024-07-31-preview só está disponível nas regiões do Azure a seguir. Observe que o modelo generativo personalizado (extração de campos do documento) no Estúdio de IA está disponível somente na região Centro-Norte dos EUA:
    • Leste dos EUA
    • Oeste dos EUA 2
    • Oeste da Europa
    • Centro-Norte dos EUA

Esse conteúdo se aplica a: marca de seleção v4.0 (versão prévia) | Versões prévias: marca de seleção azul v3.1 (GA) marca de seleção azul v3.0 (GA) marca de seleção azul v2.1 (GA)

Esse conteúdo se aplica a: marca de seleção v3.1 (GA) | Ultima versão: marca de seleção púrpura v4.0 (versão prévia) | Versões prévia: marca de seleção azul v3.0 marca de seleção azul v2.1

Esse conteúdo se aplica a: marca de seleção v3.0 (GA) | Ultimas versões: marca de seleção púrpura v4.0 (versão prévia) marca de seleção púrpura v3.1 | Versões prévia: marca de seleção azul v2.1

Esse conteúdo se aplica a: marca de seleção v2.1 | ais recente: marca de seleção azul v4.0 (versão prévia)

Modelos personalizados (anteriormente formulário personalizado) são modelos de documentos fáceis de treinar que extraem com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Os modelos usam indicações de layout para extrair valores de documentos e são adequados para extrair campos de documentos altamente estruturados com modelos visuais definidos.

Os modelos personalizados compartilham o mesmo formato de rotulação e estratégia como modelos neurais personalizados, com suporte para mais tipos de campo e idiomas.

Funcionalidades de modelo

Os modelos personalizados dão suporte a pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas.

Campos de formulário Marcas de seleção Campos tabulares (Tabelas) Assinatura Regiões selecionadas Campos sobrepostos
Com suporte Compatível Compatível Compatível Compatível Incompatível

Campos tabulares

Com o lançamento das versões de API v3.0 e posteriores, os modelos do modelo personalizado adicionam suporte aos campos tabulares (tabelas) entre tabelas:

  • Para rotular uma tabela que abrange várias páginas, rotule cada linha da tabela entre as diferentes páginas da única tabela.
  • Como prática recomendada, verifique se o conjunto de dados contém exemplos das variações esperadas. Por exemplo, inclua casos em que a tabela inteira se encontra em apenas uma página e casos em que as tabelas abrangem duas ou mais páginas, se espera ver essas variações nos documentos.

Campos tabulares também são úteis ao extrair informações recorrentes de um documento que não é reconhecido como uma tabela. Por exemplo, uma seção recorrente de experiências de trabalho em um currículo pode ser rotulada e extraída como um campo tabular.

Lidar com variações

Os modelos dependem de um modelo visual definido e alterações no modelo resultam em precisão mais baixa. Nessas instâncias, divida seu conjunto de dados de treinamento para incluir pelo menos cinco amostras de cada modelo e treinar um modelo para cada uma das variações. Em seguida, você pode compor os modelos em um único ponto de extremidade. Para variações sutis, como imagens e documentos PDF digitais, é melhor incluir pelo menos cinco exemplos de cada tipo no mesmo conjunto de dados de treinamento.

Requisitos de entrada

  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Formatos de arquivo com suporte:

    Modelar PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Ler
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview ou anterior)
    Documento geral
    Predefinida
    Personalizado

    ✱ Atualmente, não há suporte para arquivos do Microsoft Office para outros modelos ou versões.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto em 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

  • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.

  • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

Treinando um modelo

Geralmente, os modelos dos modelos personalizados estão disponíveis a partir da API v2.0 e versões posteriores. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar API REST . Modelos de rótulo e teste
Template personalizado v3.1 API SDK da Informação de Documentos Estúdio da Informação de Documentos

Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode para treinar um modelo personalizado e definir o buildMode como template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Os modelos personalizados estão disponíveis para o público geral com a API v3.1. Se você estiver começando com um novo projeto ou tiver um conjunto de dados rotulado existente, use a API v3.1 ou a v3.0com o Estúdio de Informação de Documentos para treinar um modelo personalizado.

Modelar API REST . Modelos de rótulo e teste
Template personalizado v3.1 API SDK da Informação de Documentos Estúdio da Informação de Documentos

Com a API v3.0 e versões posteriores, a operação de build para treinar o modelo dá suporte a uma nova propriedade buildMode para treinar um modelo personalizado e definir o buildMode como template.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas e localidades com suporte

Confira nossa página de Suporte ao idioma – modelos personalizados, para obter uma lista completa dos idiomas com suporte.

Os modelos (templates) personalizados geralmente estão disponíveis com a API v2.1.

Modelar API REST . Modelos de rótulo e teste
Modelo personalizado (template) Informação de Documentos 2.1 SDK da Informação de Documentos Ferramenta de Rotulagem de Exemplo da Informação de Documentos

Próximas etapas

Saiba como criar e compor modelos personalizados: