Modelo de recibo de Document Intelligence

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
  • A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
    • E.U.A. Leste
    • Oeste dos EUA2
    • Europa Ocidental
    • Centro-Norte dos EUA

Este conteúdo aplica-se a: marca de verificação v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.1 (GA) Marca de verificação azul v3.0 (GA) Marca de verificação azul v2.1 (GA)

Este conteúdo aplica-se a: marca de verificação v3.1 (GA) | Última versão:marca de verificação roxa v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.0Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v3.0 (GA) | Últimas versões: marca de verificação roxa v4.0 (preview) marca de verificação roxav3.1 | Versão anterior: Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v2.1 | Última versão: Marca de verificação azul v4.0 (pré-visualização)

O modelo de recibo Document Intelligence combina poderosas capacidades de Reconhecimento Ótico de Carateres (OCR) com modelos de aprendizagem profunda para analisar e extrair informações importantes dos recibos de vendas. Os recibos podem ser de vários formatos e qualidade, incluindo recibos impressos e manuscritos. A API extrai informações importantes, como nome do comerciante, número de telefone do comerciante, data da transação, impostos e total da transação e retorna dados JSON estruturados.

Tipos de recibos suportados:

  • Térmica
  • Cartão de Crédito
  • Gás
  • Estacionamento
  • Hotel
  • Transportes
  • Comunicação
  • Entretenimento
  • Voo
  • Formação
  • Farmácia/Medicina

Extração de dados de recibo

A digitalização de recibos engloba a transformação de vários tipos de recibos, incluindo cópias digitalizadas, fotografadas e impressas, em um formato digital para processamento simplificado a jusante. Exemplos incluem gestão de despesas, análise do comportamento do consumidor, automação fiscal, etc. O uso da inteligência documental com a tecnologia OCR (Optical Character Recognition) pode extrair e interpretar dados desses diversos formatos de recebimento. O processamento de Inteligência Documental simplifica o processo de conversão, mas também reduz significativamente o tempo e o esforço necessários, facilitando assim o gerenciamento e a recuperação eficientes de dados.

Exemplo de recibo processado com o Document Intelligence Studio:

Captura de tela de um recibo de amostra processado no Document Intelligence Studio.

Recibo de amostra processado com a ferramenta Document Intelligence Sample Labeling:

Captura de ecrã de um recibo de amostra processado com a ferramenta Etiquetagem de Amostra de Formulário.

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-07-31-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
Modelo de recibo • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
recibo pré-embutido

O Document Intelligence v2.1 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos
Modelo de recibo • Ferramenta
de etiquetagem de Inteligência Documental• API REST
SDK
de biblioteca cliente• Contêiner Docker de Inteligência Documental

Requisitos de entrada

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, , HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lida
    Esquema ✔ (2024-07-31-pré-visualização, 2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
    Documento Geral
    Pré-criado
    Extração personalizada
    Classificação personalizada ✔ (2024-07-31-pré-visualização, 2024-02-29-pré-visualização)
  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a cerca 8 de texto pontual a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1 GB com um máximo de 10.000 páginas. Para 2024-07-31-preview e posterior, o tamanho total dos dados de treinamento é 2 GB com um máximo de 10.000 páginas.

  • Formatos de ficheiro suportados: JPEG, PNG, PDF e TIFF.
  • Permissão de página suportada para PDF e TIFF: o Document Intelligence pode processar até 2.000 páginas para assinantes de nível padrão ou apenas as duas primeiras páginas para assinantes de nível gratuito.
  • Tamanho do ficheiro suportado: menos de 50 MB; pixels mínimos: 50 x 50 px; máximo de pixels 10.000 x 10.000 px.

Extração de dados do modelo de recibo

Veja como o Document Intelligence extrai dados, incluindo hora e data das transações, informações do comerciante e totais de valores dos recibos. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Nota

O Document Intelligence Studio está disponível com APIs v3.1 e v3.0 e versões posteriores.

  1. Na home page do Document Intelligence Studio, selecione Recibos.

  2. Você pode analisar o recibo de amostra ou fazer upload de seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

    Captura de tela dos botões Executar análise e Analisar opções no Document Intelligence Studio.

Ferramenta de etiquetagem de exemplo de inteligência de documentos

  1. Navegue até a Ferramenta de Exemplo de Inteligência de Documentos.

  2. Na página inicial da ferramenta de exemplo, selecione o bloco Usar modelo pré-criado para obter dados .

    Captura de tela do processo de análise de resultados do modelo de layout.

  3. Selecione o Tipo de formulário a ser analisado no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar a partir das opções abaixo:

  5. No campo Origem, selecione URL no menu suspenso, cole o URL selecionado e selecione o botão Buscar.

    Captura de ecrã do menu pendente da localização de origem.

  6. No campo Ponto de extremidade do serviço de Inteligência Documental, cole o ponto de extremidade obtido com sua assinatura do Document Intelligence.

  7. No campo chave, cole a chave obtida do recurso Document Intelligence.

    Captura de tela do menu suspenso select-form-type.

  8. Selecione Executar análise. A ferramenta Document Intelligence Sample Labeling chama a API Analyze Prebuilt e analisa o documento.

  9. Exibir os resultados - veja os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detetadas.

    Captura de tela do modelo de layout analisar a operação de resultados.

Nota

A ferramenta Exemplo de etiquetagem não suporta o formato de ficheiro BMP. Esta é uma limitação da ferramenta e não do Serviço de Inteligência Documental.

Idiomas e localidades suportados

Para obter uma lista completa dos idiomas suportados, consulte a nossa página de suporte a idiomas de modelos pré-construídos.

Extração de campo

Nome Tipo Description Saída padronizada
Tipo de recibo String Tipo de recibo de venda Discriminado
MerchantName String Nome do comerciante que emite o recibo
Número de telefone do comerciante phoneNumber Número de telefone listado do comerciante +1 xxx xxx xxxx
MerchantAddress String Endereço listado do comerciante
TransactionDate Date Data de emissão do recibo AAAA-MM-DD
TransactionTime Hora Hora de emissão do recibo HH-MM-SS (24 horas)
Total Número (USD) Total total de recebimento da transação Flutuação de duas casas decimais
Subtotal Número (USD) Subtotal do recebimento, muitas vezes antes da aplicação dos impostos Flutuação de duas casas decimais
Imposto Número (USD) Total de impostos no recebimento (geralmente imposto sobre vendas ou equivalente). Renomeado para "TotalTax" na versão 2022-06-30. Flutuação de duas casas decimais
Gorjeta Número (USD) Dica incluída pelo comprador Flutuação de duas casas decimais
Items Matriz de objetos Itens de linha extraídos, com nome, quantidade, preço unitário e preço total extraído
Nome Cadeia (de carateres) Descrição do artigo. Renomeado para "Descrição" na versão 2022-06-30.
Quantidade Número Quantidade de cada item Flutuação de duas casas decimais
Preço Número Preço individual de cada unidade de item Flutuação de duas casas decimais
PreçoTotal Número Preço total do item de linha Flutuação de duas casas decimais

Para campos de extração de documentos suportados, consulte a página do esquema do modelo de recibo em nosso repositório de exemplo do GitHub.

Guia de migração e API REST v3.1

  • Siga nosso guia de migração do Document Intelligence v3.1 para saber como usar a versão v3.1 em seus aplicativos e fluxos de trabalho.

Próximos passos

  • Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.

  • Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.