Modelo de recibo de Document Intelligence

Artigo
10/17/2024

Importante

As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
- Centro-Norte dos EUA

Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1

Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1

Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)

O modelo de recibo Document Intelligence combina poderosas capacidades de Reconhecimento Ótico de Carateres (OCR) com modelos de aprendizagem profunda para analisar e extrair informações importantes dos recibos de vendas. Os recibos podem ser de vários formatos e qualidade, incluindo recibos impressos e manuscritos. A API extrai informações importantes, como nome do comerciante, número de telefone do comerciante, data da transação, impostos e total da transação e retorna dados JSON estruturados.

Tipos de recibos suportados:

Térmica
Cartão de Crédito
Gás
Estacionamento
Hotel
Transportes
Comunicação
Entretenimento
Voo
Formação
Farmácia/Medicina

Extração de dados de recibo

A digitalização de recibos engloba a transformação de vários tipos de recibos, incluindo cópias digitalizadas, fotografadas e impressas, em um formato digital para processamento simplificado a jusante. Exemplos incluem gestão de despesas, análise do comportamento do consumidor, automação fiscal, etc. O uso da inteligência documental com a tecnologia OCR (Optical Character Recognition) pode extrair e interpretar dados desses diversos formatos de recebimento. O processamento de Inteligência Documental simplifica o processo de conversão, mas também reduz significativamente o tempo e o esforço necessários, facilitando assim o gerenciamento e a recuperação eficientes de dados.

Exemplo de recibo processado com o Document Intelligence Studio:

Recibo de amostra processado com a ferramenta Document Intelligence Sample Labeling:

Captura de ecrã de um recibo de amostra processado com a ferramenta Etiquetagem de Amostra de Formulário.

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-07-31-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de recibo	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	recibo pré-embutido

O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de recibo	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	recibo pré-embutido

O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos	Model ID
Modelo de recibo	• Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	recibo pré-embutido

O Document Intelligence v2.1 suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos
Modelo de recibo	• Ferramenta de etiquetagem de Inteligência Documental• API REST • SDK de biblioteca cliente• Contêiner Docker de Inteligência Documental

Requisitos de entrada

Formatos de ficheiro suportados:

Modelo	PDF	Imagem: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, , `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lida	✔	✔	✔
Esquema	✔	✔	✔ (2024-07-31-pré-visualização, 2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
Documento Geral	✔	✔
Pré-criado	✔	✔
Extração personalizada	✔	✔
Classificação personalizada	✔	✔	✔ (2024-07-31-pré-visualização, 2024-02-29-pré-visualização)

Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a cerca 8 de texto pontual a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1 GB com um máximo de 10.000 páginas. Para 2024-07-31-preview e posterior, o tamanho total dos dados de treinamento é 2 GB com um máximo de 10.000 páginas.

Formatos de ficheiro suportados: JPEG, PNG, PDF e TIFF.
Permissão de página suportada para PDF e TIFF: o Document Intelligence pode processar até 2.000 páginas para assinantes de nível padrão ou apenas as duas primeiras páginas para assinantes de nível gratuito.
Tamanho do ficheiro suportado: menos de 50 MB; pixels mínimos: 50 x 50 px; máximo de pixels 10.000 x 10.000 px.

Extração de dados do modelo de recibo

Veja como o Document Intelligence extrai dados, incluindo hora e data das transações, informações do comerciante e totais de valores dos recibos. Você precisa dos seguintes recursos:

Uma assinatura do Azure — você pode criar uma gratuitamente.
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Nota

O Document Intelligence Studio está disponível com APIs v3.1 e v3.0 e versões posteriores.

Na home page do Document Intelligence Studio, selecione Recibos.
Você pode analisar o recibo de amostra ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

Experimente o Document Intelligence Studio.

Ferramenta de etiquetagem de exemplo de inteligência de documentos

Navegue até a Ferramenta de Exemplo de Inteligência de Documentos.
Na página inicial da ferramenta de exemplo, selecione o bloco Usar modelo pré-criado para obter dados .
Selecione o Tipo de formulário a ser analisado no menu suspenso.
Escolha um URL para o arquivo que você gostaria de analisar a partir das opções abaixo:
- Exemplo de documento de fatura.
- Exemplo de documento de identificação.
- Imagem de recibo de amostra.
- Exemplo de imagem de cartão de visita.
No campo Origem, selecione URL no menu suspenso, cole o URL selecionado e selecione o botão Buscar.
No campo Ponto de extremidade do serviço de Inteligência Documental, cole o ponto de extremidade obtido com sua assinatura do Document Intelligence.
No campo chave, cole a chave obtida do recurso Document Intelligence.
Selecione Executar análise. A ferramenta Document Intelligence Sample Labeling chama a API Analyze Prebuilt e analisa o documento.
Exibir os resultados - veja os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detetadas.

Nota

A ferramenta Exemplo de etiquetagem não suporta o formato de ficheiro BMP. Esta é uma limitação da ferramenta e não do Serviço de Inteligência Documental.

Idiomas e localidades suportados

Para obter uma lista completa dos idiomas suportados, consulte a nossa página de suporte a idiomas de modelos pré-construídos.

Extração de campo

Nome	Tipo	Description	Saída padronizada
Tipo de recibo	String	Tipo de recibo de venda	Discriminado
MerchantName	String	Nome do comerciante que emite o recibo
Número de telefone do comerciante	phoneNumber	Número de telefone listado do comerciante	+1 xxx xxx xxxx
MerchantAddress	String	Endereço listado do comerciante
TransactionDate	Date	Data de emissão do recibo	AAAA-MM-DD
TransactionTime	Hora	Hora de emissão do recibo	HH-MM-SS (24 horas)
Total	Número (USD)	Total total de recebimento da transação	Flutuação de duas casas decimais
Subtotal	Número (USD)	Subtotal do recebimento, muitas vezes antes da aplicação dos impostos	Flutuação de duas casas decimais
Imposto	Número (USD)	Total de impostos no recebimento (geralmente imposto sobre vendas ou equivalente). Renomeado para "TotalTax" na versão 2022-06-30.	Flutuação de duas casas decimais
Gorjeta	Número (USD)	Dica incluída pelo comprador	Flutuação de duas casas decimais
Items	Matriz de objetos	Itens de linha extraídos, com nome, quantidade, preço unitário e preço total extraído
Nome	Cadeia (de carateres)	Descrição do artigo. Renomeado para "Descrição" na versão 2022-06-30.
Quantidade	Número	Quantidade de cada item	Flutuação de duas casas decimais
Preço	Número	Preço individual de cada unidade de item	Flutuação de duas casas decimais
PreçoTotal	Número	Preço total do item de linha	Flutuação de duas casas decimais

Para campos de extração de documentos suportados, consulte a página do esquema do modelo de recibo em nosso repositório de exemplo do GitHub.

Guia de migração e API REST v3.1

Siga nosso guia de migração do Document Intelligence v3.1 para saber como usar a versão v3.1 em seus aplicativos e fluxos de trabalho.

Próximos passos

Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Encontre mais exemplos no GitHub.

Encontre mais exemplos no GitHub.

Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Partilhar via