Modelo de fatura da Informação de Documentos

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão de visualização pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-07-31-preview.
  • Atualmente, a versão de visualização pública 2024-07-31-preview só está disponível nas regiões do Azure a seguir. Observe que o modelo generativo personalizado (extração de campos do documento) no Estúdio de IA está disponível somente na região Centro-Norte dos EUA:
    • Leste dos EUA
    • Oeste dos EUA 2
    • Oeste da Europa
    • Centro-Norte dos EUA

Esse conteúdo se aplica a: marca de seleção v4.0 (versão prévia) | Versões prévias: marca de seleção azul v3.1 (GA) marca de seleção azul v3.0 (GA) marca de seleção azul v2.1 (GA)

Esse conteúdo se aplica a: marca de seleção v3.1 (GA) | Ultima versão: marca de seleção púrpura v4.0 (versão prévia) | Versões prévia: marca de seleção azul v3.0 marca de seleção azul v2.1

Esse conteúdo se aplica a: marca de seleção v3.0 (GA) | Ultimas versões: marca de seleção púrpura v4.0 (versão prévia) marca de seleção púrpura v3.1 | Versões prévia: marca de seleção azul v2.1

Esse conteúdo se aplica a: marca de seleção v2.1 | ais recente: marca de seleção azul v4.0 (versão prévia)

O modelo de fatura da Informação de Documentos usa recursos avançados de Reconhecimento Óptico de Caracteres (OCR) para analisar e extrair os campos-chave e os itens de linha das faturas de vendas. As faturas podem ter ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e arquivos PDF digitais. A API analisa o texto da nota fiscal; extrai informações importantes, como nome do cliente, endereço de cobrança, data de vencimento e valor devido; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo oferece suporte a faturas em 27 idiomas.

Tipos de documento com suporte:

  • Faturas
  • Contas de serviço público
  • Ordens de vendas
  • Ordens de compra

Processamento automatizado de faturas

O processamento automatizado de faturas é o processo de extração de campos chave accounts payable de documentos de conta de cobrança. Os dados extraídos incluem itens de linha de faturas integradas aos fluxos de trabalho das AP (contas a pagar) para revisões e pagamentos. Historicamente, o processo de contas a pagar é feito de forma manual e, sendo assim, é muito demorada. A extração exata de dados-chave das faturas normalmente é a primeira e uma das etapas mais críticas no processo de automação de faturas.

Amostra de fatura processada com o Estúdio de Informação de Documentos:

Captura de tela da amostra de fatura processada no Estúdio de Informação de Documentos.

Opções de desenvolvimento

A Informação de Documentos v4.0 (2024-07-31-preview) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de fatura Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-invoice

A Informação de Documentos v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de fatura Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-invoice

A Informação de Documentos v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelo de fatura Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-invoice

O Document Intelligence v2.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo de fatura Ferramenta de rotulagem da Informação de Documentos
API REST
SDK da biblioteca de clientes
Contêiner do Docker da Informação de Documentos

Requisitos de entrada

  • Formatos de arquivo com suporte:

    Modelar PDF Image,:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Ler
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente 8 pontos de texto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.

    • Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de 1 GB, com um máximo de 10.000 páginas. Para a visualização de 31/07/2024 e posteriores, o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.

  • Formatos de arquivo com suporte: JPEG, PNG, PDF e TIFF.
  • PDF e TIFF têm suporte, até 2.000 páginas são processadas. Para assinantes de camada gratuita, somente as duas primeiras páginas são processadas.
  • Para ter suporte, o tamanho do arquivo precisa ser menor que 50 MB e ter como dimensões, no mínimo, 50 x 50 pixels e, no máximo, 10.000 x 10.000 pixels.

Extração de dados do modelo de fatura

Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos das notas fiscais. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

  1. Na página inicial do Estúdio da Informação de Documentos, selecione Faturas.

  2. Você pode analisar o documento de amostra ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Ferramenta de Rotulagem de Amostra da Informação de Documentos

  1. Navegue até a Ferramenta de Exemplo da Informação de Documentos.

  2. Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.

    Captura de tela do processo de análise de resultados do modelo de layout.

  3. Selecione o Tipo de Formulário que deseja analisar no menu suspenso.

  4. Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:

  5. No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.

    Captura de tela do menu suspenso do local de origem.

  6. No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.

  7. No campo chave, cole a chave obtida do recurso Informação de Documentos.

    Captura de tela mostrando o menu suspenso select-form-type.

  8. Selecione Executar análise. A ferramenta de rotulagem de exemplo da Informação de Documentos chamará a API predefinida Analisar e analisará o documento.

  9. Veja os resultados: confira os pares chave-valor extraídos, os itens de linha, o texto realçado extraído e as tabelas detectadas.

    Captura de tela da operação de análise de resultados do modelo de layout.

Observação

A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.

Idiomas e localidades com suporte

Para obter uma lista completa dos idiomas compatíveis, consulte nossa página de suporte a idiomas de modelos predefinidos.

Extração de campo

  • Para ver os campos de extração de documentos compatíveis, consulte a página do esquema do modelo de fatura em nosso repositório de amostras do GitHub.

  • Os pares de valor da chave da fatura e os itens de linha extraídos estão na seção documentResults da saída JSON.

Pares de valores-chave

A fatura pré-integrada 2022-06-30 e versões posteriores suportam o retorno opcional de pares de chave-valor. Por padrão, o retorno de pares de chave-valor está desabilitado. Pares chave-valor são intervalos específicos dentro da fatura que identificam um rótulo ou uma chave e a resposta ou o valor associado. Em uma fatura, esses pares podem ser o rótulo e o valor que o usuário inseriu para aquele campo ou número de telefone. O modelo de AI é treinado para extrair chaves e valores identificáveis com base em uma ampla variedade de tipos de documento, formatos e estruturas.

As chaves também podem existir isoladamente quando o modelo detecta que existe uma chave, sem valor associado ou ao processar campos opcionais. Por exemplo, um campo de nome do meio pode ser deixado em branco em um formulário em algumas instâncias. Pares chave-valor são sempre intervalos de texto contidos no documento. Para documentos em que o mesmo valor é descrito de maneiras diferentes, por exemplo, cliente/usuário, a chave associada é cliente ou usuário (com base no contexto).

Campos extraídos

O serviço de Fatura extrai o texto, as tabelas e 26 campos da fatura. A seguir serão mostrados os campos extraídos de uma fatura na resposta de saída JSON (a saída abaixo usará esta fatura de exemplo).

Nome Tipo Descrição Texto Valor (saída padronizada)
CustomerName string O cliente recebendo a fatura Microsoft Corp.
CustomerId string A ID de referência do cliente CID-12345
PurchaseOrder string Um número de referência da ordem de compra PO-3333
InvoiceId string A ID desta fatura específica (geralmente exibida como "Número da Fatura") INV-100
InvoiceDate date A data em que a fatura foi emitida 15/11/2019 15-11-2019
DueDate date A data de vencimento do pagamento desta fatura 15/12/2019 15-12-2019
VendorName string Fornecedor que criou a fatura CONTOSO
VendorAddress string O endereço para correspondência do fornecedor 123 456th St New York, NY, 10001
VendorAddressRecipient string Nome associado ao VendorAddress Sede da Contoso
CustomerAddress string Endereço para correspondência do cliente 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient string Nome associado ao CustomerAddress Microsoft Corp.
BillingAddress string Endereço explícito para cobrança do cliente 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient string Nome associado ao BillingAddress Serviços Microsoft
ShippingAddress string Endereço explícito para entrega do cliente 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient string Nome associado ao ShippingAddress Entrega da Microsoft
Subtotal número Campo do subtotal identificado nesta fatura US$ 100,00 100
TotalTax número Campo do imposto total identificado nesta fatura US$ 10,00 10
InvoiceTotal número Total de novos encargos associados a esta fatura US$ 110,00 110
AmountDue número Valor total devido ao fornecedor US$ 610,00 610
ServiceAddress string Endereço de serviço ou endereço de propriedade explícito do cliente 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient string Nome associado ao ServiceAddress Serviços Microsoft
RemittanceAddress string Remessa explícita ou endereço para pagamento do cliente 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string Nome associado ao RemittanceAddress Cobrança da Contoso
ServiceStartDate date Primeira data do período de serviço (por exemplo, um período da fatura serviços públicos essenciais) 14/10/2019 14-10-2019
ServiceEndDate date Data de término do período de serviço (por exemplo, um período da fatura serviços públicos essenciais) 14/11/2019 14-11-2019
PreviousUnpaidBalance número Saldo explícito não pago anteriormente US$ 500,00 500

Abaixo serão mostrados os itens de linha extraídos de uma fatura na resposta de saída JSON e usa esta fatura de exemplo:

Nome Tipo Descrição Texto (item de linha nº 1) Valor (saída padronizada)
Itens string Linha de texto de uma cadeia de caracteres completa do item de linha 04/03/2021 A123 Serviços de Consultoria 2 horas US$ 30,00 10% US$ 60,00
Valor número O valor do item de linha US$ 60,00 100
Descrição string A descrição de texto do item de linha da fatura Serviço de consultoria Serviço de consultoria
Quantidade número O valor deste item de linha da fatura 2 2
UnitPrice número O preço líquido ou bruto (de acordo com a configuração da fatura bruta) de uma unidade deste item US$ 30,00 30
ProductCode string O código do produto, o número do produto ou o SKU associado a um item de linha específico A123
Unidade string A unidade do item de linha, por exemplo: kg, lb etc. horas
Data data A data correspondente a cada item de linha. Frequentemente, será a data em que o item de linha foi enviado 04/03/2021 04-03-2021
Imposto número Imposto associado a cada item de linha. Os valores possíveis incluem: valor do imposto, percentual do imposto e imposto S/N 10%

Estes são campos complexos extraídos de uma fatura na resposta de saída JSON:

TaxDetails

Os detalhes do imposto definem impostos específicos aplicados ao total da fatura.

Nome Tipo Descrição Texto (item de linha nº 1) Valor (saída padronizada)
Itens string Linha de texto de cadeia de caracteres completa do item fiscal V.A.T. 15% US$ 60,00
Valor número O valor do imposto do item fiscal 60,00 60
Taxa string A taxa de imposto do item fiscal 15%

DetalhesDePagamento

Lista todas as opções de pagamento detectadas no campo.

Nome Tipo Descrição Texto (item de linha nº 1) Valor (saída padronizada)
IBAN string Número de conta bancária internacional GB33BUKB20201555555555
SWIFT string Código SWIFT BUKBGB22
BankAccountNumber string Número da conta bancária, um identificador exclusivo para uma conta bancária 123456
BPayBillerCode string Código do emitente do B-Pay australiano 12345
BPayReference string Código de referência do B-Pay australiano 98765432100

Saída em JSON

A saída JSON tem três partes:

  • O nó "readResults" contém todas as marcas de texto e seleção reconhecidas. O texto é organizado por meio de página, linha e, em seguida, por palavras individuais.
  • O nó "pageResults" contém tabelas e células extraídas com suas caixas delimitadoras, confiança e uma referência às linhas e palavras em readResults.
  • O nó "documentResults" contém valores específicos da fatura e os itens de linha que o modelo descobriu. É onde você encontra todos os campos da fatura, como ID, endereço de envio, endereço de cobrança, nome do cliente, valor total, itens de linha e muito mais.

Guia de migração

Próximas etapas