Qual modelo devo escolher?

Importante

  • As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
  • A versão de visualização pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-07-31-preview.
  • Atualmente, a versão de visualização pública 2024-07-31-preview só está disponível nas regiões do Azure a seguir. Observe que o modelo generativo personalizado (extração de campos do documento) no Estúdio de IA está disponível somente na região Centro-Norte dos EUA:
    • Leste dos EUA
    • Oeste dos EUA 2
    • Oeste da Europa
    • Centro-Norte dos EUA

A Inteligência de Documentos da IA do Azure é compatível com uma ampla variedade de modelos que permitem adicionar processamento inteligente de documentos aos seus aplicativos e otimizar seus fluxos de trabalho. A seleção do modelo certo é essencial para garantir o sucesso da sua empresa. Nesse artigo, exploramos os modelos de Reconhecimento de Formulários disponíveis e fornecemos diretrizes sobre como escolher a melhor solução para seus projetos.

Os gráficos de decisão a seguir destacam os recursos de cada modelo com suporte para ajudar você a escolher o modelo que melhor atenda às necessidades e aos requisitos de seu aplicativo.

Importante

Certifique-se de verificar a página Suporte de idiomas para obter informações sobre a extração de textos e campos de idiomas suportados por recurso.

Modelos de análise de documentos pré-treinados

Tipo de documento Exemplo Dados para extrair Sua melhor solução
Um documento genérico. Um contrato ou carta. Você deseja extrair principalmente linhas de texto, palavras, locais e idiomas detectados escritos ou impressos. Ler o modelo OCR
Um documento que inclui informações estruturais. Um relatório ou estudo. Além do texto escrito ou impresso, você precisa extrair informações estruturais como tabelas, marcas de seleção, parágrafos, títulos, títulos e subtítulos. Modelo de análise de layout
Um documento estruturado ou semiestruturado que inclui conteúdo formatado como campos (chaves) e valores. Um formulário ou documento que é um formato padronizado comumente usado em sua empresa ou setor, como um aplicativo de crédito ou pesquisa. Você deseja extrair campos e valores, incluindo os não cobertos pelos modelos predefinidos específicos do cenário sem precisar treinar um modelo personalizado. **Modelo de análise de layout com o parâmetro features=keyValuePairs de cadeia de caracteres de consulta opcional habilitado **

Modelos pré-treinados específicos do cenário

Tipo de documento Dados para extrair Sua melhor solução
Imposto unificado dos EUA Você deseja extrair informações importantes em todas as formas fiscais de W2, 1040, 1090, 1098 de apenas um arquivo, sem executar nenhuma classificação personalizada própria. Modelo de imposto unificado dos EUA
Imposto W-2 dos EUA Você quer extrair informações importantes, como salário, remunerações e impostos retidos. Modelo W-2 dos impostos dos EUA
Imposto 1098 dos EUA Você quer extrair os detalhes dos juros hipotecários, como diretor, pontos e impostos. Modelo 1098 de impostos dos EUA
Imposto 1098-E dos EUA Você quer extrair os detalhes dos juros do empréstimo estudantil, como credor e valor dos juros. Modelo 1098-E de impostos dos EUA
Imposto 1098T dos EUA Você deseja extrair detalhes de mensalidades qualificadas, como ajustes de bolsa de estudos, status do aluno e informações do credor. Modelo de imposto dos EUA 1098-T
Imposto 1099 dos EUA(Variações) Você deseja extrair informações dos formulários 1099 e suas variações (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Modelo de imposto dos EUA 1099
Imposto 1040 dos EUA(Variações) Você quer extrair as informações dos formulários 1040 e suas variações (Agenda 1, Agenda 2, Agenda 3, Agenda 8812, Agenda A, Agenda B, Agenda C, Agenda D, Agenda E, Agenda EIC, Agenda F, Agenda H, Agenda J, Agendar R, Agendar SE, Agenda Sênior). Modelo de imposto dos EUA 1040
Extrato Bancário Você deseja extrair informações importantes do extrato bancário dos EUA \Extrato bancário
Cheque bancário Você deseja extrair informações importantes do documento de cheque. Cheque bancário
Contrato (contrato legal entre partes). Você deseja extrair detalhes do contrato, como partes, datas e intervalos. Modelo de contrato
Cartão do seguro de saúde ou ID do seguro de saúde. Você deseja extrair informações importantes, como seguradora, ID de membro, cobertura de prescrição e número do grupo. Número do cartão do plano de saúde
Cartão de crédito/débito Você deseja extrair cartões bancários de informações importantes, como número do cartão e nome do banco. Modelo de cartão de crédito/débito
Certidão de casamento Você deseja extrair informações importantes das certidões de casamento. Modelo de certificado de casamento
Fatura ou demonstrativo de cobrança Você deseja extrair informações importantes, como nome do cliente, endereço de cobrança e valor devido. Modelo de fatura
Recibo, voucher ou recibo de hotel de página única. Você deseja extrair informações importantes, como nome do comerciante, data da transação e total de transações. Modelo de recibo
Documento de identidade (ID) como uma carteira de motorista dos EUA ou passaporte internacional Você deseja extrair informações importantes, como nome, sobrenome, data de nascimento, endereço e assinatura. Modelo de documento de ID (identidade)
Pagamento de stub Você deseja extrair informações importantes do documento de stub de pagamento. Modelo de stub de pagamento
Financiamento de Imóveis dos EUA, 1003 Você deseja extrair informações importantes do aplicativo de empréstimo residencial uniforme. Modelo de formulário 1003
Financiamento de Imóveis dos EUA, 1004 Você deseja extrair informações importantes do aplicativo URAR (relatório de avaliação residencial uniforme). Modelo de formulário 1004
Financiamento de Imóveis dos EUA, 1005 Você deseja extrair informações importantes do formulário de verificação de emprego Modelo de formulário 1005
Financiamento de Imóveis dos EUA, 1008 Você deseja extrair informações importantes do resumo de Subscrição Uniforme e Transmissão. Modelo de formulário 1008
Divulgação do fechamento de Financiamento de Imóveis dos EUA Você deseja extrair informações importantes de um formulário de divulgação de fechamento de hipotecas. Modelo de formulário de Divulgação de fechamento de hipotecas
Documentos de tipo misto com elementos estruturados, semiestruturados e/ou não estruturados Você deseja extrair pares chave-valor, marcas de seleção, tabelas, campos de assinatura e regiões selecionadas não extraídas por modelos de documento predefinidos ou gerais. Modelo personalizado

Dica

  • Se você ainda não tiver certeza de qual modelo pré-treinado usar, experimente o modelo de layout com o parâmetro features=keyValuePairs de cadeia de caracteres de consulta opcional habilitado.
  • O modelo de layout é alimentado pelo mecanismo OCR de Leitura para detectar páginas, tabelas, estilos, texto, linhas, palavras, locais e idiomas.

Modelos de extração personalizados

Conjunto de treinamento Documentos de exemplo Sua melhor solução
Documentos estruturados, consistentes e com um layout estático. Formulários estruturados, como questionários ou aplicativos. Modelo de template personalizado
Estruturado e semiestruturado. ● Estruturados → pesquisas
● Semiestruturados → faturas
Modelo neural personalizado
Documentos não estruturados, documentos com modelos variados. ● Documentos não estruturados, como contratos ou cartas
● Modelos de documentos variados, como declarações de empréstimo de diferentes empresas hipotecárias
Modelo de geração personalizado
Uma coleção de vários modelos treinados em documentos de tipo semelhante. ● Pedidos de compra de suprimentos
● Pedidos de compra de equipamentos
● Pedidos de compra de móveis
Todos compostos em um único modelo.
Modelo personalizado composto

Modelo de classificação personalizada

Conjunto de treinamento Documentos de exemplo Sua melhor solução
Pelo menos dois tipos diferentes de documentos. Formulários, cartas ou documentos Modelo de classificação personalizada

Próximas etapas