Modelo de cartão de crédito da Informação de Documentos
Este conteúdo se aplica a: v4.0 (versão prévia)
O modelo de cartão de crédito/débito de Informação de Documentos usa recursos poderosos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos-chave de cartão de crédito/débito. Cartões de crédito e cartões de débito podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e arquivos PDF digitais. A API analisa o texto do documento; extrai informações importantes, como número do cartão de crédito, banco emissor e data de validade e retorna uma representação de estruturada de dados JSON. Atualmente, o modelo dá suporte a formatos de documento em inglês.
Processamento automatizado de cartão
O processamento automatizado de cartões de crédito/débito é o processo de extração de campos-chave de cartões bancários. Historicamente, o processo de análise de cartões bancários é realizado manualmente e, portanto, muito demorado. A extração precisa de dados importantes de cartões bancários é normalmente a primeira e uma das etapas mais críticas no processo de automação de contratos.
Opções de desenvolvimento
A Informação de Documentos C dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos | ID do Modelo |
---|---|---|
Modelo de contrato | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Python • SDK do Java • SDK do JavaScript |
prebuilt-creditCard |
Requisitos de entrada
Formatos de arquivo com suporte:
Modelar PDF Image,: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento geral ✔ ✔ Predefinida ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e
4
MB para a camada gratuita (F0).As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente
8
pontos de texto a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e
1
GB para o modelo neural.Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de
1
GB, com um máximo de 10.000 páginas. Para a visualização de 31/07/2024 e posteriores, o tamanho total dos dados de treinamento é de2
GB com um máximo de 10.000 páginas.
Extração de dados de cartão de crédito
Para ver como funciona a extração de dados para o serviço de cartão de certidão/débito, você precisa dos seguintes recursos:
Uma assinatura do Azure: você pode criar uma gratuitamente.
Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.
Estúdio de Informação de Documentos
Na home page do Estúdio da Informação de Documentos, selecione Cartão de Crédito/Débito.
Você pode analisar os documentos fiscais de amostra ou carregar seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Idiomas e localidades com suporte
Para obter uma lista completa dos idiomas compatíveis, consulte nossa página de suporte a idiomas de modelos predefinidos.
Extração de campo
Para ver os campos de extração de documentos compatíveis, consulte a página do esquema do modelo de cartão de crédito em nosso repositório de amostras do GitHub.
Os pares de chave-valor de cartões bancários e os itens de linha extraídos estão na seção
documentResults
da saída JSON.
Próximas etapas
Experimente processar seus próprios formulários e documentos com o Estúdio da Informação de Documentos.
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.