Esse conteúdo se aplica a: v4.0 (versão prévia) v3.1 (GA) v3.0 (GA) v2.1 (GA)
IA do Azure para Informação de Documentos é um serviço baseado em nuvem que utiliza modelos de aprendizagem automática para extrair pares chave-valor, texto e tabelas dos documentos. O resultado retornado é uma saída JSON estruturada. Os casos de uso da Informação de Documentos incluem processamento de dados automatizado, estratégias controladas por dados aprimoradas e funcionalidades de pesquisa de documentos enriquecidas.
Visão geral
A IA do Azure Document Intelligence e o Azure AI Form Recognizer são o mesmo serviço?
Sim.
A IA do Azure Document Intelligence e o Azure AI Form Recognizer são o mesmo serviço. O serviço foi renomeado de IA do Azure Form Recognizer para Azure AI Document Intelligence em julho de 2023. O serviço fornece os mesmos recursos e recursos de antes da renomeação.
Alterações de preços: Não há alterações nos preços. Os nomes Serviços Cognitivos e Serviços de IA Aplicada continuam sendo utilizados nas APIs de preço, listas de preços, análises de custo e cobranças do Azure.
Alterações significativas: Não há alterações significativas em APIs ou bibliotecas de cliente. As APIs REST e as versões do SDK 2024-02-29-preview, 2023-10-31-preview e posteriores foram renomeadas como
document intelligence
.
A Informação de Documentos integra-se a outros serviços Microsoft?
Sim.
Document Intelligence integra-se com os seguintes serviços:
Funcionalidades de IA
Posso usar Document Intelligence com IA generativa para processamento de documentos?
Sim.
A Informação de Documentos agora inclui generativa personalizada, um novo tipo de modelo de extração que utiliza IA Generativa e modelos LLMs (modelos de linguagem grandes) para extrair campos de documentos. No passado, você usou um padrão RAG (geração aumentada de recuperação) para extrair campos. O novo modelo fornece resultados de alta qualidade com uma única chamada à API. Você também pode usar uma solução de IA generativa de documentos para interagir com seus documentos (RAG), gerar conteúdo cativante a partir desses documentos e acessar modelos do Serviço OpenAI do Azure em seus dados.
Com a combinação do IA do Azure para Informação de Documentos e do OpenAI do Azure, você pode criar um aplicativo empresarial para interagir com seus documentos usando linguagem natural de forma fluida. Você pode encontrar respostas facilmente, obter insights valiosos e gerar conteúdo novo e envolvente a partir de documentos existentes.
Você pode encontrar mais detalhes sobre o padrão de geração aumentada de recuperação aqui.
O Document Intelligence pode ajudar com o agrupamento semântico em documentos para geração aumentada de recuperação?
Sim.
O Document Intelligence pode fornecer os blocos de construção para habilitar o agrupamento semântico. A segmentação semântica é uma etapa chave na RAG (geração aumentada por recuperação) para garantir que os segmentos de contexto sejam densos e melhorem a relevância.
A Informação de Documentos oferece um modelo de layout que fornece uma decomposição visual do documento em linhas, parágrafos, seções, cabeçalhos e rodapés.
Em seguida, você pode optar por recuperar os resultados no formato markdown, para dividir ainda mais o documento em seções ou parágrafos.
Para obter mais informações, veja visão geral do RAG em Document Intelligence
Estúdio de Informação de Documentos
Preciso de permissões específicas para acessar o Document Intelligence Studio?
Sim.
É necessário ter uma conta do Azure ativa e uma assinatura com pelo menos uma função de Leitor para acessar o Estúdio da Informação de Documentos.
Para análise de documentos e modelos predefinidos, aqui estão os requisitos de função para cenários de usuário:
Basic
- Usuário de Serviços Cognitivos: é necessário ter essa função para um recurso de Informação de Documentos ou Serviços Cognitivos do Azure de múltiplos serviços para usar o Estúdio da Informação de Documentos.
Avançado
- Colaborador: é necessário ter essa função para criar um grupo de recursos ou um recurso da Informação de Documentos.
Para projetos de modelo personalizados, aqui estão os requisitos de função para cenários de usuário:
Basic
Usuário de Serviços Cognitivos: é necessário ter essa função para um recurso de Informação de Documentos ou Serviços Cognitivos de múltiplos serviços para treinar um modelo personalizado ou analisar com modelos treinados.
Colaborador de Dados de Armazenamento de Blobs: é necessário ter essa função para uma conta de armazenamento criar dados de projeto e rótulo.
Avançado
Colaborador de Conta de Armazenamento: é necessário ter essa função para que a conta de armazenamento defina as configurações de CORS (compartilhamento de recursos entre origens). É um esforço único se você reutilizar a mesma conta de armazenamento.
Colaborador: você precisa dessa função para criar recursos e um grupo de recursos. A função de Colaborador ou Colaborador de Conta de Armazenamento não lhe dá acesso para usar o recurso de Informação de Documentos ou conta de armazenamento se a autenticação local (baseada em chave) estiver desabilitada. Você ainda precisa das funções básicas (Usuário dos Serviços Cognitivos e Colaborador de Blobs de Dados de Armazenamento) para usar as funções no Estúdio de Informação de Documentos.
Para obter mais informações, consulte Funções internas do Microsoft Entra e as seções sobre as atribuições de função no Início rápido do estúdio da Informação de Documentos.
Posso processar documentos com mais de duas páginas no Document Intelligence Studio?
Sim, para recursos de nível pago.
Não, para recursos de nível gratuito.
Para recursos de nível gratuito (F0), apenas as duas primeiras páginas são analisadas se você estiver usando o Document Intelligence Studio, a API REST ou bibliotecas de cliente.
Caso queira analisar todas as páginas de um documento, altere para um recurso pago (S0). No Document Intelligence Studio, selecione o botão Configurações (engrenagem), selecione a guia Recursos e verifique o nível de preço a ser usado para analisar seus documentos.
Posso alterar diretórios ou assinaturas no Document Intelligence Studio?
Sim.
Para alterar um diretório no Estúdio da Informação de Documentos, selecione o botão Configurações (engrenagem). Em Diretório, selecione o diretório na lista e, em seguida, selecione Alternar Diretório. Faça login novamente depois de mudar de diretório.
Para alterar uma assinatura ou um recurso, vá para a guia Recursos em Configurações.
Posso usar o Document Intelligence Studio com um recurso configurado com firewall ou rede virtual?
Sim.
Se o seu recurso de Inteligência de Documentos estiver configurado com um firewall ou rede virtual, você precisará adicionar o endereço IP dedicado 20.3.165.95 à lista de permissões do firewall para seu recurso de Inteligência de Documentos. Algumas funções em projetos personalizados (por exemplo, rotulagem automática, gerenciamento de projetos e intervenção humana) não funcionarão se o acesso à rede pública estiver desabilitado.
Quando carrego um arquivo no Document Intelligence Studio pela função "Buscar da URL", posso usar uma URL do meu armazenamento de blobs?
Sim.
Se a URL do armazenamento de blobs do Azure incluir um token SAS e estiver acessível em redes públicas. Não é possível usar a função Buscar para contas de armazenamento onde o acesso à chave está desabilitado ou atrás de um firewall/VNet.
Posso reutilizar ou personalizar a experiência de rotulagem do Estúdio da Informação de Documentos e incorporá-la em meu próprio aplicativo?
Sim.
A experiência de rotulagem do Estúdio da Informação de Documentos é de código aberto no repositório Toolkit.
Existem pontos de extremidade de URL separados para regiões de nuvem soberana da Document Intelligence?
Sim.
O Document Intelligence Studio possui pontos de extremidade de URL separados para regiões de nuvem soberanas:
URL para a nuvem Azure do Governo dos EUA (Azure Fairfax): Document Intelligence Studio Governo dos EUA.
URL Microsoft Azure operado pela 21Vianet (Azure China): Document Intelligence Studio China.
Desenvolvimento de aplicativos
Posso desenvolver aplicativos usando o IA do Azure Document Intelligence usando as opções de desenvolvimento mais recentes?
Sim.
a Informação de Documentos oferece as opções de desenvolvimento mais recentes nas seguintes plataformas:
[API REST](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
Posso migrar meu aplicativo para a versão mais recente do Document Intelligence?
Sim.
A tabela a seguir fornece links para instruções detalhadas sobre a migração para a versão mais recente do Document Intelligence:
API/Idioma | Guia de migração |
---|---|
API REST | v3 |
C# / .NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
Posso especificar um intervalo de páginas a serem analisadas em um documento?
Sim.
Use o parâmetro pages
(com suporte às versões v2.1, v3.0 e posteriores da API REST) e especifique páginas para documentos PDF e TIFF de várias páginas. A entrada aceita inclui os seguintes intervalos:
- Páginas únicas. Por exemplo, se você especificar
1, 2
serão processadas as páginas 1 e 2. - Intervalos finitos. Por exemplo, se você especificar
2-5
serão processadas as páginas de 2 a 5. - Intervalos em aberto. Por exemplo, se você especificar
5-
serão processadas todas as páginas da página 5. Se você especificar-10
serão processadas as páginas de 1 a 10.
Você pode combinar esses parâmetros e os intervalos podem se sobrepor. Por exemplo, se você especificar -5, 1, 3, 5-10
serão processadas as páginas de 1 a 10.
O serviço aceita a solicitação se puder processar pelo menos uma página do documento. Por exemplo, usar 5-100
em um documento de cinco páginas é uma entrada válida e significa que a página 5 foi processada.
Se você não fornecer um intervalo de páginas, todo o documento será processado.
Você recomenda usar o Document Intelligence Studio em vez da ferramenta FOTT Sample Labeling para meu projeto?
Sim.
Recomendamos o Document Intelligence Studio na maioria das vezes porque ele pode reduzir o tempo de configuração de recursos e serviços de armazenamento do Document Intelligence.
Considere usar a Form Testing Tool (FOTT) apenas para os seguintes cenários:
Seus dados devem permanecer dentro de um único computador. Use a Ferramenta de Rotulagem de Exemplos FOTT e o Contêiner de Informação de Documentos.
Seu projeto é altamente dependente da Informação de Documentos V2.1 e você quer continuar usando as APIs v2.1.
Existem práticas recomendadas para mitigar a limitação?
Sim.
A Informação de Documentos usa dimensionamento automático para fornecer os recursos computacionais necessários sob demanda, mantendo os custos dos clientes baixos. Para reduzir a suspensão durante o dimensionamento automático, recomendamos a seguinte abordagem:
Implemente a lógica de repetição no seu aplicativo.
Se você achar o número de solicitações
POST
está restrito, adicione um atraso entre as solicitações.Aumente a carga de trabalho gradualmente. Evite alterações significativas.
Criar uma solicitação de suporte para aumentar o limite de TPS (transações por segundo).
Saiba mais sobre as cotas e os limites de serviço da Informação de Documentos.
Modelos personalizados
Posso melhorar uma pontuação de precisão estimada para um modelo personalizado?
Sim.
Variações na estrutura visual dos seus documentos podem influenciar a precisão de um modelo. Veja algumas dicas:
Inclua todas as variações de um documento no conjunto de dados de treinamento. As variações incluem formatos diferentes; por exemplo, PDFs digitais versus PDFs digitalizados.
Separe tipos de documento visualmente distintos e treine modelos diferentes.
Verifique se você não tem rótulos estranhos.
Para rotular assinatura e região, não inclua o texto ao redor.
Para obter mais informações, consulte Pontuações de precisão e de confiança.
Posso treinar um modelo personalizado?
Não.
A Informação de Documentos não tem uma operação explícita de retreinamento. Cada operação de treinamento gera um novo modelo.
Se você achar que seu modelo precisa ser treinado novamente, você poderá adicionar mais amostras ao conjunto de dados de treinamento e treinar um novo modelo.
Você também pode criar um novo modelo para compor com seu modelo original da seguinte forma:
Crie um conjunto de dados para seu novo modelo.
Rotular e treinar um novo modelo.
Confirme se o novo modelo tem um bom desempenho para seus tipos de documento específicos.
Componha seu novo modelo com o modelo existente em um único ponto de extremidade. A Informação de Documentos pode determinar o melhor modelo para cada documento a ser analisado.
Para mais informações, veja modelos compostos.
Posso mover meus modelos treinados de um ambiente (como beta) para outro (como produção)?
Sim.
Você pode usar a API de Cópia para copiar modelos personalizados de uma conta do Document Intelligence para outras que existam em qualquer região geográfica suportada. Para obter instruções detalhadas, consulte Recuperação de desastre.
A operação de cópia está limitada à cópia de modelos dentro do ambiente de nuvem específico onde você treinou o modelo. Por exemplo, não há suporte para copiar modelos da nuvem pública para a nuvem do Azure Governamental.
Você será cobrado ao treinar modelos personalizados?
Sim.
O treinamento é gratuito para todos os modelos de modelos personalizados e gerativos. No entanto, a criação do conjunto de dados de treinamento para todos os modelos requer a execução do modelo de Layout nos documentos de treinamento. Os clientes são responsáveis por esse custo.
Os modelos generativos personalizados também dependem do recurso de rótulo automático para acelerar a geração do conjunto de dados rotulado. Há um custo associado a essa ação. Embora a operação de criação de modelos e modelos generativos seja gratuita, a criação do conjunto de dados rotulado pode resultar em alguns custos mínimos.
Para v4.0 2024-07-31-preview
, os modelos neurais personalizados podem ser treinados gratuitamente por no máximo 10 horas. Caso esteja treinando um único modelo para as 10 horas ou treinando vários modelos para o total de 10 horas, você não será cobrado nas primeiras 10 horas. Após usar as 10 horas gratuitas, você será cobrado automaticamente pela hora de treinamento extra. Para obter detalhes sobre os preços, consulte a página de preços. Esse novo recurso de treinamento pago permite que os modelos de treinamento por uma duração prolongada processem documentos maiores. Para obter mais informações sobre esse recurso de treinamento pago, verifique a seção de cobrança do modelo neural personalizado.
Para v3.0 2022-08-31
ou v3.1 2023-07-31
, os modelos neurais personalizados podem ser treinados gratuitamente para um máximo de 20 sessões de treinamento, com cada sessão limitada a 30 minutos de duração do treinamento. Após usar todas as 20 sessões de treinamento, você poderá enviar o tíquete de suporte do Azure para aumentar o limite de sessão de treinamento. Para aumentar o limite, duas sessões de treinamento são consideradas como uma hora de treinamento e você é cobrado por duas sessões/uma hora de treinamento. Para obter detalhes sobre os preços, consulte a [página de preços]. Para obter mais informações sobre maneiras de aumentar o limite, verifique a seção de cobrança personalizada do modelo neural. Para v3.0
e v3.1
, o recurso de treinamento pago não está disponível. O recurso de treinamento pago para o modelo neural personalizado só está disponível em v4.0
.
Conta de armazenamento
Existe um prazo de validade para o token SAS (assinatura de acesso compartilhado) que eu uso para autenticação da minha conta de armazenamento?
Sim.
Quando você cria uma assinatura de acesso compartilhado (SAS), a duração padrão é de 48 horas. Após 48 horas, será necessário criar um novo token.
Defina um período de duração mais longo para o tempo que você estiver usando a conta de armazenamento com a Informação de Documentos.
A Document Intelligence pode acessar dados na minha conta de armazenamento se ela estiver atrás de uma rede virtual ou firewall?
Não, não diretamente.
A Document Intelligence não pode aceder à sua conta de armazenamento se estiver protegida por uma rede virtual ou firewall.
No entanto, o acesso e a autenticação da conta de armazenamento privado do Azure dá suporte a identidades gerenciadas para recursos do Azure. Quando você usa uma identidade gerenciada, o serviço de Informação de Documentos poderá acessar a conta de armazenamento utilizando uma credencial atribuída.
Se você pretende analisar os dados da conta de armazenamento privado utilizando FOTT, será necessário implementar a ferramenta atrás da rede virtual ou do firewall.
Saiba como criar e usar a identidade gerenciada no recurso da Informação de Documentos.
Contêineres
Existe uma diferença entre contêineres desconectados e conectados?
Sim.
Embora os recursos do modelo sejam os mesmos para contêineres conectados e desconectados, os métodos de cobrança e conectividade são diferentes:
Os contêineres conectados enviam as informações de cobrança para o Azure utilizando um recurso de Informação de Documentos na conta do Azure. Com os contêineres conectados, a conectividade com a Internet é necessária para enviar informações de cobrança para o Azure. Os contêineres conectados da Informação de Documentos enviam informações de cobrança para o Azure usando um recurso da Informação de Documentos em sua conta do Azure. Os contêineres conectados não enviam dados do cliente, como imagem ou texto que está sendo analisado, para a Microsoft. Para obter um exemplo das informações que os contêineres conectados enviam à Microsoft para cobrança, consulte as Perguntas frequentes sobre os contêineres de IA do Azure.
Os contêineres desconectados permitem que você use APIs desconectadas da Internet. As informações de cobrança não são enviadas pela Internet. Em vez disso, os encargos baseiam-se num nível de compromisso adquirido. Atualmente, o uso de contêiner desconectado está disponível para modelos personalizados e de fatura da Informação de Documentos.
Posso usar o armazenamento local para o contêiner da Ferramenta de Rotulagem de Amostra da Informação de Documentos (FOTT)?
Sim.
A FOTT tem uma versão que usa o armazenamento local. A versão precisa ser instalada em um computador Windows. Você pode instalá-la neste local.
Na página do projeto, especifique o URI da pasta de rótulos como /shared ou /shared/sub-dir se os arquivos de rotulagem estiverem em um subdiretório. Todos os outros comportamentos da ferramenta de rotulagem de amostra da Informação de Documentos são os mesmos do serviço hospedado.
Existe uma prática recomendada para escala?
Sim.
Para chamadas assíncronas, é possível executar vários contêineres com armazenamento compartilhado. O contêiner que está processando a chamada POST
analyze armazena a saída no armazenamento. Em seguida, qualquer outro contêiner pode buscar os resultados do armazenamento e atender às chamadas GET
. A ID da solicitação não está vinculada a um contêiner.
Para chamadas síncronas, é possível executar vários contêineres, mas apenas um contêiner atende a uma solicitação. Por ser uma chamada de bloqueio, qualquer contêiner do pool pode atender a solicitação e enviar a resposta. Aqui, apenas um contêiner está vinculado a uma solicitação por vez e nenhuma pesquisa é necessária.
Posso configurar contêineres com armazenamento compartilhado?
Sim.
Os contêineres usam a propriedade Mounts: Shared
durante a inicialização para especificar o armazenamento compartilhado para armazenar os arquivos de processamento. Para ver o uso dessa propriedade, consulte a documentação de contêineres.
Segurança e privacidade
A Informação de Documentos armazena meus dados?
Sim, brevemente.
Para todos os recursos, a Informação de Documentos armazena temporariamente os dados e os resultados no Armazenamento do Microsoft Azure na mesma região da solicitação. Seus dados serão excluídos dentro de 24 horas a partir do momento em que você enviar uma solicitação de análise.
Saiba mais sobre Dados, privacidade e segurança da Informação de Documentos.
Para modelos personalizados treinados, as saídas provisórias após análise e rotulagem são armazenadas no mesmo local de Armazenamento do Microsoft Azure onde você armazena seus dados de treinamento. Os modelos personalizados treinados são armazenados no Armazenamento do Microsoft Azure na mesma região e são logicamente isolados com a sua assinatura do Azure e credenciais de API.
Ajuda e suporte adicionais
Existem outros recursos disponíveis para fornecer soluções para questões de Inteligência de Documentos da IA do Azure?
Sim.
O Microsoft Q & A é o lugar para perguntas e respostas técnicas na Microsoft. É possível filtrar consultas específicas para Informação de Documentos.
Posso fornecer feedback direto se o serviço não reconhecer um texto específico ou o reconhecer incorretamente quando estiver rotulando documentos?
Sim.
Atualizamos e melhoramos continuamente os modelos de Inteligência Documental. Você pode enviar um email à equipe da Informação de Documentos. Se possível, compartilhe um documento de exemplo com o problema realçado.