Modelo pré-criado de reconhecimento de texto

Os modelos pré-criado de reconhecimento de texto extrai palavras de documentos e imagens para fluxos de carateres legíveis por computador. O modelo utiliza o reconhecimento ótico de carateres (OCR) de última geração para detetar texto impresso e manuscrito em imagens.

Este modelo processa imagens e ficheiros de texto para extrair linhas de texto impresso ou manuscrito.

Utilizar no Power Apps

O modelo pré-criado de reconhecimento de texto está disponível no Power Apps ao utilizar o componente de reconhecimento de texto. Mais informações:Utilizar o componente de reconhecimento de texto no Power Apps

Utilizar no Power Automate

Para obter informações sobre como utilizar este modelo no Power Automate, consulte Utilizar o modelo pré-criado de reconhecimento de texto no Power Automate.

Idioma, formatos e dimensões de dados suportados

Os ficheiros que pode analisar com o modelo de reconhecimento de texto têm de ter as seguintes características:

  • Idioma para texto de impressão: Afrikaans, Albanês, Angika (Devanagiri), Árabe, Asturiano, Awadhi-Hindi (Devanagiri), Azerbaijanês (Latim), Bagheli, Basco, Bielorusso (Cirílico), Bielorusso (Latim), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bósnio (Latim), Brajbha, Bretão, Búlgaro, Bundeli, Buryat (Cirílico), Catalão, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinês (Simplificado), Chinês (Tradicional), Dialeto da Cornualha, Corso, Crimean Tatar (Latim), Croata, Checo, Dinamarquês, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Neerlandês, Inglês, Erzya (Cirílico), Estónio, Feroês, Fijiaon, Filipino, Finlandês, Francês, Friuliano, Gagauz (Latim), Galego, Alemão, Gilbertese, Gondi (Devanagiri), Gronelandês, Gurung (Devanagiri), Crioulo Haitiano, Halbi (Devanagiri), Hani, Haryanvi, Havaiano, Hindi, Hmong Daw (Latim), Ho(Devanagiri), Húngaro, Islandês, Sami – Inari, Indonésio, Interlíngua, Inuktitut (Latim), Irlandês, Italiano, Japonês, Jaunsari (Devanagiri), Javanês, Kabuverdianu, Kachin (Latim), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cirílico), Kara-Kalpak (Latim), Kashubian, Cazaquistanês (Cirílico), Cazaquistanês (Latim), Khaling, Khasi, Quiché, Coreano, Korku, Koryak, Kosraean, Kumyk (Cirílico), Curdo (Árabe), Curdo (Latim), Kurukh (Devanagiri), Kirguize (Cirílico), Lakota, Latim, Lituano, Baixo Sorábio, Sami – Lule, Luxemburguês, Mahasu Pahari (Devanagiri), Malaio (Latim), Maltês, Malto (Devanagiri), Manx, Maori, Marati, Mongol (Cirílico), Montenegrino (Cirílico), Montenegrino (Latim), Napolitano, Nepalês, Niuean, Nogay, Sami – Norte (Latim), Norueguês, Ocitano, Ossetiano, Pastó, Persia, Polaco, Português, Punjabi (Árabe), Ripuarian, Romeno, Romanesco, Russo, Sadri (Devanagiri), Samoano (Latim), Sânscrito (Devanagari), Santali (Devanagiri), Scots, Gaélico Escocês, Sérvio (Latim), Sherpa (Devanagiri), Sirmauri (Devanagiri), Sami – Skolt, Eslovaco, Esloveno, Somali (Árabe), Sami – Sul, Espanhol, Suaíli (Latim), Sueco, Tajique (Cirílico), Tatar (Latim), Tétum, Thangmi, Tonga, Turco, Turcomeno (Latim), Tuvan, Alto Sorábio, Urdu, Uigur (Árabe), Usbeque (Árabe), Usbeque (Cirílico), Usbeque (Latim), Volapük, Walser, Galês, Frísico Ocidental, Iucatego, Zhuang, Zulu
  • Idioma para o texto escrito à mão: Inglês, Chinês (Simplificado), Francês, Alemão, Italiano, Japonês, Coreano, Português, Espanhol
  • Formato:
    • JPG
    • PNG
    • BMP
    • PDF
  • Tamanho: 20 MB no máximo
  • Para documentos PDF, apenas as primeiras 2,000 páginas são processadas.

Saída do modelo

Se for detetado um documento, o modelo de reconhecimento de texto apresenta as seguintes informações:

  • Resultados: uma lista de linhas extraídas do texto de entrada.
  • Texto: cadeias que contêm a linha de texto detetada.
  • BoundingBox: quatro valores que representam a caixa delimitadora, descrita utilizando as posições superior e esquerda, juntamente com sua largura e altura.

Limites

Ação Limite Período de renovação
Chamadas de reconhecimento de texto (por ambiente) 480 60 segundos

Preparação: Reconhecer texto com o AI Builder (módulo)