Modelo pré-criado de reconhecimento de texto
Os modelos pré-criado de reconhecimento de texto extrai palavras de documentos e imagens para fluxos de carateres legíveis por computador. O modelo utiliza o reconhecimento ótico de carateres (OCR) de última geração para detetar texto impresso e manuscrito em imagens.
Este modelo processa imagens e ficheiros de texto para extrair linhas de texto impresso ou manuscrito.
Utilizar no Power Apps
O modelo pré-criado de reconhecimento de texto está disponível no Power Apps ao utilizar o componente de reconhecimento de texto. Mais informações:Utilizar o componente de reconhecimento de texto no Power Apps
Utilizar no Power Automate
Para obter informações sobre como utilizar este modelo no Power Automate, consulte Utilizar o modelo pré-criado de reconhecimento de texto no Power Automate.
Idioma, formatos e dimensões de dados suportados
Os ficheiros que pode analisar com o modelo de reconhecimento de texto têm de ter as seguintes características:
- Idioma para texto de impressão: Afrikaans, Albanês, Angika (Devanagiri), Árabe, Asturiano, Awadhi-Hindi (Devanagiri), Azerbaijanês (Latim), Bagheli, Basco, Bielorusso (Cirílico), Bielorusso (Latim), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bósnio (Latim), Brajbha, Bretão, Búlgaro, Bundeli, Buryat (Cirílico), Catalão, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinês (Simplificado), Chinês (Tradicional), Dialeto da Cornualha, Corso, Crimean Tatar (Latim), Croata, Checo, Dinamarquês, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Neerlandês, Inglês, Erzya (Cirílico), Estónio, Feroês, Fijiaon, Filipino, Finlandês, Francês, Friuliano, Gagauz (Latim), Galego, Alemão, Gilbertese, Gondi (Devanagiri), Gronelandês, Gurung (Devanagiri), Crioulo Haitiano, Halbi (Devanagiri), Hani, Haryanvi, Havaiano, Hindi, Hmong Daw (Latim), Ho(Devanagiri), Húngaro, Islandês, Sami – Inari, Indonésio, Interlíngua, Inuktitut (Latim), Irlandês, Italiano, Japonês, Jaunsari (Devanagiri), Javanês, Kabuverdianu, Kachin (Latim), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cirílico), Kara-Kalpak (Latim), Kashubian, Cazaquistanês (Cirílico), Cazaquistanês (Latim), Khaling, Khasi, Quiché, Coreano, Korku, Koryak, Kosraean, Kumyk (Cirílico), Curdo (Árabe), Curdo (Latim), Kurukh (Devanagiri), Kirguize (Cirílico), Lakota, Latim, Lituano, Baixo Sorábio, Sami – Lule, Luxemburguês, Mahasu Pahari (Devanagiri), Malaio (Latim), Maltês, Malto (Devanagiri), Manx, Maori, Marati, Mongol (Cirílico), Montenegrino (Cirílico), Montenegrino (Latim), Napolitano, Nepalês, Niuean, Nogay, Sami – Norte (Latim), Norueguês, Ocitano, Ossetiano, Pastó, Persia, Polaco, Português, Punjabi (Árabe), Ripuarian, Romeno, Romanesco, Russo, Sadri (Devanagiri), Samoano (Latim), Sânscrito (Devanagari), Santali (Devanagiri), Scots, Gaélico Escocês, Sérvio (Latim), Sherpa (Devanagiri), Sirmauri (Devanagiri), Sami – Skolt, Eslovaco, Esloveno, Somali (Árabe), Sami – Sul, Espanhol, Suaíli (Latim), Sueco, Tajique (Cirílico), Tatar (Latim), Tétum, Thangmi, Tonga, Turco, Turcomeno (Latim), Tuvan, Alto Sorábio, Urdu, Uigur (Árabe), Usbeque (Árabe), Usbeque (Cirílico), Usbeque (Latim), Volapük, Walser, Galês, Frísico Ocidental, Iucatego, Zhuang, Zulu
- Idioma para o texto escrito à mão: Inglês, Chinês (Simplificado), Francês, Alemão, Italiano, Japonês, Coreano, Português, Espanhol
-
Formato:
- JPG
- PNG
- BMP
- Tamanho: 20 MB no máximo
- Para documentos PDF, apenas as primeiras 2,000 páginas são processadas.
Saída do modelo
Se for detetado um documento, o modelo de reconhecimento de texto apresenta as seguintes informações:
- Resultados: uma lista de linhas extraídas do texto de entrada.
- Texto: cadeias que contêm a linha de texto detetada.
- BoundingBox: quatro valores que representam a caixa delimitadora, descrita utilizando as posições superior e esquerda, juntamente com sua largura e altura.
Limites
Ação | Limite | Período de renovação |
---|---|---|
Chamadas de reconhecimento de texto (por ambiente) | 480 | 60 segundos |