Suporte de linguagem para o Azure AI Vision
Alguns recursos do Azure AI Vision oferecem suporte a vários idiomas; quaisquer recursos não mencionados aqui suportam apenas o inglês.
Reconhecimento ótico de carateres (OCR)
A API de leitura do Azure AI Vision dá suporte a muitos idiomas. A Read
API pode extrair texto de imagens e documentos com idiomas mistos, inclusive da mesma linha de texto, sem exigir um parâmetro de idioma. Consulte Como especificar o Read
modelo para usar os novos idiomas.
Nota
Código linguístico opcional
Read
Os modelos universais baseados em aprendizagem profunda do OCR extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma. Não forneça o código do idioma como parâmetro, a menos que tenha certeza sobre o idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode retornar texto incompleto e incorreto.
Texto manuscrito
A tabela a seguir lista os idiomas suportados por OCR para texto manuscrito pelo modelo GA mais recente Read
.
Idioma | Código da língua (opcional) | Idioma | Código da língua (opcional) |
---|---|---|---|
Inglês | en |
Japonês | ja |
Chineses (Simplificado) | zh-Hans |
Coreano | ko |
Francês | fr |
Português | pt |
Alemão | de |
Espanhol | es |
Italiano | it |
Imprimir texto
A tabela a seguir lista os idiomas suportados por OCR para imprimir texto pelo modelo GA mais recente Read
.
Idioma | Código (opcional) | Idioma | Código (opcional) |
---|---|---|---|
Afrikaans | af |
Khasi | kha |
Albanês | sq |
K'iche» | quc |
Angika (Devanagiri) | anp |
Coreano | ko |
Árabe | ar |
Korku | kfq |
Asturiano | ast |
Koryak | kpy |
Awadhi-Hindi (Devanagiri) | awa |
Kosraean | kos |
Azerbaijão (Latim) | az |
Kumyk (cirílico) | kum |
Bagheli | bfy |
Curdo (árabe) | ku-arab |
Basco | eu |
Curdo (latim) | ku-latn |
Bielorrusso (cirílico) | be , be-cyrl |
Kurukh (Devanagiri) | kru |
Bielorrusso (Latim) | be , be-latn |
Quirguistão (cirílico) | ky |
Bhojpuri-Hindi (Devanagiri) | bho |
Lakota | lkt |
Bislama | bi |
Latim | la |
Bodo (Devanagiri) | brx |
Lituano | lt |
Bósnio (Latim) | bs |
Baixo Sorbian | dsb |
Brajbha | bra |
Lule Sami | smj |
Bretão | br |
Luxemburguês | lb |
Búlgaro | bg |
Mahasu Pahari (Devanagiri) | bfz |
Bundeli | bns |
Malaio (Latim) | ms |
Buryat (cirílico) | bua |
Maltês | mt |
Catalão | ca |
Malto (Devanagiri) | kmj |
Cebuano | ceb |
Manx | gv |
Chamling | rab |
Maori | mi |
Chamorro | ch |
Marata | mr |
Chhattisgarhi (Devanagiri) | hne |
Mongol (cirílico) | mn |
Chineses (Simplificado) | zh-Hans |
Montenegrino (cirílico) | cnr-cyrl |
Chinês (Tradicional) | zh-Hant |
Montenegrino (Latim) | cnr-latn |
Cornualha | kw |
Napolitano | nap |
Córsega | co |
Nepalês | ne |
Tártaro da Crimeia (latim) | crh |
Niuean | niu |
Croata | hr |
Nogay | nog |
Checo | cs |
Sami do Norte (Latim) | sme |
Dinamarquês | da |
Norueguês | no |
Dari | prs |
Occitano | oc |
Dhimal (Devanagiri) | dhi |
Ossético | os |
Dogri (Devanagiri) | doi |
Pashto | ps |
Neerlandês | nl |
Persa | fa |
Inglês | en |
Polaco | pl |
Erzya (cirílico) | myv |
Português | pt |
Estónio | et |
Punjabi (árabe) | pa |
Faroense | fo |
Ripuariano | ksh |
Fijiano | fj |
Romeno | ro |
Filipino | fil |
Romanche | rm |
Finlandês | fi |
Russo | ru |
Francês | fr |
Sadri (Devanagiri) | sck |
Friuliano | fur |
Samoa (Latim) | sm |
Gagauz (latim) | gag |
Sânscrito (Devanagari) | sa |
Galego | gl |
Santali(Devanagiri) | sat |
Alemão | de |
Escoceses | sco |
Gilbertese | gil |
Gaélico escocês | gd |
Gondi (Devanagiri) | gon |
Sérvio (Latim) | sr , sr-latn |
Gronelândia | kl |
Sherpa (Devanagiri) | xsr |
Gurung (Devanagiri) | gvr |
Sirmauri (Devanagiri) | srx |
Crioulo haitiano | ht |
Skolt Sami | sms |
Halbi (Devanagiri) | hlb |
Eslovaco | sk |
Hani | hni |
Esloveno | sl |
Haryanvi | bgc |
Somali (árabe) | so |
Havaiano | haw |
Sami Meridional | sma |
Hindi | hi |
Espanhol | es |
Hmong Daw (Latim) | mww |
Swahili (latim) | sw |
Ho(Devanagiri) | hoc |
Sueco | sv |
Húngaro | hu |
Tajique (cirílico) | tg |
Islandês | is |
Tártaro (Latim) | tt |
Inari Sami | smn |
Tétum | tet |
Indonésio | id |
Thangmi | thf |
Interlíngua | ia |
Tonga | to |
Inuktitut (latim) | iu |
Turco | tr |
Irlandês | ga |
Turquemeno (latim) | tk |
Italiano | it |
Tuvan | tyv |
Japonês | ja |
Alto Sorábio | hsb |
Jaunsari (Devanagiri) | Jns |
Urdu | ur |
Javanês | jv |
Uigur (árabe) | ug |
Kabuverdianu | kea |
Uzbeque (árabe) | uz-arab |
Kachin (Latim) | kac |
Usbeque (Cirílico) | uz-cyrl |
Kangri (Devanagiri) | xnr |
Uzbeque (Latim) | uz |
Karachay-Balkar | krc |
Volapük | vo |
Kara-Kalpak (cirílico) | kaa-cyrl |
Walser | wae |
Kara-Kalpak (Latim) | kaa |
Galês | cy |
Kashubian | csb |
Frísio Ocidental | fy |
Cazaque (cirílico) | kk-cyrl |
Iucatego | yua |
Cazaque (Latim) | kk-latn |
Zhuang | za |
Khaling | klr |
Zulu | zu |
Análise de Imagem
Alguns recursos da API Analyze - Image podem retornar resultados em outros idiomas, especificados com o language
parâmetro query. Outros recursos retornam resultados em inglês, independentemente do idioma especificado, e outros lançam uma exceção para idiomas sem suporte. Os recursos são especificados com os visualFeatures
parâmetros e details
consulta, consulte Visão geral para obter uma lista de todas as ações que você pode fazer com a API Analisar - Imagem ou siga o guia de instruções para experimentá-las.
Linguagem | Código de idioma | Categorias | Etiquetas | Description | Adulto, Marcas, Cor, Rostos, ImageType, Objetos | Celebridades, Pontos de referência | Legendas, legendas densas |
---|---|---|---|---|---|---|---|
Árabe | ar |
✅ | |||||
Azerbaijanês | az |
✅ | |||||
Búlgaro | bg |
✅ | |||||
Bósnio Latino | bs |
✅ | |||||
Catalão | ca |
✅ | |||||
Checo | cs |
✅ | |||||
Galês | cy |
✅ | |||||
Dinamarquês | da |
✅ | |||||
Alemão | de |
✅ | |||||
Grego | el |
✅ | |||||
Inglês | en |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Espanhol | es |
✅ | ✅ | ✅ | ✅ | ||
Estónio | et |
✅ | |||||
Basco | eu |
✅ | |||||
Finlandês | fi |
✅ | |||||
Francês | fr |
✅ | |||||
Irlandês | ga |
✅ | |||||
Galego | gl |
✅ | |||||
Hebraico | he |
✅ | |||||
Hindi | hi |
✅ | |||||
Croata | hr |
✅ | |||||
Húngaro | hu |
✅ | |||||
Indonésio | id |
✅ | |||||
Italiano | it |
✅ | |||||
Japonês | ja |
✅ | ✅ | ✅ | ✅ | ||
Cazaque | kk |
✅ | |||||
Coreano | ko |
✅ | |||||
Lituano | lt |
✅ | |||||
Letão | lv |
✅ | |||||
Macedónio | mk |
✅ | |||||
Malaio Malásia | ms |
✅ | |||||
Norueguês (Bokmal) | nb |
✅ | |||||
Neerlandês | nl |
✅ | |||||
Polaco | pl |
✅ | |||||
Dari | prs |
✅ | |||||
Português (Brasil) | pt-BR |
✅ | |||||
Português (Portugal) | pt |
✅ | ✅ | ✅ | ✅ | ||
Português (Portugal) | pt-PT |
✅ | |||||
Romeno | ro |
✅ | |||||
Russo | ru |
✅ | |||||
Eslovaco | sk |
✅ | |||||
Esloveno | sl |
✅ | |||||
Sérvio - Cirílico RS | sr-Cryl |
✅ | |||||
Sérvio - Latino RS | sr-Latn |
✅ | |||||
Sueco | sv |
✅ | |||||
Tailandês | th |
✅ | |||||
Turco | tr |
✅ | |||||
Ucraniano | uk |
✅ | |||||
Vietnamita | vi |
✅ | |||||
Chineses (Simplificado) | zh |
✅ | ✅ | ✅ | ✅ | ||
Chineses (Simplificado) | zh-Hans |
✅ | |||||
Chinês (Tradicional) | zh-Hant |
✅ |
Incorporações multimodais
O mais recente modelo de incorporação multimodal suporta pesquisa vetorial em muitos idiomas. O modelo original suporta apenas inglês. As imagens vetorizadas no modelo somente em inglês não são compatíveis com pesquisas de texto no modelo multilíngue.
Linguagem | Código de idioma | 2023-04-15 modelo |
2022-04-11 modelo |
---|---|---|---|
Akrikaans | af |
✅ | |
Amárico | am |
✅ | |
Árabe | ar |
✅ | |
Arménio | hy |
✅ | |
Assamês | as |
✅ | |
Asturiano | ast |
✅ | |
Azerbaijanês | az |
✅ | |
Bielorrusso | be |
✅ | |
Bengalês | bn |
✅ | |
Bósnio | bs |
✅ | |
Búlgaro | bg |
✅ | |
Birmanês | my |
✅ | |
Catalão | ca |
✅ | |
Cebuano | ceb |
✅ | |
Simpl chinês | zho |
✅ | |
Trad chinês | zho |
✅ | |
Croata | hr |
✅ | |
Checo | cs |
✅ | |
Dinamarquês | da |
✅ | |
Neerlandês | nl |
✅ | |
Português | en |
✅ | ✅ |
Estónio | et |
✅ | |
Filipino (Tagalog) | tl |
✅ | |
Finlandês | fi |
✅ | |
Francês | fr |
✅ | |
Fulá | ff |
✅ | |
Galego | gl |
✅ | |
Ganda | lg |
✅ | |
Georgiano | ka |
✅ | |
Alemão | de |
✅ | |
Grego | el |
✅ | |
Guzerate | gu |
✅ | |
Hausa | ha |
✅ | |
Hebraico | he |
✅ | |
Hindi | hi |
✅ | |
Húngaro | hu |
✅ | |
Islandês | is |
✅ | |
Igbo | ig |
✅ | |
Indonésio | id |
✅ | |
Irlandês | ga |
✅ | |
Italiano | it |
✅ | |
Japonês | ja |
✅ | |
Javanês | jv |
✅ | |
Kabuverdianu | kea |
✅ | |
Kamba | kam |
✅ | |
Canarês | kn |
✅ | |
Cazaque | kk |
✅ | |
Khmer | km |
✅ | |
Coreano | ko |
✅ | |
Quirguize | ky |
✅ | |
Laos | lo |
✅ | |
Letão | lv |
✅ | |
Lingala | ln |
✅ | |
Lituano | lt |
✅ | |
Luo | luo |
✅ | |
Luxemburguês | lb |
✅ | |
Macedónio | mk |
✅ | |
Malaio | ms |
✅ | |
Malaiala | ml |
✅ | |
Maltês | mt |
✅ | |
Maori | mi |
✅ | |
Marata | mr |
✅ | |
Mongol | mn |
✅ | |
Nepalês | ne |
✅ | |
Sotho do Norte | ns |
✅ | |
Norueguês | no |
✅ | |
Nyanja | ny |
✅ | |
Occitano | oc |
✅ | |
Odia | or |
✅ | |
Oromo | om |
✅ | |
Pashto | ps |
✅ | |
Persa | fa |
✅ | |
Polaco | pl |
✅ | |
Português (Brasil) | pt |
✅ | |
Punjabi | pa |
✅ | |
Romeno | ro |
✅ | |
Russo | ru |
✅ | |
Sérvio | sr |
✅ | |
Shona | sn |
✅ | |
Sindhi | sd |
✅ | |
Eslovaco | sk |
✅ | |
Esloveno | sl |
✅ | |
Somali | so |
✅ | |
Sorani Curdo | ku |
✅ | |
Espanhol (Latino-Americano) | es |
✅ | |
Suaíli | sw |
✅ | |
Sueco | sv |
✅ | |
Tajique | tg |
✅ | |
Tâmil | ta |
✅ | |
Telugu | te |
✅ | |
Tailandês | th |
✅ | |
Turco | tr |
✅ | |
Ucraniano | uk |
✅ | |
Umbundu | umb |
✅ | |
Urdu | ur |
✅ | |
Usbeque | uz |
✅ | |
Vietnamita | vi |
✅ | |
Galês | cy |
✅ | |
Wolof | wo |
✅ | |
Xhosa | xh |
✅ | |
Iorubá | yo |
✅ | |
Zulu | zu |
✅ |