Suporte a idiomas: modelos personalizados
Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1
Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)
Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados independentes podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:
Classificador personalizado
Idioma—Código de localidade | Predefinido |
---|---|
Inglês (Estados Unidos)—en-US | Inglês (Estados Unidos)—en-US |
Idioma | Código (opcional) |
---|---|
Afrikaans | af |
Albanês | sq |
Árabe | ar |
Búlgaro | bg |
Chinês (Han (variante simplificada)) | zh-Hans |
Chinês (Han (variante tradicional)) | zh-Hant |
Croata | hr |
Checo | cs |
Dinamarquês | da |
Neerlandês | nl |
Estónio | et |
Finlandês | fi |
Francês | fr |
Alemão | de |
Hebraico | he |
Hindi | hi |
Húngaro | hu |
Indonésio | id |
Italiano | it |
Japonês | ja |
Coreano | ko |
Letão | lv |
Lituano | lt |
Macedónio | mk |
Marata | mr |
Grego moderno (1453-) | el |
Nepalês (macrolinguagem) | ne |
Norueguês | no |
Panjabi | pa |
Persa | fa |
Polaco | pl |
Português | pt |
Romeno | rm |
Russo | ru |
Eslovaco | sk |
Esloveno | sl |
Somali (árabe) | so |
Somali (Latim) | so-latn |
Espanhol | es |
Swahili (macrolinguagem) | sw |
Sueco | sv |
Tâmil | ta |
Tailandês | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
Generativo personalizado
Generativo personalizado suporta apenas inglês en
Neural personalizado
A tabela a seguir lista os idiomas suportados para texto impresso.
Idioma | Código (opcional) |
---|---|
Afrikaans | af |
Albanês | sq |
Árabe | ar |
Búlgaro | bg |
Chineses (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Croata | hr |
Checo | cs |
Dinamarquês | da |
Neerlandês | nl |
Português | en |
Estónio | et |
Finlandês | fi |
Francês | fr |
Alemão | de |
Hebraico | he |
Hindi | hi |
Húngaro | hu |
Indonésio | id |
Italiano | it |
Japonês | ja |
Coreano | ko |
Letão | lv |
Lituano | lt |
Macedónio | mk |
Marata | mr |
Grego moderno (1453-) | el |
Nepalês (macrolinguagem) | ne |
Norueguês | no |
Panjabi | pa |
Persa | fa |
Polaco | pl |
Português | pt |
Romeno | rm |
Russo | ru |
Eslovaco | sk |
Esloveno | sl |
Somali (árabe) | so |
Somali (Latim) | so-latn |
Espanhol | es |
Swahili (macrolinguagem) | sw |
Sueco | sv |
Tâmil | ta |
Tailandês | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
Modelo personalizado
A tabela a seguir lista os idiomas suportados para texto impresso .
Idioma | Código (opcional) |
---|---|
Abaza | ABQ |
Abcásia | ab |
Chinês | ás |
Acoli | ach |
Adangme | Ada |
Adyghe | Ady |
Afar | AA |
Afrikaans | AF |
Akan | AK |
Albanês | sq |
Algonquin | ALQ |
Angika (Devanagari) | ANP |
Árabe | ar |
Asturiano | AST |
Asu (Tanzânia) | ASA |
Avaric | AV |
Awadhi-Hindi (Devanagari) | AWA |
Aymara | ay |
Azerbaijão (Latim) | AZ |
Máfia | KSF |
Bagheli | Bfy |
Bambara | BM |
Basquir | ba |
Basco | eu |
Bielorrusso (cirílico) | ser, be-cyrl |
Bielorrusso (Latim) | be, be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | BHO |
Bikol | Bik |
Bini | classe |
Bislama | bi |
Bodo (Devanagari) | BRX |
Bósnio (Latim) | BS |
Brajbha | Sutiã |
Bretão | br |
Búlgaro | bg |
Bundeli | BNS |
Buryat (cirílico) | Bua |
Catalão | ca |
Cebuano | CEB |
Chamling | Rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | HNE |
Chiga | CGG |
Chineses (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Choctaw | Cho |
Chukot | CKT |
Chuvash | CV |
Cornualha | kW |
Córsega | co |
Cree | CR |
Riacho | Mus |
Tártaro da Crimeia (latim) | CRH |
Croata | h |
Corvo | Cro |
Checo | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | PRS |
Dhimal (Devanagari) | DHI |
Dogri (Devanagari) | doi |
Duala | Dua |
Dungan | GND |
Neerlandês | nl |
Efik | EFI |
Português | in |
Erzya (cirílico) | MYV |
Estónio | et |
Faroense | fo |
Fijiano | FJ |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon | Fon |
Francês | fr |
Friuliano | peles |
Ga | GAA |
Gagauz (latim) | Mordaça |
Galego | gl |
Ganda | LG |
Gayo | gay |
Alemão | al |
Gilbertese | Gil |
Gondi (Devanagari) | vai |
Grego | el |
Gronelândia | KL |
Guarani | GN |
Gurung (Devanagari) | GVR |
Gusii | Guz |
Crioulo haitiano | HT |
Halbi (Devanagari) | HLB |
Hani | hni |
Haryanvi | BGC |
Havaiano | Haw |
Hebraico | he |
Herero | HZ |
Hiligaynon | Hil |
Hindi | hi |
Hmong Daw (Latim) | MWW |
Ho(Devanagiri) | HOC |
Húngaro | hu |
Iban | IBA |
Islandês | é |
Igbo | IG |
Iloko | OIT |
Inari Sami | SMN |
Indonésio | id |
Inguche | INH |
Interlíngua | ia |
Inuktitut (latim) | IU |
Irlandês | GA |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | JV |
Jola-Fonyi | Dyo |
Kabardiano | KBD |
Kabuverdianu | Kea |
Kachin (Latim) | Kac |
Kalenjin | KLN |
Kalmyk | xal |
Kangri (Devanagari) | XNR |
Kanuri | KR |
Karachay-Balkar | KRC |
Kara-Kalpak (cirílico) | Kaa-Cyrl |
Kara-Kalpak (Latim) | Kaa |
Kashubian | CSB |
Cazaque (cirílico) | kk-cyrl |
Cazaque (Latim) | kk-latn |
Khakas | KJH |
Khaling | KLR |
Khasi | Kha |
K'iche» | Quc |
Kikuyu | ki |
Kildin Sami | SJD |
Kinyarwanda | RW |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | KFQ |
Koryak | KPY |
Kosraean | Kós |
Kpelle | kpe |
Kuanyama | KJ |
Kumyk (cirílico) | Kum |
Curdo (árabe) | Ku-Árabe |
Curdo (latim) | Ku-Latn |
Kurukh (Devanagari) | Kru |
Quirguistão (cirílico) | KY |
Lak | LBE |
Lakota | LKT |
Idioma | Código (opcional) |
---|---|
Latim | la |
Letão | lv |
Lezghian | Lex |
Lingala | ln |
Lituano | lt |
Baixo Sorbian | DSB |
Lozi | loz |
Lule Sami | SMJ |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | Luy |
Macedónio | Mk |
Machame | JMC |
Madurese | louco |
Mahasu Pahari (Devanagari) | BFZ |
Makhuwa-Meetto | MGH |
Makonde | KDE |
Malgaxe | em mg |
Malaio (Latim) | ms |
Maltês | mt |
Malto (Devanagari) | KMJ |
Mandinka | MNK |
Manx | GV |
Maori | mi |
Mapudungun | ARN |
Marata | O Sr. |
Mari (Rússia) | CHM |
Masai | mas |
Mende (Serra Leoa) | homens |
Meru | Mer |
Meta» | MGO |
Minangkabau | min |
Mohawk | Moh |
Mongol (cirílico) | MN |
Mongondow | mog |
Montenegrino (cirílico) | CNR-CYRL |
Montenegrino (Latim) | CNR-LATN |
Morisyen | MFE |
Mundang | mua |
Nahuatl | Não |
Navajo | NV |
Ndonga | ng |
Napolitano | Sesta |
Nepalês | ne |
Ngomba | JGO |
Niuean | NIU |
Nogay | Nog |
Ndebele do Norte | nd |
Sami do Norte (Latim) | PME |
Norueguês | não |
Nyanja | Nova Iorque |
Nyankole | Nova Iorque |
Nzima | NZI |
Occitano | OC |
Ojibwa | JO |
Oromo | om |
Ossético | o |
Pampanga | Pam |
Pangasinan | pag |
Papiamento | Papanicolau |
Pashto | PS |
Pedi | NSO |
Persa | FA |
Polaco | pl |
Português | pt |
Punjabi (árabe) | PA |
Quechua | Qu |
Ripuariano | KSH |
Romeno | ro |
Romanche | RM |
Rundi | RN |
Russo | ru |
Rwa | RWK |
Sadri (Devanagari) | Sck |
Sakha | SAH |
Samburu | SAQ |
Samoa (Latim) | SM |
Sango | SG |
Idioma | Código (opcional) |
---|---|
Sangu (Gabão) | SNQ |
Sânscrito (Devanagari) | SA |
Santali(Devanagiri) | Sáb |
Escoceses | sco |
Gaélico escocês | GD |
Sena | ela |
Sérvio (Cirílico) | SR-CYRL |
Sérvio (Latim) | Sr, Sr-Latn |
Shambala | KSB |
Shona | sn |
Siksika | BLA |
Sirmauri (Devanagari) | SRX |
Skolt Sami | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | XOG |
Somali (árabe) | so |
Somali (Latim) | So-Latn |
Songhai | filho |
Ndebele do Sul | Nr |
Altai do Sul | Alt |
Sami Meridional | SMA |
Sotho do Sul | st |
Espanhol | es |
Sundanês | SU |
Swahili (latim) | sw |
Suazilândia | ss |
Sueco | sv |
Tabassaran | guia |
Tachelhit | Shi |
Taitiano | ty |
Taita | DAV |
Tajique (cirílico) | TG |
Tâmil | ta |
Tártaro (cirílico) | TT-CYRL |
Tártaro (Latim) | TT |
Teso | Téo |
Tétum | Tet |
Tailandês | th |
Thangmi | thf |
Tok Pisin | TPI |
Tonga | para |
Tsonga | TS |
Tswana | tn |
Turco | tr |
Turquemeno (latim) | TK |
Tuvan | TYV |
Udmurt | UDM |
Uigur (cirílico) | ug-cyrl |
Ucraniano | uk |
Alto Sorábio | HSB |
Urdu | o seu |
Uigur (árabe) | ug |
Uzbeque (árabe) | UZ-Árabe |
Usbeque (Cirílico) | UZ-CYRL |
Uzbeque (Latim) | UZ |
Vietnamita | vi |
Volapük | VO |
Vunjo | VUN |
Walser | Wae |
Galês | cy |
Frísio Ocidental | fy |
Wolof | wo |
Xhosa | xh |
Iucatego | Yua |
Zapoteca | zap |
Zarma | Dje |
Zhuang | za |
Zulu | zu |