Podpora jazyka Pro analýzu mínění a dolování názorů
V tomto článku se dozvíte, které jazyky jsou podporovány analýzou mínění a dolováním názorů. Cloudové rozhraní API i kontejnery Dockeru podporují stejné jazyky.
Podpora jazyka Sentiment Analysis
Celkový počet podporovaných kódů jazyků: 94
Jazyk | Kód jazyka | Notes |
---|---|---|
Afrikánština | af |
|
Albánština | sq |
|
Amharština | am |
|
Arabština | ar |
|
Arménština | hy |
|
Ásámština | as |
|
Ázerbájdžánština | az |
|
Baskičtina | eu |
|
Běloruský (nový) | be |
|
Bengálština | bn |
|
Bosenština | bs |
|
Breton (nový) | br |
|
Bulharština | bg |
|
Barmština | my |
|
Katalánština | ca |
|
Čínština (zjednodušená) | zh-hans |
zh přijato také |
Čínština (tradiční) | zh-hant |
|
Chorvatština | hr |
|
Čeština | cs |
|
Dánština | da |
|
Nizozemština | nl |
|
Angličtina | en |
|
Esperanto (nové) | eo |
|
Estonština | et |
|
Filipino | fil |
|
Finština | fi |
|
Francouzština | fr |
|
Galicijština | gl |
|
Gruzínština | ka |
|
Němčina | de |
|
Řečtina | el |
|
Gudžarátština | gu |
|
Hausa (nové) | ha |
|
Hebrejština | he |
|
Hindština | hi |
|
Maďarština | hu |
|
Indonéština | id |
|
Irština | ga |
|
Italština | it |
|
Japonština | ja |
|
Javanese (nový) | jv |
|
Kannadština | kn |
|
Kazaština | kk |
|
Khmerština | km |
|
Korejština | ko |
|
Kurština (Kurmanji) | ku |
|
Kyrgyzština | ky |
|
Laoština | lo |
|
Latinka (nová) | la |
|
Lotyština | lv |
|
Litevština | lt |
|
Makedonština | mk |
|
Malgaština | mg |
|
Malajština | ms |
|
Malajalámština | ml |
|
Maráthština | mr |
|
Mongolština | mn |
|
Nepálština | ne |
|
Norština | no |
|
Udijština | or |
|
Oromo (nový) | om |
|
Pashto | ps |
|
Perština | fa |
|
Polština | pl |
|
Portugalština (Portugalsko) | pt-PT |
pt přijato také |
Portugalština (Brazílie) | pt-BR |
|
Paňdžábština | pa |
|
Rumunština | ro |
|
Ruština | ru |
|
Sanskrit (nový) | sa |
|
Skotská Gaelic (nová) | gd |
|
Srbština | sr |
|
Sindhi (nový) | sd |
|
Sinhala (nový) | si |
|
Slovenština | sk |
|
Slovinština | sl |
|
Somálijsko | so |
|
Španělština | es |
|
Sundanese (nový) | su |
|
Svahilština | sw |
|
Švédština | sv |
|
Tamilština | ta |
|
Telugština | te |
|
Thajština | th |
|
Turečtina | tr |
|
Ukrajinština | uk |
|
Urdština | ur |
|
Ujgurština | ug |
|
Uzbečtina | uz |
|
Vietnamština | vi |
|
Velština | cy |
|
Západní Frisian (nový) | fy |
|
Xhosa (nový) | xh |
|
Yiddish (nový) | yi |
Podpora jazyka dolování názorů
Celkový počet podporovaných kódů jazyků: 94
Jazyk | Kód jazyka | Notes |
---|---|---|
Afrikaans (nový) | af |
|
Albánská (nová) | sq |
|
Amharic (nový) | am |
|
Arabština | ar |
|
Arménská (nová) | hy |
|
Assamese (nový) | as |
|
Ázerbájdžánština (nové) | az |
|
Baskičtina (nová) | eu |
|
Běloruský (nový) | be |
|
Bengálština | bn |
|
Bosenština (nový) | bs |
|
Breton (nový) | br |
|
Bulharština (nový) | bg |
|
Burmština (nový) | my |
|
Katalánština (nová) | ca |
|
Čínština (zjednodušená) | zh-hans |
zh přijato také |
Čínština (tradiční) (nová) | zh-hant |
|
Chorvatština (nové) | hr |
|
Čeština (nová) | cs |
|
Dánština | da |
|
Nizozemština | nl |
|
Angličtina | en |
|
Esperanto (nové) | eo |
|
Estonština (nové) | et |
|
Filipínština (nové) | fil |
|
Finština | fi |
|
Francouzština | fr |
|
Galicijština (nový) | gl |
|
Georgian (new) | ka |
|
Němčina | de |
|
Řečtina | el |
|
Gujarati (nové) | gu |
|
Hausa (nové) | ha |
|
Hebrejština (nová) | he |
|
Hindština | hi |
|
Maďarština | hu |
|
Indonéština | id |
|
Irská (nová) | ga |
|
Italština | it |
|
Japonština | ja |
|
Javanese (nový) | jv |
|
Kannada (nový) | kn |
|
Kazaština (nová) | kk |
|
Khmer (nový) | km |
|
Korejština | ko |
|
Kurština (Kurmanji) | ku |
|
Kyrgyz (nový) | ky |
|
Lao (nový) | lo |
|
Latinka (nová) | la |
|
Lotyština (nové) | lv |
|
Litevština (nové) | lt |
|
Makedonština (nový) | mk |
|
Malagasy (nové) | mg |
|
Malajá (nová) | ms |
|
Malajálam (nový) | ml |
|
Maráthština | mr |
|
Mongolština (nové) | mn |
|
Nepálština (nová) | ne |
|
Norština | no |
|
Odia (nový) | or |
|
Oromo (nový) | om |
|
Pashto (nový) | ps |
|
Perština (nová) | fa |
|
Polština | pl |
|
Portugalština (Portugalsko) | pt-PT |
pt přijato také |
Portugalština (Brazílie) | pt-BR |
|
Punjabi (nový) | pa |
|
Rumunština (nový) | ro |
|
Ruština | ru |
|
Sanskrit (nový) | sa |
|
Skotská Gaelic (nová) | gd |
|
Srbština (nový) | sr |
|
Sindhi (nový) | sd |
|
Sinhala (nový) | si |
|
Slovenština (nový) | sk |
|
Slovinština (nové) | sl |
|
Somali (nové) | so |
|
Španělština | es |
|
Sundanese (nový) | su |
|
Swahili (nový) | sw |
|
Švédština | sv |
|
Tamilština | ta |
|
Telugština | te |
|
Thajština (nové) | th |
|
Turečtina | tr |
|
Ukrajinština (nový) | uk |
|
Urdu (nový) | ur |
|
Uyghur (nový) | ug |
|
Uzbečtina (nový) | uz |
|
Vietnamština (nové) | vi |
|
Welsh (nový) | cy |
|
Západní Frisian (nový) | fy |
|
Xhosa (nový) | xh |
|
Yiddish (nový) | yi |
Vícejazyčná možnost (pouze analýza vlastního mínění)
Pomocí analýzy vlastního mínění můžete vytrénovat model v jednom jazyce a použít ke klasifikaci dokumentů v jiném jazyce. Tato funkce je užitečná, protože pomáhá ušetřit čas a úsilí. Místo vytváření samostatných projektů pro každý jazyk můžete zpracovávat vícejazyčnou datovou sadu v jednom projektu. Vaše datová sada nemusí být úplně ve stejném jazyce, ale při vytváření nebo pozdějším vytváření projektu byste měli povolit vícejazyčnou možnost pro váš projekt. Pokud si během procesu vyhodnocení všimnete, že váš model funguje špatně v určitých jazycích, zvažte přidání dalších dat v těchto jazycích do trénovací sady.
Projekt můžete vytrénovat zcela s anglickými dokumenty a dotazovat se na něj v: francouzštině, němčině, mandarínštině, japonštině, korejštině a dalších. Analýza vlastního mínění usnadňuje škálování projektů do více jazyků pomocí vícejazyčné technologie pro trénování modelů.
Kdykoli zjistíte, že konkrétní jazyk nefunguje ani jiné jazyky, můžete do projektu přidat další dokumenty pro daný jazyk.
Neočekává se, že byste přidali stejný počet dokumentů pro každý jazyk. Většinu projektu byste měli sestavit v jednom jazyce a přidat jenom několik dokumentů v jazycích, které sledujete, nefungují dobře. Pokud vytvoříte projekt, který je primárně v angličtině, a začnete ho testovat ve francouzštině, němčině a španělštině, můžete vidět, že němčina nefunguje stejně jako ostatní dva jazyky. V takovém případě zvažte přidání 5 % původních anglických dokumentů v němčině, vytrénování nového modelu a testování v němčině znovu. Měli byste vidět lepší výsledky pro německé dotazy. Čím více dokumentů s popiskem přidáte, tím pravděpodobnější bude, že výsledky budou lepší.
Když přidáváte data v jiném jazyce, neměli byste očekávat, že budou mít negativní vliv na jiné jazyky.