Podpora jazyků ve službě Azure AI Video Indexer
Tento článek vysvětluje jazykové možnosti Video Indexeru a poskytuje seznam jazykových podpory pro každý z nich. Zahrnuje podporu jazyků pro funkce Video Indexeru, překlad, identifikaci jazyka, přizpůsobení a nastavení jazyka webu Video Indexer.
Podporované jazyky na scénář
Tato část vysvětluje možnosti jazyka Video Indexeru a obsahuje tabulku podporovaných jazyků pro každý z nich.
Důležité
Všechny uvedené jazyky podporují překlad při indexování prostřednictvím rozhraní API.
Vysvětlení sloupců
Podporovaný zdrojový jazyk – jazyk mluvený v mediálním souboru podporuje přepis, překlad a vyhledávání.
Identifikace jazyka – Jestli je možné jazyk automaticky rozpoznat službou Video Indexer, když se k indexování používá identifikace jazyka. Další informace najdete v tématu Použití Azure AI Video Indexeru k automatické identifikaci mluvených jazyků a části Identifikace jazyka.
Přizpůsobení (jazykový model) – určuje, jestli se jazyk dá použít při přizpůsobení jazykových modelů ve Službě Video Indexer. Další informace najdete v tématu Přizpůsobení jazykového modelu v Azure AI Video Indexeru.
Výslovnost (jazykový model) – určuje, jestli se dá jazyk použít k vytvoření datové sady výslovnosti v rámci vlastního modelu řeči. Další informace najdete v tématu Přizpůsobení modelu řeči pomocí Azure AI Video Indexeru.
Překlad webů – určuje, jestli je jazyk podporovaný pro překlad při použití webu Azure AI Video Indexer. V rozevírací nabídce jazyka vyberte přeložený jazyk.
Následující přehledy jsou přeloženy:
- Přepis
- Klíčová slova
- Témata
- Popisky
- Vzory snímků (k hebrejštině až k hebrejštině)
Při použití překladu se zobrazí všechny ostatní přehledy v angličtině.
Jazyk webu – určuje, jestli je možné jazyk vybrat pro použití na webu Azure AI Video Indexer. Vyberte ikonu Nastavení a pak vyberte jazyk v rozevíracím seznamu Nastavení jazyka.
Jazyk | Kód | Podporovaný zdrojový jazyk |
Jazyk identifikace |
Přizpůsobení (jazykový model) |
Výslovnost (jazykový model) |
Internetová stránka Překlad |
Internetová stránka Jazyk |
---|---|---|---|---|---|---|---|
Afrikánština | af-ZA | ✔ | |||||
Arabština (Izrael) | ar-IL | ✔ | ✔ | ||||
Arabština (Irák) | ar-IQ | ✔ | ✔ | ||||
Arabština (Jordánsko) | ar-JO | ✔ | ✔ | ✔ | |||
Arabština (Kuvajt) | ar-KW | ✔ | ✔ | ✔ | |||
Arabština (Libanon) | ar-LB | ✔ | ✔ | ||||
Arabština (Omán) | ar-OM | ✔ | ✔ | ✔ | |||
Arabština (Palestinská autorita) | ar-PS | ✔ | ✔ | ||||
Arabština (Katar) | ar-QA | ✔ | ✔ | ✔ | |||
Arabština (Saúdská Arábie) | ar-SA | ✔ | ✔ | ✔ | |||
Arabština (Spojené arabské emiráty) | ar-AE | ✔ | ✔ | ✔ | |||
Arabština Egypt | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Arabština Moderní standard (Arabština) | ar-BH | ✔ | ✔ | ✔ | |||
Arabská arabská arabská republika | ar-SY | ✔ | ✔ | ✔ | |||
Arménština | hy-AM | ✔ | |||||
Bangla | bn-BD | ✔ | |||||
Bosenština | bs-Latn | ✔ | |||||
Bulharština | bg-BG | ✔ | ✔ | ✔ | |||
Katalánština | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Čínština (tradiční kantonština) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Čínština (zjednodušená) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Čínština (zjednodušená) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Čínština (tradiční) | zh-Hant | ✔ | |||||
Chorvatština | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Čeština | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Dánština | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Nizozemština | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Angličtina Austrálie | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Angličtina Velká Británie | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Angličtina USA | cs | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estonština | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fidžijština | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finština | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francouzština | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francouzština (Kanada) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Němčina | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Řečtina | el-GR | ✔ | ✔ | ✔ | |||
Gudžarátština | gu-IN | ✔ | ✔ | ✔ | |||
Haitský | fr-HT | ✔ | |||||
Hebrejština | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindština | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Maďarština | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Islandština | is-IS | ✔ | |||||
Indonéština | id-ID | ✔ | ✔ | ✔ | |||
Irština | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italština | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonština | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannadština | kn-IN | ✔ | ✔ | ||||
Svahilština | sw-KE | ✔ | |||||
Korejština | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lotyština | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Litevština | lt-LT | ✔ | ✔ | ✔ | |||
Malgaština | mg-MG | ✔ | |||||
Malajština | ms-MY | ✔ | ✔ | ||||
Malajalámština | ml-IN | ✔ | ✔ | ||||
Maltština | mt-MT | ✔ | |||||
Norština | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Perština | fa-IR | ✔ | ✔ | ✔ | |||
Polština | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugalština | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugalština (Portugalsko) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Rumunština | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ruština | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samojština | en-WS | ||||||
Srbština (cyrilice) | sr-Cyrl-RS | ✔ | |||||
Srbština (latinka) | sr-Latn-RS | ✔ | |||||
Slovenština | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Slovinština | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Španělština | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Španělština (Mexiko) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Švédština | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamilština | ta-IN | ✔ | ✔ | ✔ | |||
Telugština | TE-IN | ✔ | ✔ | ||||
Thajština | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tongánština | to-TO | ✔ | |||||
Turečtina | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ukrajinština | uk-UA | ✔ | ✔ | ✔ | |||
Urdština | your-PK | ✔ | |||||
Vietnamština | vi-VN | ✔ | ✔ | ✔ |
Získání podporovaných jazyků prostřednictvím rozhraní API
K získání úplného seznamu podporovaných jazyků pro každou oblast použijte volání rozhraní API Get Supported Languages. Další informace naleznete v tématu Získání podporovaných jazyků.
Rozhraní API vrátí seznam podporovaných jazyků s následujícími hodnotami:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Podporovaný zdrojový jazyk:
Pokud
isSourceLanguage
je false, jazyk je podporován pouze pro překlad. PokudisSourceLanguage
je pravda, jazyk se podporuje jako zdroj pro přepis, překlad a vyhledávání.Identifikace jazyka (automatická detekce):
Pokud
isAutoDetect
je pravda, jazyk se podporuje pro identifikaci jazyka (LID) a vícejazyčnou identifikaci (MLID).
Identifikace jazyka
Při nahrávání multimediálního souboru do Video Indexeru můžete určit zdrojový jazyk mediálního souboru. Pokud indexujete soubor prostřednictvím webu Video Indexer, můžete to udělat výběrem jazyka během nahrávání souboru. Pokud úlohu indexování odesíláte prostřednictvím rozhraní API, provádí se pomocí parametru jazyka. Vybraný jazyk se pak použije k vygenerování přepisu souboru.
Pokud si nejste jistí zdrojovým jazykem mediálního souboru nebo může obsahovat více jazyků, Video Indexer dokáže rozpoznat mluvené jazyky. Pokud pro zdrojový jazyk mediálního souboru vyberete buď automatické rozpoznávání jednoho jazyka (LID), nebo vícejazyčného jazyka (MLID), použije se zjištěný jazyk nebo jazyky k přepisu mediálního souboru. Další informace o LID a MLID najdete v tématu Automatické identifikaci mluvených jazyků pomocí Azure AI Video Indexeru, viz Automatická identifikace mluveného jazyka pomocí modelu identifikace jazyka a automatická identifikace a přepis vícejazyčného obsahu.
Při indexování mediálního souboru pro LID i MLID je povolen limit 10 jazyků. Níže jsou uvedené 9 výchozích jazyků identifikace jazyka (LID) a identifikace multijazyčného jazyka (MILD):
- Němčina (de-DE)
- Angličtina USA (en-US)
- Španělština (es-ES)
- Francouzština (fr-FR)
- Italština (it-IT)
- Japonština (ja-JP)
- Portugalština (pt-BR)
- Ruština (ru-RU)
- Čínština (zjednodušená) (zh-Hans)
Změna seznamu výchozích jazyků
Pokud potřebujete použít jazyky k identifikaci, které se ve výchozím nastavení nepoužívají, můžete seznam přizpůsobit libovolnému 10 jazykům, které podporují přizpůsobení prostřednictvím webu nebo rozhraní API:
Změna seznamu pomocí webu
V části Přizpůsobení modelu vyberte kartu ID jazyka. Seznam jazyků je specifický pro účet Video Indexeru, který používáte, a pro přihlášeného uživatele. Výchozí seznam jazyků se ukládá na uživatele v místním zařízení, na zařízení a v prohlížeči. Každý uživatel tak může nakonfigurovat vlastní výchozí seznam identifikovaných jazyků.
Pomocí příkazu Přidat jazyk můžete vyhledávat a přidávat další jazyky. Pokud už je vybráno 10 jazyků, musíte před přidáním nového odebrat některý z existujících zjištěných jazyků.
Změna seznamu pomocí rozhraní API
Když nahrajete soubor, jazykový model Video Indexeru ve výchozím nastavení odkazuje na 9 jazyků. Pokud existuje shoda, model vygeneruje přepis souboru s detekovaným jazykem.
K určení multi
parametrů jazyka (MLID) nebo auto
(LID) použijte parametr jazyka. Pomocí parametru customLanguages
můžete zadat až 10 jazyků. (Parametr se používá pouze v případech, kdy je parametr jazyka nastavený na multi
hodnotu nebo auto
.) Další informace o používání rozhraní API najdete v tématu Použití rozhraní API služby Azure AI Video Indexer.