Sprachunterstützung in Azure AI Video Indexer
In diesem Artikel werden die Sprachoptionen von Video Indexer erläutert und eine Liste der Sprachunterstützung für jeden bereitgestellt. Es enthält die Sprachenunterstützung für Video Indexer-Features, Übersetzung, Sprachidentifikation, Anpassung und die Spracheinstellungen der VideoIndexer-Website.
Unterstützte Sprachen pro Szenario
In diesem Abschnitt werden die Sprachoptionen für die Videoindexer erläutert und eine Tabelle der unterstützten Sprachen für die einzelnen Sprachen enthalten.
Wichtig
Alle aufgeführten Sprachen unterstützen übersetzungen beim Indizieren über die API.
Erläuterungen zu Spalten
Unterstützte Quellsprache – Die in der Mediendatei gesprochene Sprache , die für Transkription, Übersetzung und Suche unterstützt wird.
Sprachidentifikation – Gibt an, ob die Sprache automatisch von der Videoindexer erkannt werden kann, wenn die Sprachidentifikation für die Indizierung verwendet wird. Weitere Informationen finden Sie unter Verwenden von Azure AI Video Indexer, um gesprochene Sprachen und den Abschnitt "Sprachidentifikation " automatisch zu identifizieren.
Anpassung (Sprachmodell) – Gibt an, ob die Sprache beim Anpassen von Sprachmodellen im Videoindexer verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells in Azure AI Video Indexer.
Aussprache (Sprachmodell) – Gibt an, ob die Sprache zum Erstellen eines Aussprache-Datasets als Teil eines benutzerdefinierten Sprachmodells verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells mit azure AI Video Indexer.
Websiteübersetzung – Gibt an, ob die Sprache bei Verwendung der Azure AI Video Indexer-Website für die Übersetzung unterstützt wird. Wählen Sie die übersetzte Sprache im Dropdownmenü "Sprache" aus.
Die folgenden Erkenntnisse werden übersetzt:
- Textaufzeichnung
- Schlüsselwörter
- Themen
- Beschriftungen
- Framemuster (derzeit nur auf Hebräisch)
Alle anderen Erkenntnisse werden bei Verwendung der Übersetzung in Englisch angezeigt.
Websitesprache – Gibt an, ob die Sprache für die Verwendung auf der Azure AI Video Indexer-Website ausgewählt werden kann. Wählen Sie das Symbol "Einstellungen" und dann die Sprache im Dropdownmenü "Spracheinstellungen " aus.
Sprache | Code | Abgestützt Ausgangssprache |
Sprache Identifizierung |
Anpassung (Sprachmodell) |
Aussprache (Sprachmodell) |
Website Übersetzung |
Website Sprache |
---|---|---|---|---|---|---|---|
Afrikaans | af-ZA | ✔ | |||||
Arabisch (Israel) | ar-IL | ✔ | ✔ | ||||
Arabisch (Irak) | ar-IQ | ✔ | ✔ | ||||
Arabisch (Jordanien) | ar-JO | ✔ | ✔ | ✔ | |||
Arabisch (Kuwait) | ar-KW | ✔ | ✔ | ✔ | |||
Arabisch (Libanon) | ar-LB | ✔ | ✔ | ||||
Arabisch (Oman) | ar-OM | ✔ | ✔ | ✔ | |||
Arabisch (Palästinensische Autonomiebehörde) | ar-PS | ✔ | ✔ | ||||
Arabisch (Katar) | ar-QA | ✔ | ✔ | ✔ | |||
Arabisch (Saudi-Arabien) | ar-SA | ✔ | ✔ | ✔ | |||
Arabisch (Vereinigte Arabische Emirate) | ar-AE | ✔ | ✔ | ✔ | |||
Arabisch (Ägypten) | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Arabisch (modernes Hocharabisch, Bahrain) | ar-BH | ✔ | ✔ | ✔ | |||
Arabisch (Arabische Republik Syrien) | ar-SY | ✔ | ✔ | ✔ | |||
Armenisch | hy-AM | ✔ | |||||
Bengalisch | bn-BD | ✔ | |||||
Bosnisch | bs-Latn | ✔ | |||||
Bulgarisch | bg-BG | ✔ | ✔ | ✔ | |||
Katalanisch | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinesisch (Kantonesisch, traditionell) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinesisch (vereinfacht) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chinesisch (vereinfacht) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chinesisch (traditionell) | zh-Hant | ✔ | |||||
Kroatisch | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Tschechisch | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Dänisch | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Niederländisch | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Englisch (Australien) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Englisch (Vereinigtes Königreich) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Englisch (USA) | de-De | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estnisch | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fidschianisch | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finnisch | FI-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Französisch | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Französisch (Kanada) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Deutsch | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Griechisch | el-GR | ✔ | ✔ | ✔ | |||
Gujarati | gu-IN | ✔ | ✔ | ✔ | |||
Haiti-Kreolisch | fr-HT | ✔ | |||||
Hebräisch | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ungarisch | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Isländisch | is-IS | ✔ | |||||
Indonesisch | id-ID | ✔ | ✔ | ✔ | |||
Irisch | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italienisch | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japanisch | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannada | kn-IN | ✔ | ✔ | ||||
Suaheli | sw-KE | ✔ | |||||
Koreanisch | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lettisch | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Litauisch | lt-LT | ✔ | ✔ | ✔ | |||
Madagassisch | mg-MG | ✔ | |||||
Malaiisch | ms-MY | ✔ | ✔ | ||||
Malayalam | ml-IN | ✔ | ✔ | ||||
Maltesisch | mt-MT | ✔ | |||||
Norwegisch | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persisch | fa-IR | ✔ | ✔ | ✔ | |||
Polnisch | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugiesisch | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugiesisch (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Rumänisch | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russisch | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoisch | en-WS | ||||||
Serbisch (Kyrillisch) | sr-Cyrl-RS | ✔ | |||||
Serbisch (Lateinisch) | sr-Latn-RS | ✔ | |||||
Slowakisch | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Slowenisch | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Spanisch | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Spanisch (Mexiko) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Schwedisch | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamilisch | ta-IN | ✔ | ✔ | ✔ | |||
Telugu | te-IN | ✔ | ✔ | ||||
Thailändisch | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tongaisch | to-TO | ✔ | |||||
Türkisch | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ukrainisch | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | ur-PK | ✔ | |||||
Vietnamesisch | vi-VN | ✔ | ✔ | ✔ |
Abrufen unterstützter Sprachen über die API
Verwenden Sie den API-Aufruf "Unterstützte Sprachen abrufen", um eine vollständige Liste der unterstützten Sprachen pro Bereich abzurufen. Weitere Informationen finden Sie unter "Unterstützte Sprachen abrufen".
Die API gibt eine Liste der unterstützten Sprachen mit den folgenden Werten zurück:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Unterstützte Quellsprache:
Ist
isSourceLanguage
"false" angegeben, wird die Sprache nur für die Übersetzung unterstützt. IstisSourceLanguage
dies der Fall, wird die Sprache als Quelle für Transkription, Übersetzung und Suche unterstützt.Sprachenerkennung (automatische Erkennung):
Ist
isAutoDetect
dies der Fall, wird die Sprache für die Sprachidentifikation (LID) und die mehrsprachige Identifikation (Multi-Language Identification, MLID) unterstützt.
Sprachidentifikation
Beim Hochladen einer Mediendatei in den Videoindexer können Sie die Quellsprache der Mediendatei angeben. Wenn sie eine Datei über die Videoindexer-Website indizieren, kann dies durch Auswählen einer Sprache während des Dateiuploads erfolgen. Wenn Sie den Indizierungsauftrag über die API übermitteln, erfolgt dies mithilfe des Sprachparameters. Die ausgewählte Sprache wird dann verwendet, um die Transkription der Datei zu generieren.
Wenn Sie nicht sicher sind, dass die Quellsprache der Mediendatei vorhanden ist oder sie mehrere Sprachen enthält, kann Der Videoindexer die gesprochenen Sprachen erkennen. Wenn Sie für die Quellsprache der Mediendatei entweder "Single-Detect Single Language(LID)" oder "Multi-Language( MLID)" auswählen, werden die erkannten Sprachen oder Sprachen verwendet, um die Mediendatei zu transkribieren. Weitere Informationen zu LID und MLID finden Sie unter Verwenden von Azure AI Video Indexer zum automatischen Identifizieren gesprochener Sprachen, siehe Automatisches Identifizieren der gesprochenen Sprache mit sprachidentifizierungsmodell und automatisches Identifizieren und Transkribieren von mehrsprachigen Inhalten
Es gibt eine Beschränkung von 10 Sprachen, die während der Indizierung einer Mediendatei für LID und MLID zulässig sind. Im Folgenden sind die 9 Standardsprachen sprachidentifikation (LID) und Multi-Language Identification (MILD) aufgeführt:
- Deutsch (de-DE)
- Englisch USA (en-US)
- Spanisch (es-ES)
- Französisch (fr-FR)
- Italienisch (it-IT)
- Japanisch (ja-JP)
- Portugiesisch (pt-BR)
- Russisch (ru-RU)
- Chinesisch (vereinfacht) (zh-Hans)
So ändern Sie die Liste der Standardsprachen
Wenn Sie Sprachen für die Identifizierung verwenden müssen, die nicht standardmäßig verwendet werden, können Sie die Liste auf alle 10 Sprachen anpassen, die anpassungen über die Website oder die API unterstützen:
Verwenden der Website zum Ändern der Liste
Wählen Sie die Registerkarte "Sprach-ID" unter "Modellanpassung" aus. Die Liste der Sprachen ist spezifisch für das Videoindexer-Konto, das Sie verwenden, und für den angemeldeten Benutzer. Die Standardliste der Sprachen wird pro Benutzer auf ihrem lokalen Gerät, pro Gerät und Browser gespeichert. Daher kann jeder Benutzer seine eigene standardidente Sprachliste konfigurieren.
Verwenden Sie "Sprache hinzufügen", um weitere Sprachen zu suchen und hinzuzufügen. Wenn bereits 10 Sprachen ausgewählt sind, müssen Sie zuerst eine der vorhandenen erkannten Sprachen entfernen, bevor Sie eine neue sprache hinzufügen.
Verwenden der API zum Ändern der Liste
Wenn Sie eine Datei hochladen, verweist das Videoindexer-Sprachmodell standardmäßig auf 9 Sprachen. Wenn eine Übereinstimmung vorliegt, generiert das Modell die Transkription für die Datei mit der erkannten Sprache.
Verwenden Sie den Sprachparameter, um Parameter (MLID) oder auto
(LID) anzugeben multi
. Verwenden Sie den customLanguages
Parameter, um bis zu 10 Sprachen anzugeben. (Der Parameter wird nur verwendet, wenn der Sprachparameter auf multi
oder auto
.) Weitere Informationen zur Verwendung der API finden Sie unter Verwenden der Azure AI Video Indexer-API.