Sprachunterstützung in Azure AI Video Indexer

In diesem Artikel werden die Sprachoptionen von Video Indexer erläutert und eine Liste der Sprachunterstützung für jeden bereitgestellt. Es enthält die Sprachenunterstützung für Video Indexer-Features, Übersetzung, Sprachidentifikation, Anpassung und die Spracheinstellungen der VideoIndexer-Website.

Unterstützte Sprachen pro Szenario

In diesem Abschnitt werden die Sprachoptionen für die Videoindexer erläutert und eine Tabelle der unterstützten Sprachen für die einzelnen Sprachen enthalten.

Wichtig

Alle aufgeführten Sprachen unterstützen übersetzungen beim Indizieren über die API.

Erläuterungen zu Spalten

  • Unterstützte Quellsprache – Die in der Mediendatei gesprochene Sprache , die für Transkription, Übersetzung und Suche unterstützt wird.

  • Sprachidentifikation – Gibt an, ob die Sprache automatisch von der Videoindexer erkannt werden kann, wenn die Sprachidentifikation für die Indizierung verwendet wird. Weitere Informationen finden Sie unter Verwenden von Azure AI Video Indexer, um gesprochene Sprachen und den Abschnitt "Sprachidentifikation " automatisch zu identifizieren.

  • Anpassung (Sprachmodell) – Gibt an, ob die Sprache beim Anpassen von Sprachmodellen im Videoindexer verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells in Azure AI Video Indexer.

  • Aussprache (Sprachmodell) – Gibt an, ob die Sprache zum Erstellen eines Aussprache-Datasets als Teil eines benutzerdefinierten Sprachmodells verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells mit azure AI Video Indexer.

  • Websiteübersetzung – Gibt an, ob die Sprache bei Verwendung der Azure AI Video Indexer-Website für die Übersetzung unterstützt wird. Wählen Sie die übersetzte Sprache im Dropdownmenü "Sprache" aus.

    Screenshot eines Menüs mit Download, Englisch und Ansichten als Menüelemente. Eine QuickInfo wird als Mauszeiger auf dem englischen Element angezeigt und besagt, dass

    Die folgenden Erkenntnisse werden übersetzt:

    • Textaufzeichnung
    • Schlüsselwörter
    • Themen
    • Beschriftungen
    • Framemuster (derzeit nur auf Hebräisch)

    Alle anderen Erkenntnisse werden bei Verwendung der Übersetzung in Englisch angezeigt.

  • Websitesprache – Gibt an, ob die Sprache für die Verwendung auf der Azure AI Video Indexer-Website ausgewählt werden kann. Wählen Sie das Symbol "Einstellungen" und dann die Sprache im Dropdownmenü "Spracheinstellungen " aus.

    Screenshot eines Menüs mit Benutzereinstellungen zeigt, dass sie alle aktiviert sind.

Sprache Code Abgestützt
Ausgangssprache
Sprache
Identifizierung
Anpassung
(Sprachmodell)
Aussprache
(Sprachmodell)
Website
Übersetzung
Website
Sprache
Afrikaans af-ZA
Arabisch (Israel) ar-IL
Arabisch (Irak) ar-IQ
Arabisch (Jordanien) ar-JO
Arabisch (Kuwait) ar-KW
Arabisch (Libanon) ar-LB
Arabisch (Oman) ar-OM
Arabisch (Palästinensische Autonomiebehörde) ar-PS
Arabisch (Katar) ar-QA
Arabisch (Saudi-Arabien) ar-SA
Arabisch (Vereinigte Arabische Emirate) ar-AE
Arabisch (Ägypten) ar-EG
Arabisch (modernes Hocharabisch, Bahrain) ar-BH
Arabisch (Arabische Republik Syrien) ar-SY
Armenisch hy-AM
Bengalisch bn-BD
Bosnisch bs-Latn
Bulgarisch bg-BG
Katalanisch ca-ES
Chinesisch (Kantonesisch, traditionell) zh-HK
Chinesisch (vereinfacht) zh-Hans
Chinesisch (vereinfacht) zh-CK
Chinesisch (traditionell) zh-Hant
Kroatisch hr-HR
Tschechisch cs-CZ
Dänisch da-DK
Niederländisch nl-NL
Englisch (Australien) en-AU
Englisch (Vereinigtes Königreich) en-GB
Englisch (USA) de-De
Estnisch et-EE
Fidschianisch en-FJ
Filipino fil-PH
Finnisch FI-FI
Französisch fr-FR
Französisch (Kanada) fr-CA
Deutsch de-DE
Griechisch el-GR
Gujarati gu-IN
Haiti-Kreolisch fr-HT
Hebräisch he-IL
Hindi hi-IN
Ungarisch hu-HU
Isländisch is-IS
Indonesisch id-ID
Irisch ga-IE
Italienisch it-IT
Japanisch ja-JP
Kannada kn-IN
Suaheli sw-KE
Koreanisch ko-KR
Lettisch lv-LV
Litauisch lt-LT
Madagassisch mg-MG
Malaiisch ms-MY
Malayalam ml-IN
Maltesisch mt-MT
Norwegisch nb-NO
Persisch fa-IR
Polnisch pl-PL
Portugiesisch pt-BR
Portugiesisch (Portugal) pt-PT
Rumänisch ro-RO
Russisch ru-RU
Samoisch en-WS
Serbisch (Kyrillisch) sr-Cyrl-RS
Serbisch (Lateinisch) sr-Latn-RS
Slowakisch sk-SK
Slowenisch sl-SI
Spanisch es-ES
Spanisch (Mexiko) es-MX
Schwedisch sv-SE
Tamilisch ta-IN
Telugu te-IN
Thailändisch th-TH
Tongaisch to-TO
Türkisch tr-TR
Ukrainisch uk-UA
Urdu ur-PK
Vietnamesisch vi-VN

Abrufen unterstützter Sprachen über die API

Verwenden Sie den API-Aufruf "Unterstützte Sprachen abrufen", um eine vollständige Liste der unterstützten Sprachen pro Bereich abzurufen. Weitere Informationen finden Sie unter "Unterstützte Sprachen abrufen".

Die API gibt eine Liste der unterstützten Sprachen mit den folgenden Werten zurück:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Unterstützte Quellsprache:

    Ist isSourceLanguage "false" angegeben, wird die Sprache nur für die Übersetzung unterstützt. Ist isSourceLanguage dies der Fall, wird die Sprache als Quelle für Transkription, Übersetzung und Suche unterstützt.

  • Sprachenerkennung (automatische Erkennung):

    Ist isAutoDetect dies der Fall, wird die Sprache für die Sprachidentifikation (LID) und die mehrsprachige Identifikation (Multi-Language Identification, MLID) unterstützt.

Sprachidentifikation

Beim Hochladen einer Mediendatei in den Videoindexer können Sie die Quellsprache der Mediendatei angeben. Wenn sie eine Datei über die Videoindexer-Website indizieren, kann dies durch Auswählen einer Sprache während des Dateiuploads erfolgen. Wenn Sie den Indizierungsauftrag über die API übermitteln, erfolgt dies mithilfe des Sprachparameters. Die ausgewählte Sprache wird dann verwendet, um die Transkription der Datei zu generieren.

Wenn Sie nicht sicher sind, dass die Quellsprache der Mediendatei vorhanden ist oder sie mehrere Sprachen enthält, kann Der Videoindexer die gesprochenen Sprachen erkennen. Wenn Sie für die Quellsprache der Mediendatei entweder "Single-Detect Single Language(LID)" oder "Multi-Language( MLID)" auswählen, werden die erkannten Sprachen oder Sprachen verwendet, um die Mediendatei zu transkribieren. Weitere Informationen zu LID und MLID finden Sie unter Verwenden von Azure AI Video Indexer zum automatischen Identifizieren gesprochener Sprachen, siehe Automatisches Identifizieren der gesprochenen Sprache mit sprachidentifizierungsmodell und automatisches Identifizieren und Transkribieren von mehrsprachigen Inhalten

Es gibt eine Beschränkung von 10 Sprachen, die während der Indizierung einer Mediendatei für LID und MLID zulässig sind. Im Folgenden sind die 9 Standardsprachen sprachidentifikation (LID) und Multi-Language Identification (MILD) aufgeführt:

  • Deutsch (de-DE)
  • Englisch USA (en-US)
  • Spanisch (es-ES)
  • Französisch (fr-FR)
  • Italienisch (it-IT)
  • Japanisch (ja-JP)
  • Portugiesisch (pt-BR)
  • Russisch (ru-RU)
  • Chinesisch (vereinfacht) (zh-Hans)

So ändern Sie die Liste der Standardsprachen

Wenn Sie Sprachen für die Identifizierung verwenden müssen, die nicht standardmäßig verwendet werden, können Sie die Liste auf alle 10 Sprachen anpassen, die anpassungen über die Website oder die API unterstützen:

Verwenden der Website zum Ändern der Liste

  1. Wählen Sie die Registerkarte "Sprach-ID" unter "Modellanpassung" aus. Die Liste der Sprachen ist spezifisch für das Videoindexer-Konto, das Sie verwenden, und für den angemeldeten Benutzer. Die Standardliste der Sprachen wird pro Benutzer auf ihrem lokalen Gerät, pro Gerät und Browser gespeichert. Daher kann jeder Benutzer seine eigene standardidente Sprachliste konfigurieren.

  2. Verwenden Sie "Sprache hinzufügen", um weitere Sprachen zu suchen und hinzuzufügen. Wenn bereits 10 Sprachen ausgewählt sind, müssen Sie zuerst eine der vorhandenen erkannten Sprachen entfernen, bevor Sie eine neue sprache hinzufügen.

    Screenshot einer Tabelle mit allen ausgewählten Sprachen.

Verwenden der API zum Ändern der Liste

Wenn Sie eine Datei hochladen, verweist das Videoindexer-Sprachmodell standardmäßig auf 9 Sprachen. Wenn eine Übereinstimmung vorliegt, generiert das Modell die Transkription für die Datei mit der erkannten Sprache.

Verwenden Sie den Sprachparameter, um Parameter (MLID) oder auto (LID) anzugeben multi . Verwenden Sie den customLanguages Parameter, um bis zu 10 Sprachen anzugeben. (Der Parameter wird nur verwendet, wenn der Sprachparameter auf multi oder auto.) Weitere Informationen zur Verwendung der API finden Sie unter Verwenden der Azure AI Video Indexer-API.