Anpassen eines Sprachmodells

Hinweis

Die Anpassung des Sprachmodells, einschließlich der Ausspracheschulung, wird nur in Azure-Testkonten und Ressourcen-Manager-Konten von Videoindexer unterstützt. Es wird in klassischen Konten nicht unterstützt. Anleitungen zum Aktualisieren Ihres Kontotyps ohne Kosten finden Sie im Update Ihres Azure AI Video Indexer-Kontos. Anleitungen zur Verwendung der benutzerdefinierten Sprachoberfläche finden Sie unter Anpassen eines Sprachmodells.

Mit azure AI Video Indexer können Sie benutzerdefinierte Sprachmodelle erstellen, um die Spracherkennung anzupassen, indem Sie Datasets hochladen, die zum Erstellen eines Sprachmodells verwendet werden. In diesem Artikel werden die Schritte zur Vorgehensweise über die VideoIndexer-Website erläutert. Sie können die API auch verwenden, wie im Anpassen des Sprachmodells mithilfe der API beschrieben.

Eine detaillierte Übersicht und bewährte Methoden für benutzerdefinierte Sprachmodelle finden Sie unter Anpassen eines Sprachmodells mit Azure AI Video Indexer.

Voraussetzungen

Erstellen eines Datasets

Da alle benutzerdefinierten Modelle ein Dataset enthalten müssen, beginnen wir mit dem Verfahren zum Erstellen und Verwalten von Datasets.

  1. Wählen Sie die Schaltfläche " Modellanpassung" aus .
  2. Wählen Sie die Registerkarte "Sprache" (neu) aus.
  3. Wählen Sie "Dataset hochladen" aus.
  4. Wählen Sie im Dropdownmenü "Datasettyp" entweder "Nur-Text" oder "Aussprache" aus. Jedes Sprachmodell muss über ein Nur-Text-Dataset verfügen und optional über ein Aussprache-Dataset verfügen.
  5. Wählen Sie "Durchsuchen" und dann die Datasetdatei aus. Sie können nur einen auswählen.
  6. Wählen Sie eine Sprache für das Modell aus. Wählen Sie die Sprache aus, die in den Mediendateien gesprochen wird, die Sie für die Indizierung mit diesem Modell planen. Der Datasetname wird vorab mit dem Namen der Datei aufgefüllt, Aber Sie können den Namen ändern.
  7. Optional können Sie eine Beschreibung des Datasets hinzufügen. Dies kann hilfreich sein, um jedes Dataset zu unterscheiden, wenn Sie erwarten, dass mehrere Datasets vorhanden sind.
  8. Wählen Sie die Option Hochladen. Wenn die Dataseterstellung abgeschlossen ist, können Sie sie für schulungen und die Erstellung neuer Modelle verwenden.

Überprüfen und Aktualisieren eines Datasets

Sie können ein Dataset und dessen Eigenschaften anzeigen, indem Sie:

  • Klicken auf den Datasetnamen
  • Zeigen auf das Dataset
  • Auswählen der Auslassungspunkte

Wählen Sie dann "Dataset anzeigen" aus.

Anschließend können Sie den Namen, die Beschreibung, die Sprache und den Status des Datasets sowie die folgenden Eigenschaften anzeigen:

Anzahl der Zeilen: Gibt die Anzahl der Zeilen an, die erfolgreich aus der Gesamtzahl der Zeilen in der Datei geladen wurden. Wenn die gesamte Datei erfolgreich geladen wird, stimmen die Zahlen überein (z. B. 10 von 10 normalisiert). Wenn die Zahlen nicht übereinstimmen (z. B. 7 von 10 normalisiert), bedeutet dies, dass nur einige der Zeilen erfolgreich geladen wurden und die restlichen Fehler aufgetreten sind. Häufige Fehlerursachen sind Formatierungsprobleme mit einer Zeile, z. B. beim Nichtabstand eines Tabstopps zwischen jedem Wort in einer Aussprachedatei. Die Überprüfung der Nur-Text- und Aussprachedaten für Schulungsartikel sollte bei der Suche nach dem Problem hilfreich sein. Um die Ursache zu beheben, überprüfen Sie die Fehlerdetails, die im Bericht enthalten sind. Wählen Sie "Bericht anzeigen" aus, um die Fehlerdetails zu den Zeilen anzuzeigen, die nicht erfolgreich geladen wurden (errorKind). Dies kann auch angezeigt werden, indem Sie die Registerkarte "Bericht " auswählen.

Dataset-ID: Jedes Dataset verfügt über eine eindeutige GUID, die bei Verwendung der API für Vorgänge erforderlich ist, die auf das Dataset verweisen.

Nur-Text (normalisiert): Dies enthält den normalisierten Text der geladenen Datasetdatei. Normalisierter Text ist der erkannte Text in nur-Form ohne Formatierung.

Details bearbeiten: Wenn Sie den Namen oder die Beschreibung eines Datasets bearbeiten möchten, wählen Sie beim Zeigen auf das Dataset die Auslassungspunkte aus, und wählen Sie dann "Details bearbeiten" aus. Anschließend können Sie den Datasetnamen und die Beschreibung bearbeiten.

Hinweis

Die Daten in einem Dataset können nicht bearbeitet oder aktualisiert werden, nachdem das Dataset hochgeladen wurde. Wenn Sie die Daten in einem Dataset bearbeiten oder aktualisieren müssen, laden Sie das Dataset herunter, führen Sie die Bearbeitungen aus, speichern Sie die Datei, und laden Sie die neue Datasetdatei hoch.

Download: Um eine Datasetdatei herunterzuladen, wählen Sie beim Zeigen auf das Dataset die Auslassungspunkte aus, und wählen Sie dann "Herunterladen" aus. Alternativ können Sie beim Anzeigen des Datasets "Herunterladen" auswählen und dann die Möglichkeit haben, die Datasetdatei oder den Uploadbericht in JSON-Formular herunterzuladen.

Löschen: Um ein Dataset zu löschen, wählen Sie beim Zeigen auf das Dataset die Auslassungspunkte aus, und wählen Sie dann "Löschen" aus.

Erstellen eines Custom Speech-Modells

Datasets werden bei der Erstellung und Schulung von Modellen verwendet. Nachdem Sie ein Nur-Text-Dataset erstellt haben, können Sie ein benutzerdefiniertes Sprachmodell erstellen und damit beginnen.

Beachten Sie beim Erstellen und Verwenden von benutzerdefinierten Sprachmodellen Folgendes:

  • Ein neues Modell muss mindestens ein Nur-Text-Dataset enthalten und kann mehrere Nur-Text-Datasets aufweisen.
  • Es ist optional, ein Aussprache-Dataset einzuschließen, und es kann nicht mehr als ein Dataset eingeschlossen werden.
  • Nachdem ein Modell erstellt wurde, können Sie ihr keine zusätzlichen Datasets hinzufügen oder änderungen an seinen Datasets vornehmen. Wenn Sie Datasets hinzufügen oder ändern müssen, erstellen Sie ein neues Modell.
  • Wenn Sie ein Video mithilfe eines benutzerdefinierten Sprachmodells indiziert und dann das Modell löschen, wirkt sich die Transkription erst aus, wenn Sie eine Neuindizierung durchführen.
  • Wenn Sie ein Dataset gelöscht haben, das zum Trainieren eines benutzerdefinierten Modells verwendet wurde, da das Sprachmodell bereits vom Dataset trainiert wurde, wird es weiterhin verwendet, bis das Sprachmodell gelöscht wird.
  • Wenn Sie ein benutzerdefiniertes Modell löschen, hat es keine Auswirkungen auf die Transkription von Videos, die bereits mit dem Modell indiziert wurden.

Trainieren eines Modells

Hinweis

Nachdem ein Modell erstellt wurde, können Datasets nicht hinzugefügt werden. Ein Modell kann nur Datasets derselben Sprache enthalten.

Es gibt zwei Möglichkeiten zum Trainieren eines Modells – über die Registerkarte "Dataset" und über die Registerkarte "Modell".

Trainieren eines Modells über die Registerkarte "Datasets"

  1. Zeigen Sie die Liste der Datasets an.
  2. Wählen Sie ein Nur-Text-Dataset aus. Das Symbol "Neues Modell trainieren" oben kann dann ausgewählt werden.
  3. Wählen Sie "Neues Modell trainieren" aus.
  4. Geben Sie einen Namen für das Modell, eine Sprache ein, und fügen Sie optional eine Beschreibung hinzu.
  5. Auswählen der Registerkarte "Datasets "
  6. Wählen Sie die Datasets aus, die sie in das Modell einbeziehen möchten.
  7. Wählen Sie " Erstellen und Trainieren" aus.

Trainieren eines Modells über die Registerkarte "Modelle"

  1. Wählen Sie die Registerkarte Modelle aus.
  2. Wählen Sie das Symbol "Neues Modell trainieren " aus.
  3. Wählen Sie die Datasets aus, die Teil des Modells sein sollen.
  4. Geben Sie einen Namen für das Modell, eine Sprache ein, und fügen Sie optional eine Beschreibung hinzu.
  5. Wählen Sie die Registerkarte Datasets aus.
  6. Wählen Sie die Datasets aus, die sie in das Modell einbeziehen möchten.
  7. Wählen Sie " Erstellen und Trainieren" aus.

Überprüfen und Aktualisieren eines Modells

Ansichtsmodell: Sie können ein Modell und dessen Eigenschaften anzeigen, indem Sie entweder auf den Namen des Modells klicken oder mit dem Mauszeiger auf das Modell zeigen, auf die Auslassungspunkte klicken und dann "Ansichtsmodell" auswählen.

Dann sehen Sie auf der Registerkarte "Details" den Namen, die Beschreibung, die Sprache und den Status des Modells sowie die folgenden Eigenschaften:

Modell-ID: Jedes Modell verfügt über eine eindeutige GUID, die bei Verwendung der API für Vorgänge erforderlich ist, die auf das Modell verweisen.

Erstellt am: Das Datum, an dem das Modell erstellt wurde.

Details bearbeiten: Wenn Sie den Namen oder die Beschreibung eines Modells bearbeiten möchten, wählen Sie beim Zeigen auf das Modell die Auslassungspunkte aus, und wählen Sie dann "Details bearbeiten" aus. Anschließend können Sie den Namen und die Beschreibung des Modells bearbeiten.

Hinweis

Nur der Name und die Beschreibung des Modells können bearbeitet werden. Wenn Sie Änderungen an ihren Datasets vornehmen oder Datasets hinzufügen möchten, muss ein neues Modell erstellt werden.

Löschen: Um ein Modell zu löschen, wählen Sie beim Zeigen auf das Dataset die Auslassungspunkte aus, und wählen Sie dann "Löschen" aus.

Enthaltene Datasets: Wählen Sie auf der Registerkarte "Eingeschlossene Datasets" aus, um die Datasets des Modells anzuzeigen.

Verwenden eines benutzerdefinierten Sprachmodells beim Indizieren eines Videos

Ein benutzerdefiniertes Sprachmodell wird nicht standardmäßig für Indizierungsaufträge verwendet. Daher müssen Sie während des Indexuploadvorgangs ausgewählt werden.

  1. Wählen Sie während des Uploadvorgangs ihre benutzerdefinierte Sprachmodellquelle aus dem Dropdownmenü "Sprache " aus.
  2. Wählen Sie die Option Hochladen.

Die gleichen Schritte gelten, wenn Sie ein Video mit einem benutzerdefinierten Modell neu indizieren möchten.