Anpassen eines Sprachmodells mit Azure AI Video Indexer

Azure AI Video Indexer unterstützt die automatische Spracherkennung durch Integration in den benutzerdefinierten Microsoft-Sprachdienst. Sie können das Sprachmodell anpassen, indem Sie Anpassungstext hochladen. Dieser Text stammt aus der Domäne, deren Vokabular Sie für die Anpassung des Moduls verwenden möchten. Sobald Sie Ihr Modell trainieren, werden neue Wörter erkannt, die im Anpassungstext angezeigt werden, vorausgesetzt, die Standardaussprache wird vorausgesetzt, und das Sprachmodell lernt neue wahrscheinliche Abfolgen von Wörtern. Sehen Sie sich die Liste der unterstützten Sprachen von Azure AI Video Indexer in unterstützten Sprachen an.

Beispielsweise ist "Kubernetes" (im Kontext des Azure Kubernetes-Diensts) ein Wort, das sehr spezifisch ist. Da das Wort neu bei Azure AI Video Indexer ist, wird es als "Communitys" erkannt. Trainieren Sie das Modell, um es als "Kubernetes" zu erkennen. In anderen Fällen sind die Wörter vorhanden, aber das Sprachmodell erwartet nicht, dass sie in einem bestimmten Kontext angezeigt werden. Beispielsweise ist "Containerdienst" keine 2-Wort-Sequenz, die ein nicht spezielles Sprachmodell als eine bestimmte Gruppe von Wörtern erkennt.

Es gibt zwei Möglichkeiten zum Anpassen eines Sprachmodells:

  • Option 1: Bearbeiten Sie das Transkript, das von Azure AI Video Indexer generiert wurde. Indem Sie das Transkript bearbeiten und korrigieren, trainieren Sie ein Sprachmodell, um in Zukunft verbesserte Ergebnisse bereitzustellen.
  • Option 2: Hochladen von Textdateien zum Trainieren des Sprachmodells. Die Datei kann entweder eine Liste von Wörtern enthalten, wie sie im Videoindexer-Transkript angezeigt werden sollen, oder die relevanten Wörter, die natürlich in Sätzen und Absätzen enthalten sind. Da mit dem letztgenannten Ansatz bessere Ergebnisse erzielt werden, wird empfohlen, dass die Uploaddatei vollständige Sätze oder Absätze im Zusammenhang mit Ihrem Inhalt enthält.

Wichtig

Schließen Sie die Wörter oder Sätze nicht wie aktuell falsch transkribiert (z. B. "Communitys") in die Uploaddatei ein, da dadurch die beabsichtigte Auswirkung nicht aufgehoben wird. Schließen Sie Wörter nur so ein, wie sie angezeigt werden sollen (z. B. als „Kubernetes“).

Optimieren Des benutzerdefinierten Sprachmodells

Azure AI Video Indexer lernt basierend auf Der Wahrscheinlichkeit von Wortkombinationen, um am besten zu lernen:

  • Geben Sie eine ausreichende Zahl von Beispielsätzen an, wie sie in der Realität ausgesprochen werden.
  • Geben Sie pro Zeile nur einen Satz an. Andernfalls erlernt das System satzübergreifende Wahrscheinlichkeiten.
  • Es ist in Ordnung, ein Wort als Satz zu setzen, um das Wort gegen andere zu erhöhen, aber das System lernt am besten aus vollen Sätzen.
  • Geben Sie beim Hinzufügen neuer Wörter oder Akronyme nach Möglichkeit ebenso viele Beispiele für die Nutzung in einem vollständigen Satz an, damit das System über möglichst viel Kontext verfügt.
  • Probieren Sie mehrere Anpassungsoptionen aus, um zu ermitteln, welche für Sie gut funktionieren.
  • Vermeiden Sie es, identische Sätze mehrfach anzugeben. Dies kann dazu führen, dass diese Sätze gegenüber den restlichen Eingaben ein höheres Gewicht erhalten.
  • Vermeiden Sie ungewöhnliche Symbole (~, # @ % &), da sie verworfen werden. Auch die Sätze, in denen die Symbole vorkommen, werden verworfen.
  • Vermeiden Sie zu umfangreiche Eingaben, z.B. Hunderte oder Tausende von Sätzen, weil sonst der Verstärkungseffekt abgeschwächt wird.

Voraussetzungen

  • Ein Azure-Konto
  • Ein Azure AI Video Indexer-Konto

Erstellen eines Sprachmodells

  1. Wechseln Sie zur Azure AI Video Indexer-Website , und melden Sie sich an.
  2. Um ein Modell in Ihrem Konto anzupassen, wählen Sie links auf der Seite die Schaltfläche Anpassung des Inhaltsmodells aus.
  3. Wählen Sie die Registerkarte "Sprache " aus. Es wird eine Liste der unterstützten Sprachen angezeigt.
  4. Nach dem Auswählen der gewünschten Sprache wählen Sie Modell hinzufügen aus.
  5. Geben Sie den Namen für das Sprachmodell ein, und drücken Sie die EINGABETASTE. Damit wird das Modell erstellt, und das Hochladen von Textdateien in das Modell wird möglich.
  6. Wählen Sie Datei hinzufügen aus, um eine Textdatei hinzuzufügen. Ihr Datei-Explorer wird geöffnet.
  7. Navigieren Sie zur Textdatei, und wählen Sie diese aus. Sie können einem Sprachmodell mehrere Textdateien hinzufügen. Sie können auch eine Textdatei hinzufügen, indem Sie auf der rechten Seite des Sprachmodells die Schaltfläche "..." auswählen und dann "Datei hinzufügen" auswählen.
  8. Nachdem Sie die Textdateien hochgeladen haben, wählen Sie die grüne Option Trainieren aus.

Der Trainingsprozess kann einige Minuten dauern. Sobald die Schulung abgeschlossen ist, wird "Trained " neben dem Modell angezeigt. Sie können für die Datei eine Vorschau anzeigen, sie herunterladen und aus dem Modell löschen.

Verwenden eines Sprachmodells in einem neuen Video

Führen Sie eine der folgenden Aktionen aus, um Ihr Sprachmodell in einem neuen Video zu verwenden:

  1. Wählen Sie die Schaltfläche Hochladen oben auf der Seite aus.
  2. Legen Sie Ihre Audio- oder Videodatei ab, oder suchen Sie nach Ihrer Datei.
  3. Wählen Sie ein Von Ihnen erstelltes Sprachmodell aus der Dropdownliste " Videoquellsprache " aus.
  4. Wählen Sie unten auf der Seite die Option Hochladen aus, und Ihr neues Video wird mithilfe des Sprachmodells indiziert.

Verwenden eines Sprachmodells zum Erneuten Indizieren

  1. Melden Sie sich bei der Azure AI Video Indexer-Startseite an.
  2. Klicken Sie im Video auf die ...-Schaltfläche, und wählen Sie Neu indizieren aus.
  3. Wählen Sie die Dropdownliste "Videoquellsprache " aus, und wählen Sie ein Von Ihnen erstelltes Sprachmodell aus der Liste aus.
  4. Wählen Sie die Schaltfläche "Neu indizieren " aus, und Ihr Video wird mithilfe Ihres Sprachmodells neu indiziert.

Bearbeiten eines Sprachmodells

Sie können ein Sprachmodell bearbeiten, indem Sie dessen Namen ändern, Dateien hinzufügen und Dateien daraus löschen. Wenn Sie Dateien aus dem Sprachmodell hinzufügen oder löschen, müssen Sie das Modell erneut trainieren, indem Sie die grüne Option "Trainieren " auswählen.

Umbenennen des Sprachmodells

Sie können den Namen des Sprachmodells ändern, indem Sie auf der rechten Seite des Sprachmodells die Auslassungspunkte (...) auswählen und "Umbenennen" auswählen. Geben Sie den neuen Namen ein.

Dateien hinzufügen

  1. Wählen Sie Datei hinzufügen aus. Ihr Datei-Explorer wird geöffnet.
  2. Navigieren Sie zur Textdatei, und wählen Sie diese aus. Sie können einem Sprachmodell mehrere Textdateien hinzufügen.

Sie können auch eine Textdatei hinzufügen, indem Sie auf der rechten Seite des Sprachmodells die Schaltfläche mit den Auslassungspunkten (...) auswählen und "Datei hinzufügen" auswählen.

Dateien löschen

Mit dieser Aktion wird die Datei vollständig aus dem Sprachmodell entfernt.

  1. Wählen Sie auf der rechten Seite der Textdatei die Auslassungspunkte (...) aus.
  2. Klicken Sie auf Löschen. Ein neues Fenster mit der Mitteilung, dass die Löschung nicht rückgängig gemacht werden kann, wird geöffnet.
  3. Wählen Sie die Option Löschen in dem neuen Fenster aus.

Löschen eines Sprachmodells

Mit dieser Aktion wird das Sprachmodell vollständig aus Ihrem Konto entfernt. Jedes Video, das das deletedlLanguage-Modell verwendet hat, behält den gleichen Index bei, bis Sie das Video neu indizieren. Wenn Sie das Video neu indizieren, können Sie dem Video ein neues Sprachmodell zuweisen. Andernfalls verwendet Azure AI Video Indexer sein Standardmodell, um das Video neu zu indizieren.

  1. Wählen Sie die Auslassungspunkte (...) auf der rechten Seite des Sprachmodells aus.
  2. Klicken Sie auf Löschen. Ein neues Fenster mit der Mitteilung, dass die Löschung nicht rückgängig gemacht werden kann, wird geöffnet.
  3. Wählen Sie die Option Löschen in dem neuen Fenster aus.

Anpassen von Sprachmodellen durch Korrigieren von Transkriptionen

Azure AI Video Indexer passt Sprachmodelle basierend auf den tatsächlichen Korrekturen an den Transkriptionen ihrer Videos an. Es erfasst alle Zeilen, die Sie in der Transkription Ihres Videos korrigiert haben, und fügt sie zu einer Textdatei hinzu, die aufgerufen wird From transcript edits. Diese Bearbeitungen werden verwendet, um das Sprachmodell neu zu trainieren, das zum Indizieren des Videos verwendet wurde.

Bearbeitungen, die auf der Zeitachse des Widgets vorgenommen wurden, sind ebenfalls enthalten.

Wenn Sie beim Indizieren dieses Videos kein Sprachmodell angegeben haben, werden alle Bearbeitungen für dieses Video in einem Standardsprachenmodell gespeichert, das in der erkannten Sprache des Videos aufgerufen Account adaptations wird.

Falls mehrere Bearbeitungen an derselben Zeile vorgenommen wurden, wird nur die letzte Version der korrigierten Zeile zum Aktualisieren des Sprachmodells verwendet.

Hinweis

Für die Anpassung werden nur Textkorrekturen verwendet. Korrekturen, die keine eigentlichen Wörter beinhalten (z. B. Satzzeichen oder Leerzeichen), werden nicht berücksichtigt.

  1. Wählen Sie das Video aus, das Sie aus Ihrer Bibliothek bearbeiten möchten.
  2. Wählen Sie die Registerkarte Zeitachse.
  3. Wählen Sie das Stiftsymbol aus, um das Transkript Ihrer Transkription zu bearbeiten.
  4. Auf der Registerkarte "Sprache" auf der Seite "Con Zelt-Modus lanpassung" werden Transkriptkorrekturen angezeigt. Um die Datei „Aus Transkriptbearbeitungen“ für jedes Ihrer Sprachmodelle anzusehen, wählen Sie sie aus, um sie zu öffnen.