ActivationSignalDetectionTrainingDataFormat Enumeration

Definition

Gibt die Vom ActivationSignalDetector unterstützten Aktivierungssignaltrainingsdatenformate für die digitale Assistent an.

public enum class ActivationSignalDetectionTrainingDataFormat
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 655360)]
enum class ActivationSignalDetectionTrainingDataFormat
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 655360)]
public enum ActivationSignalDetectionTrainingDataFormat
var value = Windows.ApplicationModel.ConversationalAgent.ActivationSignalDetectionTrainingDataFormat.voice8kHz8BitMono
Public Enum ActivationSignalDetectionTrainingDataFormat
Vererbung
ActivationSignalDetectionTrainingDataFormat
Attribute

Windows-Anforderungen

Gerätefamilie
Windows 10, version 2004 (eingeführt in 10.0.19041.0)
API contract
Windows.Foundation.UniversalApiContract (eingeführt in v10.0)

Felder

Audio44kHz16BitMono 6

Trainingsdaten sind generische Audiodaten in 16-Bit 44kHz Mono.

Audio44kHz8BitMono 5

Trainingsdaten sind generische Audiodaten in 8-Bit 44kHz Mono.

Audio48kHz16BitMono 8

Trainingsdaten sind generische Audiodaten in 16-Bit-Mono mit 48 kHz.

Audio48kHz8BitMono 7

Trainingsdaten sind generische Audiodaten in 8-Bit-Mono mit 48 kHz.

AudioOEMDefined 9

Trainingsdaten sind generische Audiodaten in einem format, das von einem Hardwareanbieter angegeben wird.

OtherOEMDefined 10

Trainingsdaten haben ein format, das von einem Hardwareanbieter angegeben wird.

Voice16kHz16BitMono 3

Trainingsdaten sind Sprachaudio in 16-Bit-Mono mit 16 kHz.

Voice16kHz8BitMono 2

Trainingsdaten sind Sprachaudio in 8-Bit-Mono mit 16 kHz.

Voice8kHz16BitMono 1

Trainingsdaten sind Sprachaudio in 16-Bit-Mono mit 8 kHz.

Voice8kHz8BitMono 0

Trainingsdaten sind Sprachaudio in 8 Bit 8kHz Mono.

VoiceOEMDefined 4

Trainingsdaten sind Sprachaudio, die von einem OEM definiert werden.

Hinweise

Digitale Assistent-Anwendungen können Schlüsselwort (keyword) Detektoren trainieren, um die Stimme eines einzelnen Benutzers genauer zu erkennen, indem sie algorithmische Anpassungen auf den Detektor basierend auf Sprachdaten anwenden (der Detektor bietet diese Anpassungen). Beispielsweise trainieren Sie einen gesprochenen Schlüsselwort (keyword)-Detektor, um die Schlüsselwort (keyword) nur dann zu erkennen, wenn sie von einer bestimmten Person gesprochen wird.

Dies wird durch eine Reihe von AktivierungSignalDetectionConfiguration-Trainingsschritten erreicht, bei denen jeder Schritt ein logisches Fragment von Spracheingabedaten verwendet.

Gilt für:

Weitere Informationen