Migrowanie z niestandardowego głosu do niestandardowego neuronowego głosu

Artykuł
09/20/2024

Ważne

29 lutego 2024 r. wycofano standardową, nienależącą do neuronowej warstwy trenowania głosu niestandardowego. Przed 29 lutego 2024 r. można było użyć nienadobowego głosu niestandardowego z zasobem usługi Mowa. Teraz możesz używać tylko niestandardowego neuronowego głosu z zasobami usługi Mowa. Jeśli masz niestandardowy głos nienależące do neuronowego, musisz przeprowadzić migrację do niestandardowego neuronowego głosu.

Niestandardowy neuronowy głos umożliwia tworzenie modeli głosowych o wyższej jakości, jednocześnie wymagając mniejszej ilości danych. Możesz rozwijać bardziej realistyczne, naturalne i konwersacyjne głosy. Klienci i użytkownicy końcowi korzystają z najnowszej technologii zamiany tekstu na mowę w odpowiedzialny sposób.

Głos niestandardowy	Niestandardowy neuronowy głos
Standardowa lub "tradycyjna" metoda niestandardowego głosu dzieli język mówiony na fonetyczne fragmenty kodu, które można ponownie mieszać i dopasowywać przy użyciu klasycznego programowania lub metod statystycznych.	Niestandardowy neuronowy głos syntetyzuje mowę przy użyciu głębokich sieci neuronowych, które "nauczyły się", sposób, w jaki fonetyka jest łączona w naturalnej ludzkiej mowie — a nie przy użyciu klasycznego programowania lub metod statystycznych.
Niestandardowy głos¹ wymaga dużej ilości danych głosowych w celu utworzenia bardziej podobnego do człowieka modelu głosu. Przy mniejszej liczbie zarejestrowanych linii standardowy niestandardowy model głosu wydaje się brzmieć bardziej oczywiście robotyczny.	Niestandardowa funkcja neuronowego głosu umożliwia tworzenie unikatowego głosu marki w wielu językach i stylach przy użyciu małego zestawu nagrań.

¹ Podczas tworzenia niestandardowego modelu głosowego maksymalna liczba plików danych, które mogą być importowane na subskrypcję, to 10 plików .zip dla użytkowników bezpłatnej subskrypcji (F0) i 500 dla użytkowników subskrypcji standardowej (S0).

Wymagana akcja

Aby można było przeprowadzić migrację do niestandardowego neuronowego głosu, aplikacja musi zostać zaakceptowana. Dostęp do niestandardowej neuronowej usługi głosowej podlega wyłącznemu uznaniu firmy Microsoft na podstawie naszych kryteriów kwalifikowalności. Musisz zobowiązać się do korzystania z niestandardowego neuronowego głosu zgodnie z naszymi zasadami odpowiedzialnej sztucznej inteligencji i kodeksem postępowania.

Napiwek

Nawet bez konta platformy Azure możesz słuchać przykładów głosowych w usłudze Speech Studio i określać właściwy głos dla Twoich potrzeb biznesowych.

Dowiedz się więcej o naszych zasadach dotyczących limitu dostępu , a następnie zastosuj tutaj.
Po zatwierdzeniu aplikacji otrzymasz dostęp do funkcji trenowania "neuronowego". Upewnij się, że logujesz się do usługi Speech Studio przy użyciu tej samej subskrypcji platformy Azure podanej w aplikacji.
Zanim będzie można wytrenować i wdrożyć niestandardowy model głosu, musisz utworzyć profil talentów głosowych. Profil wymaga pliku audio zarejestrowanego przez talent głosowy wyrażający zgodę na użycie danych mowy w celu wytrenowania niestandardowego modelu głosu.
Zaktualizuj kod w aplikacjach, jeśli utworzono nowy punkt końcowy przy użyciu nowego modelu.

Niestandardowe szczegóły głosu (przestarzałe)

Zapoznaj się z poniższymi sekcjami, aby uzyskać szczegółowe informacje na temat głosu niestandardowego.

Obsługa języków

Niestandardowy głos obsługuje następujące języki (ustawienia regionalne).

Język	Ustawienia regionalne
Chiński (mandaryński, uproszczony)	`zh-CN`
Chiński (mandaryński, uproszczony), angielski dwujęzyczny	`zh-CN` dwujęzyczny
Angielski (Indie)	`en-IN`
Angielski (Zjednoczone Królestwo)	`en-GB`
Angielski (Stany Zjednoczone)	`en-US`
Francuski (Francja)	`fr-FR`
Niemiecki (Niemcy)	`de-DE`
Włoski (Włochy)	`it-IT`
Portugalski (Brazylia)	`pt-BR`
Hiszpański (Meksyk)	`es-MX`

Pomoc techniczna regionalna

Jeśli utworzono niestandardową czcionkę głosową, użyj utworzonego punktu końcowego. Możesz również użyć punktów końcowych wymienionych w tej sekcji, zastępując element {deploymentId} identyfikatorem wdrożenia modelu głosowego.

Region (Region)	Punkt końcowy
Australia Wschodnia	`https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Brazylia Południowa	`https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Kanada Środkowa	`https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Central US	`https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Azja Wschodnia	`https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
East US	`https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Wschodnie stany USA 2	`https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Francja Środkowa	`https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Indie Środkowe	`https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Japonia Wschodnia	`https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Japonia Zachodnia	`https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Korea Środkowa	`https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Północno-środkowe stany USA	`https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Europa Północna	`https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
South Central US	`https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Southeast Asia	`https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Południowe Zjednoczone Królestwo	`https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
West Europe	`https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Zachodnio-środkowe stany USA	`https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Zachodnie stany USA	`https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Zachodnie stany USA 2	`https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`

Następne kroki

Wypróbuj niestandardowy neuronowy głos

Udostępnij za pośrednictwem