Kontejnery převodu textu na řeč pomocí Dockeru

Článek
10/16/2024

Neurální text na řečový kontejner převádí text na přirozeně znějící řeč pomocí technologie hluboké neurální sítě, která umožňuje přirozenější syntetizovanou řeč. V tomto článku se dozvíte, jak stáhnout, nainstalovat a spustit kontejner Převod textu na řeč.

Další informace o požadavcích, ověření, že je kontejner spuštěný, běží více kontejnerů na stejném hostiteli a spuštěné odpojené kontejnery, najdete v tématu Instalace a spouštění kontejnerů Služby Speech pomocí Dockeru.

Image kontejneru

Neurální text na image kontejneru řeči pro všechny podporované verze a národní prostředí najdete v syndikátu Microsoft Container Registry (MCR). Nachází se v úložišti azure-cognitive-services/speechservices/ a má název neural-text-to-speech.

Plně kvalifikovaný název image kontejneru je . mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech Připojte konkrétní verzi nebo připojte :latest , abyste získali nejnovější verzi.

Verze	Cesta
Nejpozdější	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` Značka `latest` stáhne `en-US` národní prostředí a `en-us-arianeural` hlas.
3.5.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.5.0-amd64-en-us-arianeural`

Všechny značky, s výjimkou latest, jsou v následujícím formátu a rozlišují malá a velká písmena:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

Značky jsou také k dispozici ve formátu JSON pro usnadnění. Tělo obsahuje cestu ke kontejneru a seznam značek. Značky nejsou seřazené podle verze, ale "latest" jsou vždy zahrnuty na konci seznamu, jak je znázorněno v tomto fragmentu kódu:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.5.0-amd64-uk-ua-ostapneural",
    "3.5.0-amd64-zh-cn-xiaochenneural-preview",
    "3.5.0-amd64-zh-cn-xiaohanneural",
    "3.5.0-amd64-zh-cn-xiaomoneural",
    "3.5.0-amd64-zh-cn-xiaoqiuneural-preview",
    "3.5.0-amd64-zh-cn-xiaoruineural",
    "3.5.0-amd64-zh-cn-xiaoshuangneural-preview",
    "3.5.0-amd64-zh-cn-xiaoxiaoneural",
    "3.5.0-amd64-zh-cn-xiaoyanneural-preview",
    "3.5.0-amd64-zh-cn-xiaoyouneural",
    "3.5.0-amd64-zh-cn-yunxineural",
    "3.5.0-amd64-zh-cn-yunyangneural",
    "3.5.0-amd64-zh-cn-yunyeneural",
    "latest"
  ]
}

Důležité

31. srpna 2021 jsme vyřadili standardní hlasy syntézy řeči a standardní text do kontejneru řeči . Místo toho byste měli používat neurální hlasy s kontejnerem 3.0 pro neurální text-převod řeči verze 3.0 a vyšší.

Od 29. února 2024 se text na řeč a neurální text do kontejneru speech verze 2.19 a starší nepodporuje. Další informace o aktualizaci aplikace najdete v tématu Migrace ze standardního hlasu na předem připravený neurální hlas.

Získání image kontejneru pomocí docker pull

Potřebujete požadavky, včetně požadovaného hardwaru. Podívejte se také na doporučené přidělení prostředků pro každý kontejner služby Speech.

Pomocí příkazu docker pull stáhněte image kontejneru ze služby Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Důležité

Značka latest stáhne en-US národní prostředí a en-us-arianeural hlas. Další národní prostředí a hlasy najdete v textu na image kontejnerů řeči.

Spuštění kontejneru pomocí dockeru run

Ke spuštění kontejneru použijte příkaz docker run.

Neurální text na řeč
Odpojený neurální text k řeči

Následující tabulka představuje různé docker run parametry a jejich odpovídající popisy:

Parametr	Popis
`{ENDPOINT_URI}`	Koncový bod se vyžaduje pro měření a fakturaci. Další informace najdete v tématu Fakturační argumenty.
`{API_KEY}`	Vyžaduje se klíč rozhraní API. Další informace najdete v tématu Fakturační argumenty.

Když spustíte kontejner převodu textu na řeč, nakonfigurujte port, paměť a procesor podle požadavků a doporučení pro kontejner řeči podle textu.

Tady je ukázkový docker run příkaz se zástupnými hodnotami. Musíte zadat ENDPOINT_URI hodnoty a API_KEY hodnoty:

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Tento příkaz:

Spustí neurální text do kontejneru řeči z image kontejneru.
Přidělí 6 jader procesoru a 12 GB paměti.
Zpřístupní port TCP 5000 a přidělí pro kontejner pseudo-TTY.
Po ukončení kontejneru se automaticky odebere. Image kontejneru je stále dostupná na hostitelském počítači.

Pokud chcete spustit odpojené kontejnery (nepřipojené k internetu), musíte odeslat tento formulář žádosti a počkat na schválení. Další informace o použití a zakoupení plánu závazku k používání kontejnerů v odpojených prostředích najdete v tématu Použití kontejnerů v odpojených prostředích v dokumentaci ke službám Azure AI.

Pokud jste schváleni ke spuštění kontejneru odpojeného od internetu, následující příklad ukazuje formátování docker run příkazu, který se má použít, se zástupnými hodnotami. Nahraďte tyto zástupné hodnoty vlastními hodnotami.

Parametr DownloadLicense=True v docker run příkazu stáhne licenční soubor, aby se kontejner Dockeru spustil, když není připojený k internetu. Obsahuje také datum vypršení platnosti, po kterém je soubor licence neplatný pro spuštění kontejneru. Soubor s licencí můžete použít pouze s příslušným kontejnerem, pro který jste schváleni. Například pro kontejner s kontejnerem neural-text-to-speech nemůžete použít licenční souborspeech-to-text.

Zástupný symbol	Popis
`{IMAGE}`	Image kontejneru, kterou chcete použít. Příklad: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	Cesta, kam se licence stáhne, a připojí se. Příklad: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Koncový bod pro ověření vaší žádosti o služby. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na webu Azure Portal. Příklad: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Klíč pro váš prostředek služby Speech. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na webu Azure Portal.
`{CONTAINER_LICENSE_DIRECTORY}`	Umístění složky s licencí v místním systému souborů kontejneru. Příklad: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Po stažení souboru licence můžete kontejner spustit v odpojeném prostředí. Následující příklad ukazuje formátování používaného docker run příkazu se zástupnými hodnotami. Nahraďte tyto zástupné hodnoty vlastními hodnotami.

Všude, kde je kontejner spuštěný, musí být soubor licence připojen ke kontejneru a umístění složky s licencí v místním systému souborů kontejneru musí být zadáno pomocí Mounts:License=. Musí být zadán také výstupní připojení, aby bylo možné zapsat záznamy o využití fakturace.

Zástupný symbol	Hodnota	Formát nebo příklad
`{IMAGE}`	Image kontejneru, kterou chcete použít. Příklad: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	Odpovídající velikost paměti, která se má přidělit pro váš kontejner. Příklad: `4g`
`{NUMBER_CPUS}`	Odpovídající počet procesorů pro přidělení kontejneru. Příklad: `4`
`{LICENSE_MOUNT}`	Cesta, kde je licence umístěna a připojena. Příklad: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Výstupní cesta pro protokolování. Příklad: `/host/output:/path/to/output/directory` Další informace najdete v záznamech o využití v dokumentaci ke službám Azure AI.
`{CONTAINER_LICENSE_DIRECTORY}`	Umístění složky s licencí v místním systému souborů kontejneru. Příklad: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Umístění výstupní složky v místním systému souborů kontejneru Příklad: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Kontejnery služby Speech poskytují výchozí adresář pro zápis licenčního souboru a fakturačního protokolu za běhu. Výchozí adresáře jsou /license a /output.

Když tyto adresáře připojíte ke kontejneru pomocí docker run -v příkazu, před spuštěním kontejneru se ujistěte, že je adresář místního počítače nastavený na user:group nonroot:nonroot vlastnictví.

Tady je ukázkový příkaz pro nastavení vlastnictví souboru nebo adresáře.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Další informace o kontejnerech služby Speech najdete v docker run tématu Instalace a spouštění kontejnerů služby Speech pomocí Dockeru.

Použití kontejneru

Kontejnery služby Speech poskytují rozhraní API koncových bodů dotazů založených na websocketu, ke kterým se přistupuje prostřednictvím sady Speech SDK a rozhraní příkazového řádku služby Speech. Sada Speech SDK a Rozhraní příkazového řádku služby Speech ve výchozím nastavení používají veřejnou službu Speech. Pokud chcete kontejner použít, musíte změnit inicializační metodu.

Důležité

Pokud používáte službu Speech s kontejnery, nezapomeňte použít ověřování hostitele. Pokud nakonfigurujete klíč a oblast, požadavky budou chodit do veřejné služby Speech. Výsledky ze služby Speech nemusí být to, co očekáváte. Požadavky z odpojených kontejnerů selžou.