Docker ile metin okuma kapsayıcıları

Makale
09/17/2024

Nöral metinden konuşmaya kapsayıcısı, daha doğal sentezlenmiş konuşmayı sağlayan derin sinir ağı teknolojisini kullanarak metni doğal sesli konuşmaya dönüştürür. Bu makalede, metin okuma kapsayıcısını indirmeyi, yüklemeyi ve çalıştırmayı öğreneceksiniz.

Önkoşullar, bir kapsayıcının çalıştığını doğrulama, aynı konakta birden çok kapsayıcı çalıştırma ve bağlantısı kesilmiş kapsayıcıları çalıştırma hakkında daha fazla bilgi için bkz . Docker ile Konuşma kapsayıcılarını yükleme ve çalıştırma.

Kapsayıcı görüntüleri

Desteklenen tüm sürümler ve yerel ayarlar için nöral metinden konuşmaya kapsayıcı görüntüsü, Microsoft Container Registry (MCR) dağıtımında bulunabilir. Depoda azure-cognitive-services/speechservices/ bulunur ve olarak adlandırılır neural-text-to-speech.

Tam kapsayıcı görüntüsü adı: mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech. En son sürümü almak için belirli bir sürümü ekleme veya ekleme :latest .

Sürüm	Yol
En geç	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` `latest` Etiketi yerel ayarı ve `en-us-arianeural` sesi çeker`en-US`.
3.5.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.5.0-amd64-en-us-arianeural`

dışındaki latesttüm etiketler aşağıdaki biçimdedir ve büyük/küçük harfe duyarlıdır:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

Etiketler, kolaylık sağlamak için JSON biçiminde de kullanılabilir. Gövde kapsayıcı yolunu ve etiket listesini içerir. Etiketler sürüme göre sıralanmamıştır, ancak "latest" bu kod parçacığında gösterildiği gibi her zaman listenin sonuna eklenir:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.5.0-amd64-uk-ua-ostapneural",
    "3.5.0-amd64-zh-cn-xiaochenneural-preview",
    "3.5.0-amd64-zh-cn-xiaohanneural",
    "3.5.0-amd64-zh-cn-xiaomoneural",
    "3.5.0-amd64-zh-cn-xiaoqiuneural-preview",
    "3.5.0-amd64-zh-cn-xiaoruineural",
    "3.5.0-amd64-zh-cn-xiaoshuangneural-preview",
    "3.5.0-amd64-zh-cn-xiaoxiaoneural",
    "3.5.0-amd64-zh-cn-xiaoyanneural-preview",
    "3.5.0-amd64-zh-cn-xiaoyouneural",
    "3.5.0-amd64-zh-cn-yunxineural",
    "3.5.0-amd64-zh-cn-yunyangneural",
    "3.5.0-amd64-zh-cn-yunyeneural",
    "latest"
  ]
}

Önemli

31 Ağustos 2021'de standart konuşma sentezi seslerini ve standart metni konuşma kapsayıcısını kullanımdan kaldırdık. Bunun yerine nöral sesleri nöral metin okuma kapsayıcısı sürüm 3.0 ve üzeri ile kullanmanız gerekir.

29 Şubat 2024'ten itibaren metin okuma ve nöral metinden konuşmaya kapsayıcı 2.19 ve önceki sürümleri desteklenmez. Uygulamanızı güncelleştirme hakkında daha fazla bilgi için bkz . Standart sesten önceden oluşturulmuş sinir sesine geçiş.

Docker çekme ile kapsayıcı görüntüsünü alma

Gerekli donanım da dahil olmak üzere önkoşullara ihtiyacınız vardır. Ayrıca her Konuşma kapsayıcısı için önerilen kaynak ayırma bölümüne bakın.

Microsoft Container Registry'den kapsayıcı görüntüsü indirmek için docker pull komutunu kullanın:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Önemli

latest Etiketi yerel ayarı ve en-us-arianeural sesi çekeren-US. Ek yerel ayarlar ve sesler için bkz . Metinden konuşmaya kapsayıcı görüntüleri.

Kapsayıcıyı docker run ile çalıştırma

Kapsayıcıyı çalıştırmak için docker run komutunu kullanın.

Nöral metinden konuşmaya
Nöral metnin konuşma bağlantısı kesildi

Aşağıdaki tablo çeşitli docker run parametreleri ve bunların karşılık gelen açıklamalarını temsil eder:

Parametre	Açıklama
`{ENDPOINT_URI}`	Uç nokta, ölçüm ve faturalama için gereklidir. Daha fazla bilgi için bkz . faturalama bağımsız değişkenleri.
`{API_KEY}`	API anahtarı gereklidir. Daha fazla bilgi için bkz . faturalama bağımsız değişkenleri.

Metni konuşma kapsayıcısına çalıştırdığınızda, bağlantı noktasını, belleği ve CPU'ları metin okuma kapsayıcısı gereksinimlerine ve önerilerine göre yapılandırın.

Aşağıda yer tutucu değerleri içeren bir örnek docker run komut verilmiştir. ve API_KEY değerlerini belirtmelisinizENDPOINT_URI:

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Şu komut:

Kapsayıcı görüntüsünden sinir metninden konuşma kapsayıcısına doğru bir sinir metni çalıştırır.
6 CPU çekirdeği ve 12 GB bellek ayırır.
TCP bağlantı noktası 5000'i kullanıma sunar ve kapsayıcı için bir sahte TTY ayırır.
Kapsayıcı çıktıktan sonra otomatik olarak kaldırılır. Kapsayıcı görüntüsü ana bilgisayarda hala kullanılabilir.

Bağlantısı kesilmiş kapsayıcıları çalıştırmak için (İnternet'e bağlı değil), bu istek formunu göndermeniz ve onay beklemeniz gerekir. Bağlantısız ortamlarda kapsayıcıları kullanmak için taahhüt planı uygulama ve satın alma hakkında daha fazla bilgi için Azure yapay zeka hizmetleri belgelerindeki Bağlantısız ortamlarda kapsayıcıları kullanma bölümüne bakın.

İnternet bağlantısı kesilmiş kapsayıcıyı çalıştırmanız onaylanırsa, aşağıdaki örnekte kullanılacak komutun biçimlendirmesi docker run yer tutucu değerleriyle gösterilir. Bu yer tutucu değerlerini kendi değerlerinizle değiştirin.

DownloadLicense=True Komutunuzdaki docker run parametre, Docker kapsayıcınızın İnternet'e bağlı olmadığında çalışmasını sağlamak için bir lisans dosyası indirir. Ayrıca, lisans dosyasının kapsayıcıyı çalıştırmak için geçersiz olduğu bir son kullanma tarihi de içerir. Lisans dosyasını yalnızca onayladığınız uygun kapsayıcıyla kullanabilirsiniz. Örneğin, kapsayıcısı olan neural-text-to-speech bir speech-to-text kapsayıcı için lisans dosyası kullanamazsınız.

Yer tutucu	Açıklama
`{IMAGE}`	Kullanmak istediğiniz kapsayıcı görüntüsü. Örneğin: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	Lisansın indirildiği ve bağlandığı yol. Örneğin: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Hizmet isteğinizin kimliğini doğrulamak için uç nokta. Kaynağınızın Anahtar ve uç nokta sayfasında, Azure portalında bulabilirsiniz. Örneğin: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Konuşma kaynağınızın anahtarı. Kaynağınızın Anahtar ve uç nokta sayfasında, Azure portalında bulabilirsiniz.
`{CONTAINER_LICENSE_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu. Örneğin: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Lisans dosyası indirildikten sonra, kapsayıcıyı bağlantısı kesilmiş bir ortamda çalıştırabilirsiniz. Aşağıdaki örnek, kullandığınız komutun yer tutucu değerleriyle biçimlendirmesini docker run gösterir. Bu yer tutucu değerlerini kendi değerlerinizle değiştirin.

Kapsayıcı nerede çalıştırılırsa çalıştırılsın, lisans dosyası kapsayıcıya bağlanmalıdır ve kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu ile Mounts:License=belirtilmelidir. Faturalama kullanım kayıtlarının yazılabilmesi için bir çıkış bağlaması da belirtilmelidir.

Yer tutucu	Değer	Biçim veya örnek
`{IMAGE}`	Kullanmak istediğiniz kapsayıcı görüntüsü. Örneğin: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	Kapsayıcınız için ayrılacak uygun bellek boyutu. Örneğin: `4g`
`{NUMBER_CPUS}`	Kapsayıcınız için ayrılacak uygun CPU sayısı. Örneğin: `4`
`{LICENSE_MOUNT}`	Lisansın bulunduğu ve bağlandığı yol. Örneğin: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Günlüğe kaydetmeye yönelik çıkış yolu. Örneğin: `/host/output:/path/to/output/directory` Daha fazla bilgi için Azure AI hizmetleri belgelerindeki kullanım kayıtlarına bakın.
`{CONTAINER_LICENSE_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu. Örneğin: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki çıkış klasörünün konumu. Örneğin: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Konuşma kapsayıcıları, çalışma zamanında lisans dosyasını ve faturalama günlüğünü yazmak için varsayılan bir dizin sağlar. Varsayılan dizinler sırasıyla /license ve /output dizinleridir.

Komutuyla bu dizinleri kapsayıcıya bağlarken, kapsayıcıyı docker run -v çalıştırmadan önce yerel makine dizininin sahiplik user:group nonroot:nonroot olarak ayarlandığından emin olun.

Dosya/dizin sahipliğini ayarlamak için örnek bir komut aşağıda verilmiştir.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Konuşma kapsayıcıları hakkında docker run daha fazla bilgi için bkz . Docker ile Konuşma kapsayıcılarını yükleme ve çalıştırma.

Kapsayıcıyı kullanma

Konuşma kapsayıcıları, Konuşma SDK'sı ve Konuşma CLI'sı aracılığıyla erişilen websocket tabanlı sorgu uç noktası API'leri sağlar. Varsayılan olarak, Konuşma SDK'sı ve Konuşma CLI'sı genel Konuşma hizmetini kullanır. Kapsayıcıyı kullanmak için başlatma yöntemini değiştirmeniz gerekir.

Önemli

Konuşma hizmetini kapsayıcılarla kullanırken konak kimlik doğrulamasını kullandığınızdan emin olun. Anahtarı ve bölgeyi yapılandırdığınızda istekler genel Konuşma hizmetine gider. Konuşma hizmetinin sonuçları beklediğiniz gibi olmayabilir. Bağlantısı kesilmiş kapsayıcılardan gelen istekler başarısız olur.