Docker ile metin kapsayıcılarına konuşma

Makale
09/17/2024

Konuşmayı metne dönüştürme kapsayıcısı, ara sonuçlarla gerçek zamanlı konuşma veya toplu ses kayıtlarının dökümünü alır. Bu makalede, metin kapsayıcısını indirmeyi, yüklemeyi ve konuşmayı çalıştırmayı öğreneceksiniz.

Önkoşullar, bir kapsayıcının çalıştığını doğrulama, aynı konakta birden çok kapsayıcı çalıştırma ve bağlantısı kesilmiş kapsayıcıları çalıştırma hakkında daha fazla bilgi için bkz . Docker ile Konuşma kapsayıcılarını yükleme ve çalıştırma.

Kapsayıcı görüntüleri

Desteklenen tüm sürümler ve yerel ayarlar için Konuşmayı metne dönüştürme kapsayıcı görüntüsü Microsoft Container Registry (MCR) dağıtımında bulunabilir. Depoda azure-cognitive-services/speechservices/ bulunur ve olarak adlandırılır speech-to-text.

Tam kapsayıcı görüntüsü adı: mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text. En son sürümü almak için belirli bir sürümü ekleme veya ekleme :latest .

Sürüm	Yol
En geç	`mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest` etiketi, `latest` yerel ayar için `en-US` en son görüntüyü çeker.
4.10.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:4.10.0-amd64-mr-in`

dışındaki latesttüm etiketler aşağıdaki biçimdedir ve büyük/küçük harfe duyarlıdır:

<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>

Etiketler, kolaylık sağlamak için JSON biçiminde de kullanılabilir. Gövde kapsayıcı yolunu ve etiket listesini içerir. Etiketler sürüme göre sıralanmamıştır, ancak "latest" bu kod parçacığında gösterildiği gibi her zaman listenin sonuna eklenir:

{
  "name": "azure-cognitive-services/speechservices/speech-to-text",
  "tags": [
    <--redacted for brevity-->    
    "4.10.0-amd64-sw-tz",
    "4.10.0-amd64-ta-in",
    "4.10.0-amd64-th-th",
    "4.10.0-amd64-tr-tr",
    "4.10.0-amd64-vi-vn",
    "4.10.0-amd64-wuu-cn",
    "4.10.0-amd64-yue-cn",
    "4.10.0-amd64-zh-cn",
    "4.10.0-amd64-zh-cn-sichuan",
    "4.10.0-amd64-zh-hk",
    "4.10.0-amd64-zh-tw",
    "4.10.0-amd64-zu-za",
    "latest"
  ]
}

Docker çekme ile kapsayıcı görüntüsünü alma

Gerekli donanım da dahil olmak üzere önkoşullara ihtiyacınız vardır. Ayrıca her Konuşma kapsayıcısı için önerilen kaynak ayırma bölümüne bakın.

Microsoft Container Registry'den kapsayıcı görüntüsü indirmek için docker pull komutunu kullanın:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Önemli

etiketi, latest yerel ayar için en-US en son görüntüyü çeker. Ek sürümler ve yerel ayarlar için bkz . Konuşmayı metin kapsayıcı görüntülerine dönüştürme.

Kapsayıcıyı docker run ile çalıştırma

Kapsayıcıyı çalıştırmak için docker run komutunu kullanın.

Konuşmayı metne dönüştürme
Konuşmayı metne dönüştürme bağlantısı kesildi

Aşağıdaki tablo çeşitli docker run parametreleri ve bunların karşılık gelen açıklamalarını temsil eder:

Parametre	Açıklama
`{ENDPOINT_URI}`	Uç nokta, ölçüm ve faturalama için gereklidir. Daha fazla bilgi için bkz . faturalama bağımsız değişkenleri.
`{API_KEY}`	API anahtarı gereklidir. Daha fazla bilgi için bkz . faturalama bağımsız değişkenleri.

Konuşmayı metin kapsayıcısına çalıştırdığınızda bağlantı noktasını, belleği ve CPU'sunu metin kapsayıcısı gereksinimlerine ve önerilerine göre yapılandırın.

Aşağıda yer tutucu değerleri içeren bir örnek docker run komut verilmiştir. ve API_KEY değerlerini belirtmelisinizENDPOINT_URI:

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Şu komut:

Kapsayıcı görüntüsünden bir speech-to-text kapsayıcı çalıştırır.
4 CPU çekirdeği ve 8 GB bellek ayırır.
TCP bağlantı noktası 5000'i kullanıma sunar ve kapsayıcı için bir sahte TTY ayırır.
Kapsayıcı çıktıktan sonra otomatik olarak kaldırılır. Kapsayıcı görüntüsü ana bilgisayarda hala kullanılabilir.

Bağlantısı kesilmiş kapsayıcıları çalıştırmak için (İnternet'e bağlı değil), bu istek formunu göndermeniz ve onay beklemeniz gerekir. Bağlantısız ortamlarda kapsayıcıları kullanmak için taahhüt planı uygulama ve satın alma hakkında daha fazla bilgi için Azure yapay zeka hizmetleri belgelerindeki Bağlantısız ortamlarda kapsayıcıları kullanma bölümüne bakın.

İnternet bağlantısı kesilmiş kapsayıcıyı çalıştırmanız onaylanırsa, aşağıdaki örnekte kullanılacak komutun biçimlendirmesi docker run yer tutucu değerleriyle gösterilir. Bu yer tutucu değerlerini kendi değerlerinizle değiştirin.

DownloadLicense=True Komutunuzdaki docker run parametre, Docker kapsayıcınızın İnternet'e bağlı olmadığında çalışmasını sağlamak için bir lisans dosyası indirir. Ayrıca, lisans dosyasının kapsayıcıyı çalıştırmak için geçersiz olduğu bir son kullanma tarihi de içerir. Lisans dosyasını yalnızca onayladığınız uygun kapsayıcıyla kullanabilirsiniz. Örneğin, kapsayıcısı olan neural-text-to-speech bir speech-to-text kapsayıcı için lisans dosyası kullanamazsınız.

Yer tutucu	Açıklama
`{IMAGE}`	Kullanmak istediğiniz kapsayıcı görüntüsü. Örneğin: `mcr.microsoft.com/azure-cognitive-services/speech-to-text:latest`
`{LICENSE_MOUNT}`	Lisansın indirildiği ve bağlandığı yol. Örneğin: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Hizmet isteğinizin kimliğini doğrulamak için uç nokta. Kaynağınızın Anahtar ve uç nokta sayfasında, Azure portalında bulabilirsiniz. Örneğin: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Konuşma kaynağınızın anahtarı. Kaynağınızın Anahtar ve uç nokta sayfasında, Azure portalında bulabilirsiniz.
`{CONTAINER_LICENSE_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu. Örneğin: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Lisans dosyası indirildikten sonra, kapsayıcıyı bağlantısı kesilmiş bir ortamda çalıştırabilirsiniz. Aşağıdaki örnek, kullandığınız komutun yer tutucu değerleriyle biçimlendirmesini docker run gösterir. Bu yer tutucu değerlerini kendi değerlerinizle değiştirin.

Kapsayıcı nerede çalıştırılırsa çalıştırılsın, lisans dosyası kapsayıcıya bağlanmalıdır ve kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu ile Mounts:License=belirtilmelidir. Faturalama kullanım kayıtlarının yazılabilmesi için bir çıkış bağlaması da belirtilmelidir.

Yer tutucu	Değer	Biçim veya örnek
`{IMAGE}`	Kullanmak istediğiniz kapsayıcı görüntüsü. Örneğin: `mcr.microsoft.com/azure-cognitive-services/speech-to-text:latest`
`{MEMORY_SIZE}`	Kapsayıcınız için ayrılacak uygun bellek boyutu. Örneğin: `4g`
`{NUMBER_CPUS}`	Kapsayıcınız için ayrılacak uygun CPU sayısı. Örneğin: `4`
`{LICENSE_MOUNT}`	Lisansın bulunduğu ve bağlandığı yol. Örneğin: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Günlüğe kaydetmeye yönelik çıkış yolu. Örneğin: `/host/output:/path/to/output/directory` Daha fazla bilgi için Azure AI hizmetleri belgelerindeki kullanım kayıtlarına bakın.
`{CONTAINER_LICENSE_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki lisans klasörünün konumu. Örneğin: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Kapsayıcının yerel dosya sistemindeki çıkış klasörünün konumu. Örneğin: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Konuşma kapsayıcıları, çalışma zamanında lisans dosyasını ve faturalama günlüğünü yazmak için varsayılan bir dizin sağlar. Varsayılan dizinler sırasıyla /license ve /output dizinleridir.

Komutuyla bu dizinleri kapsayıcıya bağlarken, kapsayıcıyı docker run -v çalıştırmadan önce yerel makine dizininin sahiplik user:group nonroot:nonroot olarak ayarlandığından emin olun.

Dosya/dizin sahipliğini ayarlamak için örnek bir komut aşağıda verilmiştir.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Konuşma kapsayıcıları hakkında docker run daha fazla bilgi için bkz . Docker ile Konuşma kapsayıcılarını yükleme ve çalıştırma.

Kapsayıcıyı kullanma

Konuşma kapsayıcıları, Konuşma SDK'sı ve Konuşma CLI'sı aracılığıyla erişilen websocket tabanlı sorgu uç noktası API'leri sağlar. Varsayılan olarak, Konuşma SDK'sı ve Konuşma CLI'sı genel Konuşma hizmetini kullanır. Kapsayıcıyı kullanmak için başlatma yöntemini değiştirmeniz gerekir.

Önemli

Konuşma hizmetini kapsayıcılarla kullanırken konak kimlik doğrulamasını kullandığınızdan emin olun. Anahtarı ve bölgeyi yapılandırdığınızda istekler genel Konuşma hizmetine gider. Konuşma hizmetinin sonuçları beklediğiniz gibi olmayabilir. Bağlantısı kesilmiş kapsayıcılardan gelen istekler başarısız olur.