Konuşmayı metne dönüştürme için Kendi depolama alanınızı getirin (BYOS) Konuşma kaynağını kullanın

Kendi depolama alanınızı getirin (BYOS), aşağıdaki metin senaryolarında kullanılabilir:

  • Toplu transkripsiyon
  • Ses ve transkripsiyon sonuçları günlüğünün etkinleştirildiği gerçek zamanlı transkripsiyon
  • Özel konuşma

Aynı anda tüm senaryolar için bir konuşma kaynağı ve depolama hesabı çifti kullanılabilir.

Bu makalede, tüm konuşmayı metne dönüştürme senaryolarında BYOS özellikli konuşma kaynağının nasıl kullanılacağı ayrıntılı olarak açıklanmaktadır. Makale, BYOS özellikli konuşma kaynağını ve ilişkili Depolama hesabını tam olarak yapılandırdığınız anlamına gelir.

Veri depolama

KCG kullanırken Konuşma hizmeti, veri işleme (transkripsiyon, model eğitimi, model testi) tamamlandıktan sonra müşteri yapıtlarını tutmaz. Ancak, kullanıcı içeriğinden türetilmiş olmayan bazı meta veriler Konuşma hizmeti şirket içinde depolanır. Örneğin, özel konuşma senaryosunda Hizmet, hangi modelleri kullandıkları gibi özel uç noktalar hakkında belirli bilgileri tutar.

BYOS ile ilişkili Depolama hesabı aşağıdaki verileri depolar:

Not

Bu bölümde isteğe bağlı olarak, KCG ile ilişkili Depolama hesabında belirli yapıtların depolanmasının mümkün olduğu ancak gerekli olmadığı anlamına gelir. Gerekirse başka bir yerde depolanabilir.

Toplu transkripsiyon

  • Kaynak ses (isteğe bağlı)
  • Toplu transkripsiyon sonuçları

Ses ve transkripsiyon sonucu günlüğünün etkinleştirildiği gerçek zamanlı transkripsiyon

  • Ses ve transkripsiyon sonuç günlükleri

Özel konuşma

  • Model eğitimi ve testi için veri kümelerinin kaynak dosyaları (isteğe bağlı)
  • BYOS özellikli Konuşma kaynağı tarafından barındırılan Özel modellerle ilgili tüm veriler ve meta veriler (model eğitimi ve testi için veri kümelerinin kopyaları dahil)

Toplu transkripsiyon

Toplu transkripsiyon, depolamadaki büyük miktarda ses verisinin dökümünü almak için kullanılır. Batch transkripsiyonu hakkında bilginiz yoksa, önce bu makaleye bakın.

BYOS özellikli Konuşma kaynağıyla Batch transkripsiyonu yürütmek için şu adımları gerçekleştirin:

  1. Batch transkripsiyonunu bu kılavuzda açıklandığı gibi başlatın.

    Önemli

    Transkripsiyon isteğinizde parametre kullanmayın destinationContainerUrl . BYOS kullanıyorsanız, transkripsiyon sonuçları KCG ile ilişkili Depolama hesabında otomatik olarak depolanır.

    Parametresini kullanırsanız destinationContainerUrl , bu işlem çalışır ancak geçici SAS kullanımı nedeniyle verileriniz için önemli ölçüde daha az güvenlik sağlar. Ayrıntılar için buraya bakın.

  2. Transkripsiyon tamamlandığında, bu kılavuza göre transkripsiyon sonuçlarını alın. parametresini kullanmayı sasValidityInSeconds göz önünde bulundurun (aşağıdaki bölüme bakın).

Konuşma hizmeti, ara ve son transkripsiyon sonuçlarını depolamak için KCG ile ilişkili Depolama hesabında Blob kapsayıcısını kullanır customspeech-artifacts .

Dikkat

Konuşma hizmeti, Batch transkripsiyon modülünün düzgün çalışması için önceden tanımlanmış Blob kapsayıcı yollarına ve dosya adlarına dayanır. Kapsayıcı içeriğini taşımayın, yeniden adlandırmayın veya hiçbir şekilde değiştirmeyin customspeech-artifacts .

Bunun yapılmaması büyük olasılıkla 4xx ve 5xx Hizmet hatalarını ayıklamanın zor olmasıyla sonuçlanır.

Ayrıca doğrudan kapsayıcı dosyalarını ve klasörlerini kullanan çözümler oluşturmayın customspeech-artifacts . Batch transkripsiyonuyla etkileşime geçmek için standart araçları kullanın. Batch transkripsiyonu bölümündeki ayrıntılara bakın.

REST API aracılığıyla Batch transkripsiyon sonuçlarını alma

Konuşmayı metne dönüştürme REST API'si , BYOS özellikli Konuşma kaynaklarını tam olarak destekler. Ancak, veriler artık BYOS özellikli Depolama hesabında depolandığından, Transkripsiyon Dosyalarını Al gibi istekler Konuşma hizmeti iç kaynakları yerine BYOS ile ilişkili Depolama hesabı Blob depolama alanıyla etkileşim kurar. Hem "normal" hem de BYOS özellikli Konuşma kaynakları için aynı REST API tabanlı kodun kullanılmasına izin verir.

En yüksek güvenlik için, veri dosyası URL'lerini döndüren ve Transkripsiyon Dosyalarını Al isteği gibi veri dosyası URL'lerini döndüren değere sahip 0 parametresini kullanınsasValidityInSeconds. Örnek istek URL'si aşağıda verilmişti:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

Böyle bir istek, veri dosyalarına (SAS veya diğer eklemeler olmadan) doğrudan Depolama Hesabı URL'lerini döndürür. Örneğin:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

Bu biçimin URL'si yalnızca yeterli erişim haklarına (Depolama Blob Veri Okuyucusu rolü gibi) sahip Microsoft Entra kimliklerinin (kullanıcılar, hizmet sorumluları, yönetilen kimlikler) URL'den verilere erişebilmesini sağlar.

Uyarı

sasValidityInSeconds Transkripsiyon Dosyalarını Al isteğinde veya benzerlerinde parametre atlanırsa, döndürülen her veri dosyası URL'si için 5 günlük geçerliliğe sahip bir Kullanıcı temsilcisi SAS'si oluşturulur. Bu SAS, BYOS özellikli Konuşma kaynağınızın sistem tarafından atanan yönetilen kimliği tarafından imzalanır. Bu nedenle, depolama hesabı anahtarı erişimi devre dışı bırakılıyor olsa bile SAS verilere erişime izin verir. Ayrıntılar için buraya bakın.

Ses ve transkripsiyon sonucu günlüğünün etkinleştirildiği gerçek zamanlı transkripsiyon

Konuşmayı metne dönüştürme veya konuşma çevirisi kullanırken hem ses girişi hem de tanınan konuşma için günlüğe kaydetmeyi etkinleştirebilirsiniz. Bu makaledeki tam açıklamaya bakın.

BYOS kullanıyorsanız, günlükleri customspeech-audiologs BYOS ile ilişkili Depolama hesabında Blob kapsayıcısında bulabilirsiniz.

Uyarı

Günlük verileri 5 gün boyunca tutulur. Bu süreden sonra günlükler otomatik olarak silinir. Bu, BYOS özellikli Konuşma kaynakları için de geçerlidir. Günlükleri daha uzun tutmak istiyorsanız, blob kapsayıcısından customspeech-audiologs doğrudan ilgili dosya ve klasörleri kopyalayın veya REST API'yi kullanın.

REST API aracılığıyla gerçek zamanlı transkripsiyon günlükleri alma

Konuşmayı metne dönüştürme REST API'si , BYOS özellikli Konuşma kaynaklarını tam olarak destekler. Ancak, veriler artık BYOS özellikli Depolama hesabında depolandığından, Temel Model Günlüklerini Al gibi istekler Konuşma hizmeti iç kaynakları yerine BYOS ile ilişkili Depolama hesabı Blob depolama alanıyla etkileşim kurar. Hem "normal" hem de BYOS özellikli Konuşma kaynakları için aynı REST API tabanlı kodun kullanılmasına izin verir.

En yüksek güvenlik için, veri dosyası URL'lerini döndüren ve Temel Model Günlüklerini Alma isteği gibi isteklerde değerine ayarlanmış 0 parametresini kullanınsasValidityInSeconds. Örnek istek URL'si aşağıda verilmişti:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

Böyle bir istek, veri dosyalarına (SAS veya diğer eklemeler olmadan) doğrudan Depolama Hesabı URL'lerini döndürür. Örneğin:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

Bu biçimin URL'si yalnızca yeterli erişim haklarına (Depolama Blob Veri Okuyucusu rolü gibi) sahip Microsoft Entra kimliklerinin (kullanıcılar, hizmet sorumluları, yönetilen kimlikler) URL'den verilere erişebilmesini sağlar.

Uyarı

sasValidityInSeconds Temel Model Günlüklerini Alma isteğinde veya benzerlerinde parametre atlanırsa, döndürülen her veri dosyası URL'si için 5 günlük geçerliliğe sahip bir Kullanıcı temsilcisi SAS'si oluşturulur. Bu SAS, BYOS özellikli Konuşma kaynağınızın sistem tarafından atanan yönetilen kimliği tarafından imzalanır. Bu nedenle, depolama hesabı anahtarı erişimi devre dışı bırakılıyor olsa bile SAS verilere erişime izin verir. Ayrıntılar için buraya bakın.

Özel konuşma

Özel konuşma ile uygulamalarınız ve ürünleriniz için konuşma tanımanın doğruluğunu değerlendirebilir ve geliştirebilirsiniz. Özel konuşma modeli, gerçek zamanlı konuşmayı metne dönüştürme, konuşma çevirisi ve toplu transkripsiyon için kullanılabilir. Daha fazla bilgi için bkz . özel konuşmaya genel bakış.

BYOS özellikli Konuşma kaynağıyla özel konuşma kullanma konusunda özel bir şey yoktur. Tek fark, Konuşma hizmetinin sizin için topladığı ve ürettiği özel modelle ilgili tüm verilerin depolandığı yerdir. Veriler, BYOS ile ilişkili Depolama hesabının aşağıdaki Blob kapsayıcılarında depolanır:

  • customspeech-models - Özel konuşma modellerinin konumu
  • customspeech-artifacts - Diğer tüm özel konuşmayla ilgili verilerin konumu

Blob kapsayıcı yapısı yalnızca bilgileriniz için sağlanır ve bildirimde bulunmadan değiştirilebilir.

Dikkat

Konuşma hizmeti, özel konuşma modülünün düzgün çalışması için önceden tanımlanmış Blob kapsayıcı yollarına ve dosya adlarına dayanır. Kapsayıcının içeriğini customspeech-models ve özel konuşmayla ilgili kapsayıcı klasörlerini taşımayın, yeniden adlandırmayın veya hiçbir şekilde değiştirmeyin customspeech-artifacts .

Bunun yapılmaması büyük olasılıkla hata ayıklamanın zorlanmasına neden olur ve özel model yeniden eğitme gereksinimine yol açabilir.

Ayrıca doğrudan kapsayıcı dosyalarını ve klasörlerini kullanan çözümler oluşturmayın customspeech-artifacts . Özel konuşmayla ilgili verilerle etkileşime geçmek için REST API ve Speech Studio gibi standart araçları kullanın. Özel konuşma bölümündeki ayrıntılara bakın.

Rest API'nin özel konuşmayla kullanımı

Konuşmayı metne dönüştürme REST API'si , BYOS özellikli Konuşma kaynaklarını tam olarak destekler. Ancak, veriler artık BYOS özellikli Depolama hesabında depolandığından, Datasets_ListFiles gibi istekler Konuşma hizmeti iç kaynakları yerine BYOS ile ilişkili Depolama hesabı Blob depolamasıyla etkileşim kurar. Hem "normal" hem de BYOS özellikli Konuşma kaynakları için aynı REST API tabanlı kodun kullanılmasına izin verir.

En yüksek güvenlik için, veri dosyası URL'lerini döndüren veri dosyası URL'leri (Veri Kümesi Dosyalarını Al isteği gibi) değeri isteklerde olarak ayarlanmış 0 parametresini kullanınsasValidityInSeconds. Örnek istek URL'si aşağıda verilmişti:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

Böyle bir istek, veri dosyalarına (SAS veya diğer eklemeler olmadan) doğrudan Depolama Hesabı URL'lerini döndürür. Örneğin:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

Bu biçimin URL'si yalnızca yeterli erişim haklarına (Depolama Blob Veri Okuyucusu rolü gibi) sahip Microsoft Entra kimliklerinin (kullanıcılar, hizmet sorumluları, yönetilen kimlikler) URL'den verilere erişebilmesini sağlar.

Uyarı

sasValidityInSeconds Veri Kümesi Dosyalarını Al isteğinde veya benzerlerinde parametre atlanırsa, döndürülen her veri dosyası URL'si için 5 günlük geçerliliğe sahip bir Kullanıcı temsilcisi SAS'si oluşturulur. Bu SAS, BYOS özellikli Konuşma kaynağınızın sistem tarafından atanan yönetilen kimliği tarafından imzalanır. Bu nedenle, depolama hesabı anahtarı erişimi devre dışı bırakılıyor olsa bile SAS verilere erişime izin verir. Ayrıntılar için buraya bakın.

Sonraki adımlar