Azure AI Video Indexer ile dil modelini özelleştirme

Azure AI Video Indexer, Microsoft Özel Konuşma Tanıma Hizmeti ile tümleştirme aracılığıyla otomatik konuşma tanımayı destekler. Uyarlama metnini karşıya yükleyerek dil modelini özelleştirebilirsiniz. Bu metin, altyapının uyum sağlamak için kullanmasını istediğiniz kelime dağarcığını kullanmak istediğiniz etki alanından gelir. Modelinizi eğittikte, varsayılan söyleniş varsayılarak uyarlama metninde görünen yeni sözcükler tanınır ve dil modeli olası yeni sözcük dizilerini öğrenir. Desteklenen langue'lerde Azure AI Video Indexer dilleri tarafından desteklenenler listesine bakın.

Örneğin, "Kubernetes" (Azure Kubernetes hizmeti bağlamında), son derece özel bir sözcük. Bu sözcük Azure AI Video Indexer'da yeni olduğundan "topluluklar" olarak kabul edilir. Modeli "Kubernetes" olarak tanıyacak şekilde eğitin. Diğer durumlarda, sözcükler vardır, ancak dil modeli bunların belirli bir bağlamda görünmesini beklemiyor. Örneğin, "kapsayıcı hizmeti", özel olmayan bir dil modelinin belirli bir sözcük kümesi olarak tanıyacağı 2 sözcüklü bir dizi değildir.

Dil modelini özelleştirmenin iki yolu vardır:

  • 1. Seçenek: Azure AI Video Indexer tarafından oluşturulan dökümü düzenleyin. Transkripti düzenleyip düzelterek, gelecekte daha iyi sonuçlar sağlamak için bir dil modeli eğitmiş olursunuz.
  • Seçenek 2: Dil modelini eğitmek için metin dosyalarını karşıya yükleyin. Dosya, Video Indexer transkriptinde görünmesini istediğiniz sözcüklerin listesini veya cümle ve paragraflarda doğal olarak bulunan ilgili sözcükleri içerebilir. İkinci yaklaşımda daha iyi sonuçlar elde edildikçe, karşıya yükleme dosyasının içeriğinizle ilgili tümceleri veya paragrafları içermesi önerilir.

Önemli

Şu anda yanlış yazılmış olan sözcükleri veya cümleleri (örneğin, "topluluklar"), hedeflenen etkiyi olumsuz etkileyeceði için karşıya yükleme dosyasına eklemeyin. Sözcükleri yalnızca görünmesini istediğiniz şekilde ekleyin (örneğin, "Kubernetes").

Özel dil modelinizi iyileştirme

Azure AI Video Indexer, sözcük birleşimlerinin olasılıklarını temel alarak öğrenir, bu nedenle en iyi şekilde öğrenmek için:

  • Konuşulacak cümlelere yeterince gerçek örnekler verin.
  • Satır başına yalnızca bir cümle koyun, daha fazlasını değil. Aksi takdirde sistem tümceler arasında olasılıkları öğrenir.
  • Bir sözcüğü diğerlerine karşı güçlendirmek için bir sözcüğü cümle olarak koymak normaldir, ancak sistem tüm cümlelerden en iyi şekilde öğrenir.
  • Yeni sözcükler veya kısaltmalar eklerken, mümkünse, sisteme mümkün olduğunca çok bağlam sağlamak için tam tümce içinde en fazla sayıda kullanım örneği verin.
  • Birkaç uyarlama seçeneği koymaya çalışın ve sizin için nasıl çalıştıklarını görün.
  • Aynı cümleyi birden çok kez tekrarlamaktan kaçının. Girişin geri kalanına karşı sapma oluşturabilir.
  • Atılacak yaygın olmayan simgeleri (~, # @ % &) dahil etmekten kaçının. Göründükleri cümleler de atılır.
  • Yüz binlerce cümle gibi çok büyük girişler koymaktan kaçının, çünkü bunu yapmak, artırmanın etkisini seyreltir.

Önkoşullar

  • Azure hesabı
  • Azure AI Video Indexer hesabı

Dil modeli oluşturma

  1. Azure AI Video Indexer web sitesine gidin ve oturum açın.
  2. Hesabınızdaki bir modeli özelleştirmek için sayfanın sol tarafındaki Con çadır modu l özelleştirme düğmesini seçin.
  3. Dil sekmesini seçin. Desteklenen dillerin listesini görürsünüz.
  4. İstediğiniz dilin altında Model ekle'yi seçin.
  5. Dil modelinin adını yazın ve Enter tuşuna basın. Bu adım modeli oluşturur ve modele metin dosyaları yükleme seçeneği sunar.
  6. Metin dosyası eklemek için Dosya ekle'yi seçin. Dosya gezgininiz açılır.
  7. Metin dosyasına gidin ve dosyayı seçin. Dil modeline birden çok metin dosyası ekleyebilirsiniz. Dil modelinin sağ tarafındaki ... düğmesini seçip Dosya ekle'yi seçerek de bir metin dosyası ekleyebilirsiniz.
  8. Metin dosyalarını karşıya yüklemeyi tamamladıktan sonra yeşil Eğit seçeneğini belirleyin.

Eğitim işlemi birkaç dakika sürebilir. Eğitim tamamlandıktan sonra modelin yanında Eğitildi görünür. Dosyayı modelden önizleyebilir, indirebilir ve silebilirsiniz.

Yeni videoda dil modeli kullanma

Dil modelinizi yeni bir videoda kullanmak için aşağıdaki eylemlerden birini yapın:

  1. Sayfanın üst kısmındaki Karşıya Yükle düğmesini seçin.
  2. Ses veya video dosyanızı bırakın veya dosyanıza göz atın.
  3. Video kaynak dili açılan listesinden oluşturduğunuz dil modelini seçin.
  4. Sayfanın alt kısmındaki Karşıya Yükle seçeneğini belirlediğinizde yeni videonuz Dil modeliniz kullanılarak dizine alınacaktır.

Yeniden dizin oluşturmak için dil modeli kullanma

  1. Azure AI Video Indexer giriş sayfasında oturum açın.
  2. Videodaki ... düğmesine tıklayın ve Yeniden dizine ekle'yi seçin.
  3. Video kaynak dili açılan listesini seçin ve listeden oluşturduğunuz bir dil modelini seçin.
  4. Yeniden dizinle düğmesini seçtiğinizde videonuz dil modeliniz kullanılarak yeniden dizinlenir.

Dil modelini düzenleme

Dil modelini, adını değiştirerek, dosya ekleyerek ve bu modelden dosya silerek düzenleyebilirsiniz. Dil modeline dosya ekler veya silerseniz, yeşil Eğit seçeneğini belirleyerek modeli yeniden eğitmeniz gerekir.

Dil modelini yeniden adlandırma

Dil modelinin sağ tarafındaki üç nokta (...) düğmesini seçip Yeniden Adlandır'ı seçerek dil modelinin adını değiştirebilirsiniz. Yeni adı girin.

Dosya ekle

  1. Dosya ekle seçeneğini belirleyin. Dosya gezgininiz açılır.
  2. Metin dosyasına gidin ve dosyayı seçin. Dil modeline birden çok metin dosyası ekleyebilirsiniz.

Dil modelinin sağ tarafındaki üç nokta (...) düğmesini seçip Dosya ekle'yi seçerek de metin dosyası ekleyebilirsiniz.

Dosyaları sil

Bu eylem, dosyayı dil modelinden tamamen kaldırır.

  1. Metin dosyasının sağ tarafındaki üç nokta (...) düğmesini seçin.
  2. Sil'i seçin. Silme işleminin geri alınamazsınız ifadesini gösteren yeni bir pencere açılır.
  3. Yeni pencerede Sil seçeneğini belirleyin.

Dil modelini silme

Bu eylem, dil modelini hesabınızdan tamamen kaldırır. deletedlLanguage modelini kullanan tüm videolar, siz videoyu yeniden dizine ekleyene kadar aynı dizini tutar. Videoyu yeniden dizine eklerseniz videoya yeni bir dil modeli atayabilirsiniz. Aksi takdirde Azure AI Video Indexer, videoyu yeniden dizine almak için varsayılan modelini kullanır.

  1. Dil modelinin sağ tarafındaki üç nokta (...) düğmesini seçin.
  2. Sil'i seçin. Silme işleminin geri alınamazsınız ifadesini gösteren yeni bir pencere açılır.
  3. Yeni pencerede Sil seçeneğini belirleyin.

Transkriptleri düzelterek dil modellerini özelleştirme

Azure AI Video Indexer, kullanıcıların videolarının transkripsiyonlarında yaptıkları gerçek düzeltmelere göre dil modellerini özelleştirir. Videonuzun transkripsiyonunda düzelttiğiniz tüm satırları yakalar ve adlı From transcript editsbir metin dosyasına ekler. Bu düzenlemeler, videonun dizinini oluşturmak için kullanılan dil modelini yeniden eğitmek için kullanılır.

Pencere öğesinin zaman çizelgesinde yapılan düzenlemeler de eklenir.

Bu videonun dizinini oluştururken bir dil modeli belirtmediyseniz, bu videonun tüm düzenlemeleri videonun algılanan dili içinde adlı Account adaptations varsayılan dil modelinde depolanır.

Aynı satırda birden çok düzenleme yapılması durumunda, Dil modelini güncelleştirmek için yalnızca düzeltilen satırın son sürümü kullanılır.

Not

Özelleştirme için yalnızca metin düzeltmeleri kullanılır. Gerçek sözcükleri içermeyen düzeltmeler (örneğin, noktalama işaretleri veya boşluklar) dahil değildir.

  1. Kitaplığınızdan düzenlemek istediğiniz videoyu seçin.
  2. Zaman Çizelgesi sekmesini seçin.
  3. Transkripsiyonunuzun dökümünü düzenlemek için kalem simgesini seçin.
  4. Con çadır modu l özelleştirme sayfasının Dil sekmesinde transkript düzeltmelerinin görüntü gördüğünü göreceksiniz. Dil modellerinizin her birinin "Transkript düzenlemelerinden" dosyasına bakmak için dosyayı seçerek açın.