Konuşmayı metne dönüştürerek metin biçimlendirmesini görüntüleme

Metne konuşma, dökümü alınan metnin net ve okunaklı olmasını sağlamak için bir dizi biçimlendirme özelliği sunar. Her özelliğin son metin çıkışının genel netliğini artırmak için nasıl kullanıldığına ilişkin genel bir bakış için aşağıdaki bölümlere bakın.

ITN

Ters Metin Normalleştirmesi (ITN), konuşulan sözcükleri yazılı biçimlerine dönüştüren bir işlemdir. Örneğin, konuşulan "dört" sözcüğü yazılı "4" biçimine dönüştürülür. Metin tanıma hizmeti bu işlemi tamamlar ve yapılandırılamaz. Desteklenen metin biçimlerinden bazıları tarihler, saatler, ondalıklar, para birimleri, adresler, e-postalar ve telefon numaralarıdır. Doğal olarak konuşabilirsiniz ve hizmet metni beklendiği gibi biçimlendirebilir. Aşağıdaki tabloda, metin çıkışına uygulanan ITN kuralları gösterilmektedir.

Tanınan konuşma Görüntü metni
that will cost nine hundred dollars That will cost $900.
my phone number is one eight hundred, four five six, eight nine ten My phone number is 1-800-456-8910.
the time is six forty five p m The time is 6:45 PM.
I live on thirty five lexington avenue I live on 35 Lexington Ave.
the answer is six point five The answer is 6.5.
send it to support at help dot com Send it to support@help.com.

Büyük Harf Kullanımı

Metin modellerine konuşma, okunabilirliği, doğruluğu ve dil bilgisini geliştirmek için büyük harfle yazılması gereken sözcükleri tanır. Örneğin Konuşma hizmeti, tümcenin başındaki düzgün adları ve sözcükleri otomatik olarak büyük harfe çevirmeyi sağlar. Bu tabloda bazı örnekler gösterilmiştir.

Tanınan konuşma Görüntü metni
i got an x l t shirt I got an XL t-shirt.
my name is jennifer smith My name is Jennifer Smith.
i want to visit new york city I want to visit New York City.

Yetersizliği kaldırma

Konuşurken, birinin kekelemeye, kelimeleri yinelemeye ve "uhm" veya "uhm" gibi dolgu sözcükleri söylemesine sık rastlanan bir durum. Metne konuşma, bu tür uyuşmaları tanıyabilir ve bunları görüntü metninden kaldırabilir. Gereksizliği kaldırma özelliği, canlı ve açıklanmamış konuşmaları daha sonra yeniden okumak üzere transkribe etmek için mükemmeldir. Bu tabloda bazı örnekler gösterilmiştir.

Tanınan konuşma Görüntü metni
i uh said that we can go to the uhmm movies I said that we can go to the movies.
its its not that big of uhm a deal It's not that big of a deal.
umm i think tomorrow should work I think tomorrow should work.

Noktalama işaretleri

Konuşmayı metne dönüştürme, netliği artırmak için metninizi otomatik olarak noktalar. Noktalama işaretleri, geri arama veya konuşma transkripsiyonlarını okumak için yararlıdır. Bu tabloda bazı örnekler gösterilmiştir.

Tanınan konuşma Görüntü metni
how are you How are you?
we can go to the mall park or beach We can go to the mall, park, or beach.

Sürekli tanıma ile konuşmayı metne dönüştürmeyi kullanırken, Konuşma hizmetini açık noktalama işaretlerini tanıyacak şekilde yapılandırabilirsiniz. Ardından, metninizi daha okunaklı hale getirmek için noktalama işaretlerini yüksek sesle konuşabilirsiniz. Bu, özellikle daha sonra birleştirmek zorunda kalmadan karmaşık noktalama işaretlerini kullanmak istediğiniz durumlarda kullanışlıdır. Bu tabloda bazı örnekler gösterilmiştir.

Tanınan konuşma Görüntü metni
they entered the room dot dot dot They entered the room...
i heart emoji you period I <3 you.
the options are apple forward slash banana forward slash orange period The options are apple/banana/orange.
are you sure question mark Are you sure?

Sürekli tanıma ile konuşmayı metne dönüştürmeyi kullanırken dikte modunu etkinleştirmek için Konuşma SDK'sını kullanın. Bu mod, konuşma yapılandırma örneğinin noktalama işaretleri gibi cümle yapılarının sözcük açıklamalarını yorumlamasına neden olur.

speechConfig.EnableDictation();
speechConfig->EnableDictation();
speechConfig.EnableDictation()
speechConfig.enableDictation();
speechConfig.enableDictation();
[self.speechConfig enableDictation];
self.speechConfig!.enableDictation()
speech_config.enable_dictation()

Küfür filtresi

Son döküm metninde küfürlerin maskeleneceğini, kaldırılacağını veya gösterileceğini belirtebilirsiniz. Maskeleme, küfürlü sözcükleri yıldız (*) karakterleriyle değiştirir, böylece metninizin özgün yaklaşımını koruyarak belirli durumlar için daha uygun hale getirebilirsiniz

Not

Microsoft ayrıca uygunsuz olduğu düşünülen tüm kelimeleri maskele veya kaldır hakkını saklı tutarak. Küfür filtrelemeyi etkinleştirseniz de etkinleştirmeseniz de bu tür sözcükler Konuşma hizmeti tarafından döndürülmeyecektir.

Küfür filtresi seçenekleri şunlardır:

  • Masked: Küfürlü sözcüklerdeki harfleri yıldız (*) karakterleriyle değiştirir. Maskelenmiş varsayılan seçenektir.
  • Raw: Küfür içeren ifadeleri ekleyin.
  • Removed: Küfür eden sözcükleri kaldırır.

Örneğin, küfürsüz sözcükleri konuşma tanıma sonucundan kaldırmak için küfür filtresini Removed burada gösterildiği gibi olarak ayarlayın:

speechConfig.SetProfanity(ProfanityOption.Removed);
speechConfig->SetProfanity(ProfanityOption::Removed);
speechConfig.SetProfanity(common.Removed)
speechConfig.setProfanity(ProfanityOption.Removed);
speechConfig.setProfanity(sdk.ProfanityOption.Removed);
[self.speechConfig setProfanityOptionTo:SPXSpeechConfigProfanityOption.SPXSpeechConfigProfanityOption_ProfanityRemoved];
self.speechConfig!.setProfanityOptionTo(SPXSpeechConfigProfanityOption_ProfanityRemoved)
speech_config.set_profanity(speechsdk.ProfanityOption.Removed)
spx recognize --file caption.this.mp4 --format any --profanity masked --output vtt file - --output srt file -

Sonuç Text ve MaskedNormalizedForm özelliklere küfür filtresi uygulanır. Küfür filtresi sonuca LexicalForm ve NormalizedForm özelliklere uygulanmaz. Sözcük düzeyi sonuçlarına uygulanan filtre de geçerli değildir.