Azure AI konuşma tanıma ve oluşturma teknolojisi seçme
Azure yapay zeka hizmetleri , iş yükü tasarımcılarının ve geliştiricilerin kullanıma hazır, önceden oluşturulmuş ve özelleştirilebilir API'ler ve modeller ile akıllı, son teknoloji, pazara hazır ve sorumlu uygulamalar oluşturmasına yardımcı olur.
Bu makale, konuşmayı metne dönüştürme ve metin okuma dönüştürmeleri, ses çevirisi, konuşmacı tanıma gibi konuşma tanıma ve oluşturma özelliklerinin yanı sıra öğrenme farklılıkları olan kişiler için okuma desteği sunan Azure yapay zeka hizmetlerini kapsar.
Not
Terimler veya tümcecikler hakkında içgörüler toplamak ya da konuşulan veya yazılan dilin ayrıntılı bağlamsal analizini almak için bkz . Azure AI hedefli dil işleme teknolojisi seçme.
Hizmetler
Aşağıdaki Azure AI hizmetleri, iş yükünüz için konuşma tanıma ve oluşturma özellikleri sağlayabilir.
Azure AI Konuşma, metin analizi için doğal dil işleme sağlar.
- Konuşmanın dökümünü almanız veya çevirmeniz, konuşmadaki konuşmacıları tanımlamanız gerektiğinde Konuşma hizmetini kullanın . OpenAI modellerinde doğal sesli konuşma oluşturma için daha yüksek kaliteli Whisper'a daha düşük maliyetli bir alternatif olarak da hizmeti kullanabilirsiniz.
- Konuşma hizmetini sohbet, içerik özetleme, denetleme veya kullanıcılara betikler aracılığıyla yol göstermek için kullanmayın . Bunun yerine diğer modelleri kullanın.
Tam Ekran Okuyucu, gelişmekte olan okuyucular, dil öğrenenler ve öğrenme farklılıkları olan kişiler için okuma kavramayı geliştirmek için kanıtlanmış teknikler uygulayan bir araçtır.
- Dil öğrenenler veya öğrenme farklılıkları olan kişiler için uyarlanmış geliştirilmiş bir okunabilirlik deneyimi sağlamak için Tam Ekran Okuyucu kullanın.
- Geleneksel metin okuma örnekleri için Tam Ekran Okuyucu kullanmayın.
Azure Yapay Zeka Konuşma
Azure AI Konuşma , konuşma kaynağıyla metne konuşma ve metin okuma özellikleri sağlar. Konuşmayı yüksek doğrulukla metne dönüştürebilir, konuşma seslerine doğal sesli metin üretebilir, konuşulan sesi çevirebilir ve konuşmalar sırasında konuşmacı tanımayı kullanabilirsiniz. Özel sesler oluşturun, temel sözlüğünüze belirli sözcükleri ekleyin veya kendi modellerinizi oluşturun. Konuşma hizmetini istediğiniz yerde, bulutta veya uç cihazlarda kapsayıcılarda çalıştırın.
Konuşma birçok dil ve bölge için kullanılabilir.
Özellikler
Aşağıdaki tabloda, Azure AI Konuşma hizmetinde kullanılabilen özelliklerin listesi sağlanmaktadır.
Yetenek | Açıklama |
---|---|
Toplu transkripsiyon | Depolama alanında büyük miktarda ses verilerinin dökümünü alır. Hem Konuşmayı metne dönüştürme REST API'si hem de Konuşma CLI'sı toplu transkripsiyonu destekler. |
Amaç tanıma | Amaç, kullanıcının yapmak istediği herhangi bir şeydir: uçak rezervasyonu, hava durumuna bakma veya telefon etme. Amaç tanıma ile, uygulamalarınız, araçlarınız ve cihazlarınız kullanıcının ne başlatmak veya yapmak istediğini seçeneklere göre belirleyebilir. Kullanıcı amacını amaç tanıyıcı veya konuşma dili anlama (CLU) modelinde tanımlarsınız. |
Söyleniş değerlendirmesi | Konuşma söylenişini değerlendirir ve konuşmacılara konuşulan sesin doğruluğu ve akıcılığı hakkında geri bildirim sağlar. |
Konuşmacı tanıma | Konuşmacı tanıma, ses klibinde kimin konuştuğunu belirlemeye yardımcı olabilir. Hizmet, ses biyometrisini kullanarak konuşmacıları benzersiz ses özelliklerine göre doğrulayabilir ve tanımlayabilir. |
Konuşmayı metne dönüştürme | Ses akışlarını gerçek zamanlı veya toplu olarak metne dönüştürür. |
Metin okuma | Uygulamalarınızın, araçlarınızın veya cihazlarınızın metni insan benzeri sentezlenmiş konuşmaya dönüştürmesini sağlar. |
Konuşma çevirisi | Ses akışlarının çok dilli konuşmadan konuşmaya ve konuşmayı metne dönüştürmeyi sağlar. |
Video çevirisi | Videoları otomatik olarak birden çok dilde çevirin ve oluşturun. |
Kullanım örnekleri
Aşağıdaki tabloda, Azure AI Konuşma özelliğini kullanmanın bazı yolları açıklanmaktadır.
Kullanım örneği | Kullanım özelliği | Açıklama |
---|---|---|
Ses içeriği oluşturma | Konuşmayı metne dönüştürme | Sohbet botları ve sesli yardımcılarla etkileşimleri daha doğal ve ilgi çekici hale getirmek, e-kitaplar gibi dijital metinleri sesli kitaplara dönüştürmek ve araç içi navigasyon sistemlerini geliştirmek için sinir seslerini kullanabilirsiniz. |
Çağrı merkezi transkripsiyonu | Konuşmayı metne dönüştürme | Aramaların gerçek zamanlı dökümünü oluşturun veya bir grup aramayı işleyin, kişisel olarak tanımlayan bilgileri yeniden işleyin ve çağrı merkezi kullanım örneğinize yardımcı olmak için yaklaşım gibi içgörüleri ayıklayın. |
Açıklamalı Alt Yazı | Konuşmayı metne dönüştürme | Açıklamalı altyazıları giriş sesinizle eşitleyin, küfür filtreleri uygulayın, kısmi sonuçlar alın, özelleştirmeler uygulayın ve çok dilli senaryolar için konuşulan dilleri belirleyin. |
Dil öğrenme | Konuşmayı metne dönüştürme | Dil öğrencilerine söyleniş değerlendirmesi geri bildirimi sağlayın, uzaktan öğrenme konuşmaları için gerçek zamanlı transkripsiyonu destekleyin ve nöral seslerle sesli öğretim malzemeleri okuyun. |
Ses yardımcıları | Metin okuma | Uygulamaları ve deneyimleri için doğal, insan benzeri konuşma arabirimleri oluşturun. Sesli yardımcı özelliği, bir cihaz ile yardımcı uygulaması arasında hızlı ve güvenilir etkileşim sağlar. |
Tam Ekran Okuyucu
Azure yapay zeka hizmetlerinin bir parçası olan Tam Ekran Okuyucu, yeni okuyucular, dil öğrenenler ve disleksi gibi öğrenme farklılıkları olan kişiler için okuma kavramayı geliştirmek için kanıtlanmış teknikler uygulayan kapsayıcı tasarımlı bir araçtır. Tam Ekran Okuyucu istemci kitaplığıyla, iş yükünüzün kullanıcılarına harika bir deneyim sunmak için Microsoft Word ve Microsoft OneNote'ta kullanılan teknolojinin aynısını kullanabilirsiniz.
Özellikler
Aşağıda, iş yükünüzün kullanıcılarınızın okuma kavrama hedeflerine ulaşmasına yardımcı olmak için kullanabileceği özelliklerin listesi yer alır.
- Okunabilirliği geliştirmek için içeriği yalıtma
- Sık kullanılan sözcükler ve terimler için resimleri görüntüleme
- Fiilleri, isimleri, zamirleri ve daha fazlasını vurgulayarak konuşma ve dil bilgisi bölümlerini anlamanıza yardımcı olun
- İş yükünüzün kullanıcı arabiriminde kullanıcı tarafından seçilen metin gibi içeriği yüksek sesle okuma
- İçeriği gerçek zamanlı olarak birçok dile çevirin, bu da okuyucuların yeni bir dil öğrenmesini anlamaya yardımcı olur
- Okunabilirliği artırmak veya yeni sözcüklerin sesini çıkarmak için sözcükleri hecelere bölün