speech Pacote
SDK de Fala da Microsoft para Python
Módulos
audio |
Classes que se preocupam com o tratamento da entrada de áudio para os vários reconhecedores e a saída de áudio do sintetizador de fala. |
dialog |
Classes relacionadas ao conector do serviço de caixa de diálogo. |
enums |
SDK de Fala da Microsoft para Python |
intent |
Classes relacionadas ao reconhecimento de intenção da fala. |
interop |
SDK de Fala da Microsoft para Python |
languageconfig |
Classes que se preocupam com o tratamento de configurações de idioma |
properties |
SDK de Fala da Microsoft para Python |
speech |
Classes relacionadas ao reconhecimento de texto de fala, sintetização de fala de texto e classes gerais usadas nos vários reconhecedores. |
transcription |
Classes relacionadas à transcrição da conversa. |
translation |
Classes relacionadas à tradução de fala para outros idiomas. |
version |
SDK de Fala da Microsoft para Python |
Classes
AudioDataStream |
Representa o fluxo de dados de áudio usado para operar dados de áudio como um fluxo. Gera um fluxo de dados de áudio de um resultado de síntese de fala (digite SpeechSynthesisResult) ou um resultado de reconhecimento de palavra-chave (digite KeywordRecognitionResult). |
AutoDetectSourceLanguageResult |
Representa o resultado da linguagem de origem de detecção automática. O resultado pode ser inicializado a partir de um resultado de reconhecimento de fala. |
CancellationDetails |
SDK de Fala da Microsoft para Python |
Connection |
Classe proxy para gerenciar a conexão com o serviço de fala do especificado Recognizer. Por padrão, um Recognizer gerencia de forma autônoma a conexão com o serviço quando necessário. A Connection classe fornece métodos adicionais para que os usuários abram ou fechem explicitamente uma conexão e assinem a conexão status alterações. O uso de Connection é opcional. Destina-se a cenários em que é necessário ajustar o comportamento do aplicativo com base em status de conexão. Opcionalmente, os usuários podem chamar open para iniciar manualmente uma conexão de serviço antes de iniciar o reconhecimento no associado a Recognizer este Connection. Depois de iniciar um reconhecimento, chamar open ou close pode falhar. Isso não afetará o Reconhecedor nem o reconhecimento contínuo. A conexão pode cair por vários motivos, o Reconhecedor sempre tentará reinstituir a conexão conforme necessário para garantir operações em andamento. Em todos esses casos, connected/disconnected os eventos indicarão a alteração do status de conexão. Observação Atualizado na versão 1.17.0. Construtor para uso interno. |
ConnectionEventArgs |
Fornece dados para o ConnectionEvent. Observação Adicionado na versão 1.2.0 Construtor para uso interno. |
EventSignal |
Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos. Construtor para uso interno. |
KeywordRecognitionEventArgs |
Classe para argumentos de evento de reconhecimento de palavra-chave. Construtor para uso interno. |
KeywordRecognitionModel |
Representa um modelo de reconhecimento de palavra-chave. |
KeywordRecognitionResult |
Resultado de uma operação de reconhecimento de palavra-chave. Construtor para uso interno. |
KeywordRecognizer |
Um reconhecedor de palavra-chave. |
NoMatchDetails |
SDK de Fala da Microsoft para Python |
PhraseListGrammar |
Classe que permite a adição em runtime de dicas de frase para ajudar no reconhecimento de fala. As frases adicionadas ao reconhecedor são efetivas no início do próximo reconhecimento ou, na próxima vez, o reconhecedor de fala deve se reconectar ao serviço de fala. Observação Adicionado na versão 1.5.0. Construtor para uso interno. |
PronunciationAssessmentConfig |
Representa a configuração de avaliação de pronúncia Observação Adicionado na versão 1.14.0. A configuração pode ser inicializada de duas maneiras:
Para obter os detalhes dos parâmetros, consulte https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters |
PronunciationAssessmentPhonemeResult |
Contém o resultado da avaliação de pronúncia no nível do phoneme Observação Adicionado na versão 1.14.0. |
PronunciationAssessmentResult |
Representa o resultado da avaliação de pronúncia. Observação Adicionado na versão 1.14.0. O resultado pode ser inicializado a partir de um resultado de reconhecimento de fala. |
PronunciationAssessmentWordResult |
Contém o resultado da avaliação de pronúncia no nível da palavra Observação Adicionado na versão 1.14.0. |
PropertyCollection |
Classe para recuperar ou definir um valor de propriedade de uma coleção de propriedades. |
RecognitionEventArgs |
Fornece dados para o RecognitionEvent. Construtor para uso interno. |
RecognitionResult |
Informações detalhadas sobre o resultado de uma operação de reconhecimento. Construtor para uso interno. |
Recognizer |
Classe base para diferentes reconhecedores |
ResultFuture |
O resultado de uma operação assíncrona. construtor privado |
SessionEventArgs |
Classe base para argumentos de evento de sessão. Construtor para uso interno. |
SourceLanguageRecognizer |
Um reconhecedor de idioma de origem – reconhecedor de idioma autônomo, pode ser usado para detecção de idioma único ou idioma contínuo. Observação Adicionado na versão 1.18.0. |
SpeechConfig |
Classe que define configurações para reconhecimento de fala/intenção e síntese de fala. A configuração pode ser inicializada de diferentes maneiras:
|
SpeechRecognitionCanceledEventArgs |
Classe para argumentos de evento cancelados de reconhecimento de fala. Construtor para uso interno. |
SpeechRecognitionEventArgs |
Classe para argumentos de evento de reconhecimento de fala. Construtor para uso interno. |
SpeechRecognitionResult |
Classe base para resultados de reconhecimento de fala. Construtor para uso interno. |
SpeechRecognizer |
Um reconhecedor de fala. Se você precisar especificar informações de idioma de origem, especifique apenas um desses três parâmetros, idioma, source_language_config ou auto_detect_source_language_config. |
SpeechSynthesisBookmarkEventArgs |
Classe para argumentos de evento de indicador de síntese de fala. Observação Adicionado na versão 1.16.0. Construtor para uso interno. |
SpeechSynthesisCancellationDetails |
Contém informações detalhadas sobre por que um resultado foi cancelado. |
SpeechSynthesisEventArgs |
Classe para argumentos de evento de síntese de fala. Construtor para uso interno. |
SpeechSynthesisResult |
Resultado de uma operação de síntese de fala. Construtor para uso interno. |
SpeechSynthesisVisemeEventArgs |
Classe para argumentos de evento viseme de síntese de fala. Observação Adicionado na versão 1.16.0. Construtor para uso interno. |
SpeechSynthesisWordBoundaryEventArgs |
Classe para argumentos de evento de limite de palavra de síntese de fala. Observação Atualizado na versão 1.21.0. Construtor para uso interno. |
SpeechSynthesizer |
Um sintetizador de fala. |
SyllableLevelTimingResult |
Contém o resultado do tempo de nível de sílaba Observação Adicionado na versão 1.20.0. |
SynthesisVoicesResult |
Contém informações detalhadas sobre a lista de vozes de síntese recuperada. Observação Adicionado na versão 1.16.0. Construtor para uso interno. |
VoiceInfo |
Contém informações detalhadas sobre as informações de voz de síntese. Observação Atualizado na versão 1.17.0. Construtor para uso interno. |
Enumerações
AudioStreamContainerFormat |
Define o formato de contêiner de fluxo de áudio com suporte. |
AudioStreamWaveFormat |
Representa o formato especificado dentro do contêiner WAV. |
CancellationErrorCode |
Define o código de erro caso CancellationReason seja Error. |
CancellationReason |
Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado. |
NoMatchReason |
Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido. |
OutputFormat |
Formato de saída. |
ProfanityOption |
Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. |
PronunciationAssessmentGradingSystem |
Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. |
PronunciationAssessmentGranularity |
Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. |
PropertyId |
Define ids de propriedade de fala. |
ResultReason |
Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado. |
ServicePropertyChannel |
Define canais usados para passar as configurações de propriedade para o serviço. |
SpeechSynthesisOutputFormat |
Define os possíveis formatos de áudio de saída de síntese de fala. |
StreamStatus |
Define a possível status do fluxo de dados de áudio. |
SynthesisVoiceGender |
Define o gênero das vozes de síntese |
SynthesisVoiceType |
Define o tipo de vozes de síntese |
Azure SDK for Python