名前空間 Microsoft::CognitiveServices::Speech

[アーティクル]
12/01/2023

まとめ

メンバー	説明
enum PropertyId	音声プロパティ ID を定義します。バージョン 1.4.0 で変更されました。
enum OutputFormat	出力形式。
enum ProfanityOption	不適切な表現 (悪口) を削除するか、不適切な単語の文字を星で置き換えます。バージョン 1.5.0 で追加されました。
enum ResultReason	認識結果が生成される可能性がある理由を指定します。
enum CancellationReason	認識結果が取り消される可能性がある理由を定義します。
enum CancellationErrorCode	CancellationReason が Error の場合のエラーコードを定義します。バージョン 1.1.0 で追加されました。
enum NoMatchReason	認識結果が認識されない可能性がある理由を定義します。
enum ActivityJSONType	アクティビティ json 値に使用できる型を定義します。バージョン 1.5.0 で追加されました。
enum SpeechSynthesisOutputFormat	可能な音声合成出力オーディオ形式を定義します。バージョン 1.19.0 で更新されました。
enum StreamStatus	オーディオデータストリームの使用可能な状態を定義します。バージョン 1.4.0 で追加されました。
enum ServicePropertyChannel	プロパティ設定をサービスに渡すために使用されるチャネルを定義します。バージョン 1.5.0 で追加されました。
enum VoiceProfileType	音声プロファイルの種類を定義します。
enum RecognitionFactorScope	認識係数を適用するスコープを定義します。
enum PronunciationAssessmentGradingSystem	発音スコア調整のポイントシステムを定義します。既定値は FivePoint です。バージョン 1.14.0 で追加されました。
enum PronunciationAssessmentGranularity	発音評価の粒度を定義します。既定値は Phoneme です。バージョン 1.14.0 で追加されました。
enum SynthesisVoiceType	バージョン 1.16.0 で追加された合成音声の種類を定義します。
enum SynthesisVoiceGender	バージョン 1.17.0 で追加された合成音声の性別を定義します。
enum SpeechSynthesisBoundaryType	バージョン 1.21.0 で追加された音声合成境界イベントの境界の種類を定義します。
クラス AsyncRecognizer	AsyncRecognizer 抽象基本クラス。
AudioDataStream クラス	オーディオデータをストリームとして操作するために使用されるオーディオデータストリームを表します。バージョン 1.4.0 で追加されました。
クラス AutoDetectSourceLanguageConfig	自動検出ソース構成を定義するクラス 1.13.0 で更新されました。
クラス AutoDetectSourceLanguageResult	自動検出されたソース言語の結果が含まれています。1.8.0 に追加されました。
クラス BaseAsyncRecognizer	BaseAsyncRecognizer クラス。
クラス CancellationDetails	結果が取り消された理由に関する詳細情報が含まれます。
class ClassLanguageModel	動的な文法シナリオの文法の一覧を表します。バージョン 1.7.0 で追加されました。
クラス Connection	接続は、指定した Recognizer の音声サービスへの接続を管理するためのプロキシクラスです。既定では、必要に応じて、Recognizer によってサービスへの接続が自律的に管理されます。 Connection クラスは、ユーザーが接続を明示的に開いたり閉んだりしたり、接続状態の変更をサブスクライブしたりするための追加のメソッドを提供します。 Connection の使用は省略可能です。これは、接続状態に基づいてアプリケーションの動作を微調整する必要があるシナリオを対象としています。ユーザーは必要に応じて Open() を呼び出して、この接続に関連付けられている認識エンジンで認識を開始する前に、サービス接続を手動で開始できます。認識を開始すると、Open() または Close() の呼び出しが失敗する可能性があります。これは、認識エンジンや進行中の認識には影響しません。さまざまな理由で接続が切断される可能性があります。認識エンジンは、継続的な操作を保証するために、必要に応じて常に接続の再確立を試みます。これらすべての場合、接続/切断されたイベントは、接続状態の変更を示します。バージョン 1.17.0 で更新されました。
ConnectionEventArgs クラス	ConnectionEvent のデータを提供します。バージョン 1.2.0 で追加されました。
ConnectionMessage クラス	ConnectionMessage は、音声サービスとの間で送受信される実装固有のメッセージを表します。これらのメッセージはデバッグ目的で提供され、Azure Cognitive Services Speech Service での運用環境のユースケースには使用しないでください。 Speech Service との間で送受信されるメッセージは、予告なく変更される場合があります。これには、メッセージの内容、ヘッダー、ペイロード、順序などが含まれます。バージョン 1.10.0 で追加されました。
ConnectionMessageEventArgs クラス	ConnectionMessageEvent のデータを提供します。
EmbeddedSpeechConfig クラス	埋め込み (オフライン) 音声構成を定義するクラス。
クラス EventArgs	イベント引数の基本クラス。
クラス EventSignal	クライアントはイベント信号に接続してイベントを受信したり、イベント信号から切断してイベントの受信を停止したりできます。
クラス EventSignalBase	クライアントはイベント信号に接続してイベントを受信したり、イベント信号から切断してイベントの受信を停止したりできます。
クラス文法	音声認識をカスタマイズするための基本クラスの文法を表します。バージョン 1.5.0 で追加されました。
クラス GrammarList	動的な文法シナリオの文法の一覧を表します。バージョン 1.7.0 で追加されました。
クラス GrammarPhrase	ユーザーが読み上げることができる語句を表します。バージョン 1.5.0 で追加されました。
HybridSpeechConfig クラス	音声認識または音声合成用のハイブリッド (クラウドおよび埋め込み) 構成を定義するクラス。
クラス KeywordRecognitionEventArgs	KeywordRecognizer によって送信されたイベントのクラス。
class KeywordRecognitionModel	StartKeywordRecognitionAsync メソッドキーワード (keyword)使用される認識モデルを表します。
クラス KeywordRecognitionResult	KeywordRecognizer によって出力される結果を定義するクラス。
クラス KeywordRecognizer	アクティブ化のみを処理するために特化された認識エンジンの種類キーワード (keyword)。
クラス NoMatchDetails	NoMatch 認識結果の詳細情報が含まれます。
クラス PhraseListGrammar	動的文法シナリオのフレーズリスト文法を表します。バージョン 1.5.0 で追加されました。
クラスの発音AssessmentConfig	発音評価の構成を定義するクラス 1.14.0 に追加されました。
クラスの発音AssessmentResult	発音評価結果のクラス。
クラスの発音ContentAssessmentResult	コンテンツ評価結果のクラス。
クラス PropertyCollection	プロパティコレクションからプロパティ値を取得または設定するクラス。
RecognitionEventArgs クラス	RecognitionEvent のデータを提供します。
RecognitionResult クラス	認識操作の結果に関する詳細情報が含まれます。
クラス Recognizer	Recognizer 基本クラス。
SessionEventArgs クラス	セッションイベント引数の基本クラス。
SmartHandle クラス	スマートハンドルクラス。
SourceLanguageConfig クラス	1.8.0 で追加されたソース言語の構成を定義するクラス。
クラス SourceLanguageRecognizer	ソース言語認識エンジンのクラス。このクラスは、スタンドアロン言語の検出に使用できます。バージョン 1.17.0 で追加されました。
SpeechConfig クラス	音声/意図認識、または音声合成の構成を定義するクラス。
SpeechRecognitionCanceledEventArgs クラス	音声認識のクラスがイベント引数を取り消しました。
SpeechRecognitionEventArgs クラス	音声認識イベント引数のクラス。
SpeechRecognitionModel クラス	音声認識モデル情報。
SpeechRecognitionResult クラス	音声認識結果の基本クラス。
SpeechRecognizer クラス	音声認識エンジンのクラス。
SpeechSynthesisBookmarkEventArgs クラス	音声合成ブックマークイベント引数のクラス。バージョン 1.16.0 で追加されました。
Class SpeechSynthesisCancellationDetails	結果が取り消された理由に関する詳細情報が含まれます。バージョン 1.4.0 で追加されました。
SpeechSynthesisEventArgs クラス	音声合成イベント引数のクラス。バージョン 1.4.0 で追加されました。
SpeechSynthesisResult クラス	テキスト読み上げ合成の結果に関する情報が含まれます。バージョン 1.4.0 で追加されました。
SpeechSynthesisVisemeEventArgs クラス	音声合成の口形素イベント引数のクラス。バージョン 1.16.0 で追加されました。
SpeechSynthesisWordBoundaryEventArgs クラス	音声合成ワード境界イベント引数のクラス。バージョン 1.7.0 で追加されました。
SpeechSynthesizer クラス	音声シンセサイザーのクラス。バージョン 1.14.0 で更新されました。
SpeechTranslationModel クラス	音声翻訳モデル情報。
クラス SynthesisVoicesResult	音声シンセサイザーの音声リストからの結果に関する情報が含まれます。バージョン 1.16.0 で追加されました。
クラス VoiceInfo	バージョン 1.17.0 で更新された合成音声情報に関する情報が含まれています。

メンバー

enum PropertyId

値	説明
SpeechServiceConnection_Key	Cognitive Services Speech Service サブスクリプションキー。意図認識エンジンを使用している場合は、特定の LUIS アプリの LUIS エンドポイントキーを指定する必要があります。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::FromSubscription を使用します。
SpeechServiceConnection_Endpoint	Cognitive Services Speech Service エンドポイント (URL)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::FromEndpoint を使用します。注: このエンドポイントは、アクセストークンの取得に使用されるエンドポイントと同じではありません。
SpeechServiceConnection_Region	Cognitive Services Speech Service リージョン。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::FromSubscription、 SpeechConfig::FromEndpoint、 SpeechConfig::FromHost、 SpeechConfig::FromAuthorizationToken を使用します。
SpeechServiceAuthorization_Token	Cognitive Services Speech Service 承認トークン (アクセストークンとも呼ばれます)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::FromAuthorizationToken、 SpeechRecognizer::SetAuthorizationToken、IntentRecognizer::SetAuthorizationToken、TranslationRecognizer::SetAuthorizationToken を使用します。
SpeechServiceAuthorization_Type	Cognitive Services Speech Service 承認の種類。現在使用されていません。
SpeechServiceConnection_EndpointId	Cognitive Services Custom Speech または Custom Voice Service エンドポイント ID。通常の状況では、このプロパティを直接使用する必要はありません。代わりに SpeechConfig::SetEndpointId を使用します。注: エンドポイント ID は、[エンドポイントの詳細] の下に表示されている Custom Speech ポータルで使用できます。
SpeechServiceConnection_Host	Cognitive Services Speech Service ホスト (URL)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::FromHost を使用します。
SpeechServiceConnection_ProxyHostName	Cognitive Services Speech Service への接続に使用されるプロキシサーバーのホスト名。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::SetProxy を使用します。注: このプロパティ ID は、バージョン 1.1.0 で追加されました。
SpeechServiceConnection_ProxyPort	Cognitive Services Speech Service への接続に使用されるプロキシサーバーのポート。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::SetProxy を使用します。注: このプロパティ ID は、バージョン 1.1.0 で追加されました。
SpeechServiceConnection_ProxyUserName	Cognitive Services Speech Service への接続に使用されるプロキシサーバーのユーザー名。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::SetProxy を使用します。注: このプロパティ ID は、バージョン 1.1.0 で追加されました。
SpeechServiceConnection_ProxyPassword	Cognitive Services Speech Service への接続に使用されるプロキシサーバーのパスワード。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::SetProxy を使用します。注: このプロパティ ID は、バージョン 1.1.0 で追加されました。
SpeechServiceConnection_Url	音声構成から構築された URL 文字列。このプロパティは読み取り専用です。 SDK では内部的に使用されています。注: バージョン 1.5.0 で追加されました。
SpeechServiceConnection_TranslationToLanguages	ターゲット翻訳言語として使用されるコンマ区切り言語の一覧。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、SpeechTranslationConfig::AddTargetLanguage と SpeechTranslationConfig::GetTargetLanguages を使用します。
SpeechServiceConnection_TranslationVoice	Cognitive Service Text to Speech Service 音声の名前。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、SpeechTranslationConfig::SetVoiceName を使用します。注: 有効な音声名については、こちらを参照してください。
SpeechServiceConnection_TranslationFeatures	翻訳機能。内部使用です。
SpeechServiceConnection_IntentRegion	Language Understanding サービスリージョン。通常の状況では、このプロパティを直接使用する必要はありません。代わりに LanguageUnderstandingModel を使用します。
SpeechServiceConnection_RecoMode	Cognitive Services Speech Service 認識モード。 "INTERACTIVE"、"CONVERSATION"、"DICTATION" を指定できます。このプロパティは読み取り専用です。 SDK では内部的に使用されています。
SpeechServiceConnection_RecoLanguage	認識される音声言語 (BCP-47 形式)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 SpeechConfig::SetSpeechRecognitionLanguage を使用します。
Speech_SessionId	セッション ID。この ID は、オーディオ入力ストリームと、それがバインドされている基になる音声認識インスタンスの特定のバインドを表す汎用一意識別子 (UUID) です。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、SessionEventArgs::SessionId を使用します。
SpeechServiceConnection_UserDefinedQueryParameters	ユーザーによって提供されるクエリパラメーター。これらは、URL クエリパラメーターとしてサービスに渡されます。バージョン 1.5.0 で追加されました。
SpeechServiceConnection_RecoBackend	音声認識に使用するバックエンドを指定する文字列。許可されているオプションはオンラインとオフラインです。通常の状況では、このプロパティを直接使用しないでください。現在、オフラインオプションは EmbeddedSpeechConfig が使用されている場合にのみ有効です。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_RecoModelName	音声認識に使用するモデルの名前。通常の状況では、このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_RecoModelKey	音声認識に使用するモデルの復号化キー。通常の状況では、このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_RecoModelIniFile	音声認識に使用するモデルの ini ファイルへのパス。通常の状況では、このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_SynthLanguage	合成する音声言語 (en-US など) がバージョン 1.4.0 で追加されました。
SpeechServiceConnection_SynthVoice	音声合成に使用する TTS 音声の名前がバージョン 1.4.0 で追加されました。
SpeechServiceConnection_SynthOutputFormat	バージョン 1.4.0 で追加された TTS 出力オーディオ形式を指定する文字列。
SpeechServiceConnection_SynthEnableCompressedAudioTransmission	音声合成オーディオ送信に圧縮オーディオ形式を使用するかどうかを示します。このプロパティは、SpeechServiceConnection_SynthOutputFormatが pcm 形式に設定されている場合にのみ影響します。このプロパティが設定されておらず、GStreamer が使用可能な場合、SDK では合成オーディオ転送に圧縮形式が使用され、デコードされます。このプロパティを "false" に設定すると、ネットワーク上の伝送に生の pcm 形式を使用できます。バージョン 1.16.0 で追加されました。
SpeechServiceConnection_SynthBackend	TTS バックエンドを指定する文字列。有効なオプションはオンラインとオフラインです。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 EmbeddedSpeechConfig::FromPath または EmbeddedSpeechConfig::FromPaths を使用して、合成バックエンドをオフラインに設定します。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_SynthOfflineDataPath	オフライン合成エンジンのデータファイルパス。は、合成バックエンドがオフラインの場合にのみ有効です。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 EmbeddedSpeechConfig::FromPath または EmbeddedSpeechConfig::FromPaths を使用します。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_SynthOfflineVoice	音声合成に使用するオフライン TTS 音声の名前通常の状況では、このプロパティを直接使用しないでください。代わりに、 EmbeddedSpeechConfig::SetSpeechSynthesisVoice と EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName を使用します。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_SynthModelKey	音声合成に使用する音声の復号化キー。通常の状況では、このプロパティを直接使用しないでください。代わりに、 EmbeddedSpeechConfig::SetSpeechSynthesisVoice を使用します。バージョン 1.19.0 で追加されました。
SpeechServiceConnection_VoicesListEndpoint	Cognitive Services Speech Service の音声リスト API エンドポイント (URL)。通常の状況では、このプロパティを指定する必要はありません。SDK は SpeechConfig のリージョン/ホスト/エンドポイントに基づいてそれを構築します。バージョン 1.16.0 で追加されました。
SpeechServiceConnection_InitialSilenceTimeoutMs	サービスで使用される初期無音タイムアウト値 (ミリ秒単位)。バージョン 1.5.0 で追加されました。
SpeechServiceConnection_EndSilenceTimeoutMs	サービスで使用される終了無音タイムアウト値 (ミリ秒単位)。バージョン 1.5.0 で追加されました。
SpeechServiceConnection_EnableAudioLogging	サービスでオーディオログを有効にするかどうかを指定するブール値。オーディオログとコンテンツログは、Microsoft が所有するストレージ、または Cognitive Services サブスクリプションにリンクされている独自のストレージアカウント (Bring Your Own Storage (BYOS) 対応 Speech リソース) のいずれかに格納されます。バージョン 1.5.0 で追加されました。
SpeechServiceConnection_LanguageIdMode	音声サービス接続言語識別子モード。 "AtStart" (既定値) または "Continuous" を指定できます。言語識別に関するドキュメントを参照してください。 1.25.0 で追加されました。
SpeechServiceConnection_AutoDetectSourceLanguages	バージョン 1.8.0 で追加されたソース言語の自動検出。
SpeechServiceConnection_AutoDetectSourceLanguageResult	ソース言語の自動検出の結果がバージョン 1.8.0 で追加されました。
SpeechServiceResponse_RequestDetailedResultTrueFalse	要求された Cognitive Services Speech Service 応答出力形式 (単純または詳細)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに SpeechConfig::SetOutputFormat を使用します。
SpeechServiceResponse_RequestProfanityFilterTrueFalse	要求された Cognitive Services Speech Service 応答出力の不適切なレベル。現在使用されていません。
SpeechServiceResponse_ProfanityOption	要求された Cognitive Services Speech Service 応答出力の不適切な設定。使用できる値は、"masked"、"removed"、"raw" です。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_PostProcessingOption	サービスで使用する後処理オプションを指定する文字列値。使用できる値は "TrueText" です。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_RequestWordLevelTimestamps	応答結果に単語レベルのタイムスタンプを含めるかどうかを指定するブール値。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_StablePartialResultThreshold	単語が部分的な結果になる必要がある回数を返します。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_OutputFormatOption	応答結果の出力形式オプションを指定する文字列値。内部使用のみです。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_RequestSnr	応答結果に SNR (信号対ノイズ比) を含めるかどうかを指定するブール値。バージョン 1.18.0 で追加されました。
SpeechServiceResponse_TranslationRequestStablePartialResult	末尾の単語を省略して翻訳の一部の結果を安定させるために要求するブール値。バージョン 1.5.0 で追加されました。
SpeechServiceResponse_RequestWordBoundary	WordBoundary イベントを要求するかどうかを指定するブール値。バージョン 1.21.0 で追加されました。
SpeechServiceResponse_RequestPunctuationBoundary	WordBoundary イベントで句読点の境界を要求するかどうかを指定するブール値。既定値は true です。バージョン 1.21.0 で追加されました。
SpeechServiceResponse_RequestSentenceBoundary	WordBoundary イベントで文の境界を要求するかどうかを指定するブール値。既定値は false です。バージョン 1.21.0 で追加されました。
SpeechServiceResponse_SynthesisEventsSyncToAudio	SDK が合成メタデータイベント (単語の境界、口形素など) をオーディオ再生に同期するかどうかを指定するブール値。これは、オーディオが SDK を介して再生される場合にのみ有効になります。既定値は true です。 false に設定すると、SDK はサービスからのイベントを発生させます。これは、オーディオ再生と同期していない可能性があります。バージョン 1.31.0 で追加されました。
SpeechServiceResponse_JsonResult	Cognitive Services Speech Service 応答出力 (JSON 形式)。このプロパティは、認識結果オブジェクトでのみ使用できます。
SpeechServiceResponse_JsonErrorDetails	Cognitive Services Speech Service エラーの詳細 (JSON 形式)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 CancellationDetails::ErrorDetails を使用します。
SpeechServiceResponse_RecognitionLatencyMs	認識待機時間 (ミリ秒単位)。読み取り専用。最終的な音声/翻訳/意図の結果で使用できます。これにより、SDK でオーディオ入力を受信してから、サービスから最終的な結果を受信するまでの待機時間が測定されます。 SDK は、最終的な結果に寄与しているオーディオ入力の最後のオーディオフラグメントと、音声サービスから最終的な結果を受信した時刻の時間差を計算します。バージョン 1.3.0 で追加されました。
SpeechServiceResponse_RecognitionBackend	認識バックエンド。読み取り専用。音声認識結果で使用できます。これは、クラウド (オンライン) または埋め込み (オフライン) 認識を使用して結果を生成したかどうかを示します。
SpeechServiceResponse_SynthesisFirstByteLatencyMs	音声合成の最初のバイト待機時間 (ミリ秒単位)。読み取り専用。最終的な音声合成結果で使用できます。これにより、合成の処理が開始され、最初のバイトオーディオが使用可能になった瞬間までの待機時間が測定されます。バージョン 1.17.0 で追加されました。
SpeechServiceResponse_SynthesisFinishLatencyMs	音声合成のすべてのバイト待機時間 (ミリ秒単位)。読み取り専用。最終的な音声合成結果で使用できます。これにより、合成の処理が開始されたときと、オーディオ全体が合成された瞬間までの待機時間が測定されます。バージョン 1.17.0 で追加されました。
SpeechServiceResponse_SynthesisUnderrunTimeMs	音声合成のアンダーラン時間 (ミリ秒単位)。読み取り専用。SynthesisCompleted イベントの結果で使用できます。これにより、合成が完了するまでの PropertyId::AudioConfig_PlaybackBufferLengthInMs からのアンダーラン時間の合計が測定されます。バージョン 1.17.0 で追加されました。
SpeechServiceResponse_SynthesisConnectionLatencyMs	音声合成接続の待機時間 (ミリ秒単位)。読み取り専用。最終的な音声合成結果で使用できます。これにより、合成の処理が開始され、HTTP/WebSocket 接続が確立された時点までの待機時間が測定されます。バージョン 1.26.0 で追加されました。
SpeechServiceResponse_SynthesisNetworkLatencyMs	音声合成ネットワークの待機時間 (ミリ秒単位)。読み取り専用。最終的な音声合成結果で使用できます。これにより、ネットワークのラウンドトリップ時間が測定されます。バージョン 1.26.0 で追加されました。
SpeechServiceResponse_SynthesisServiceLatencyMs	音声合成サービスの待機時間 (ミリ秒単位)。読み取り専用。最終的な音声合成結果で使用できます。これにより、オーディオの最初のバイトを合成するためのサービス処理時間が測定されます。バージョン 1.26.0 で追加されました。
SpeechServiceResponse_SynthesisBackend	合成が完了したバックエンドを示します。読み取り専用。音声合成結果で使用できます。ただし、SynthesisStarted イベントの結果を除き、バージョン 1.17.0 で追加されました。
CancellationDetails_Reason	取り消しの理由。現在使用されていません。
CancellationDetails_ReasonText	取り消しテキスト。現在使用されていません。
CancellationDetails_ReasonDetailedText	取り消しの詳細なテキスト。現在使用されていません。
LanguageUnderstandingServiceResponse_JsonResult	Language Understanding サービス応答出力 (JSON 形式)。 IntentRecognitionResult.Properties を使用して使用できます。
AudioConfig_DeviceNameForCapture	オーディオキャプチャのデバイス名。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、AudioConfig::FromMicrophoneInput を使用します。注: このプロパティ ID は、バージョン 1.3.0 で追加されました。
AudioConfig_NumberOfChannelsForCapture	オーディオキャプチャ用のチャネルの数。内部使用のみです。注: このプロパティ ID は、バージョン 1.3.0 で追加されました。
AudioConfig_SampleRateForCapture	オーディオキャプチャのサンプルレート (Hz 単位)。内部使用のみです。注: このプロパティ ID は、バージョン 1.3.0 で追加されました。
AudioConfig_BitsPerSampleForCapture	オーディオキャプチャ用の各サンプルのビット数。内部使用のみです。注: このプロパティ ID は、バージョン 1.3.0 で追加されました。
AudioConfig_AudioSource	オーディオソース。使用できる値は、"Microphones"、"File"、および "Stream" です。バージョン 1.3.0 で追加されました。
AudioConfig_DeviceNameForRender	オーディオレンダリングのデバイス名。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、AudioConfig::FromSpeakerOutput を使用します。バージョン 1.14.0 で追加されました。
AudioConfig_PlaybackBufferLengthInMs	再生バッファーの長さ (ミリ秒)、既定値は 50 ミリ秒です。
AudioConfig_AudioProcessingOptions	JSON 形式のオーディオ処理オプション。
Speech_LogFilename	ログを書き込むファイル名。バージョン 1.4.0 で追加されました。
Speech_SegmentationSilenceTimeoutMs	検出された無音の継続時間 (ミリ秒単位)。その後、音声テキスト変換によって音声フレーズが終了したと判断され、最終的な Recognized 結果が生成されます。このタイムアウトを構成すると、音声入力が通常よりも大幅に高速または低速になり、既定のセグメント化動作によって長すぎる、または短すぎる結果が一貫して生成される状況で役立つ場合があります。セグメント化タイムアウト値が不適切に高いか低い場合は、音声テキスト変換の精度に悪影響を及ぼす可能性があります。このプロパティは慎重に構成し、結果の動作を意図したとおりに徹底的に検証する必要があります。
Conversation_ApplicationId	バックエンドサービスへの接続に使用される識別子。バージョン 1.5.0 で追加されました。
Conversation_DialogType	接続するダイアログバックエンドの種類。バージョン 1.7.0 で追加されました。
Conversation_Initial_Silence_Timeout	リッスンの無音タイムアウトバージョン 1.5.0 で追加されました。
Conversation_From_Id	音声認識アクティビティで使用する ID から、バージョン 1.5.0 で追加されました。
Conversation_Conversation_Id	セッションの ConversationId。バージョン 1.8.0 で追加されました。
Conversation_Custom_Voice_Deployment_Ids	カスタム音声展開 ID のコンマ区切りの一覧。バージョン 1.8.0 で追加されました。
Conversation_Speech_Activity_Template	音声アクティビティテンプレート。音声用にサービスによって生成されたアクティビティのテンプレート内のプロパティをスタンプします。バージョン 1.10.0 で追加されました。
Conversation_ParticipantId	現在の会話の参加者識別子。バージョン 1.13.0 で追加されました。
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp	Pull/Push オーディオ入力ストリームを使用するときにクライアントによって書き込まれたデータバッファーに関連付けられたタイムスタンプ。タイムスタンプは、解像度が 90 kHz の 64 ビット値です。これは、MPEG トランスポートストリームのプレゼンテーションタイムスタンプと同じです。「バージョン 1.5.0 で追加されました」を参照してください https://en.wikipedia.org/wiki/Presentation_timestamp 。
DataBuffer_UserId	Pull/Push オーディオ入力ストリームを使用するときにクライアントによって書き込まれたデータバッファーに関連付けられているユーザー ID。バージョン 1.5.0 で追加されました。
PronunciationAssessment_ReferenceText	発音評価用のオーディオの参照テキスト。このパラメーターと次の発音評価パラメーターについては、発音評価パラメーターの表を参照してください。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::Create または PronunciationAssessmentConfig::SetReferenceText を使用します。バージョン 1.14.0 で追加されました。
PronunciationAssessment_GradingSystem	発音スコア調整のポイントシステム (FivePoint または HundredMark)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::Create を使用します。バージョン 1.14.0 で追加されました。
PronunciationAssessment_Granularity	発音評価の粒度 (音素、Word、または FullText)。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::Create を使用します。バージョン 1.14.0 で追加されました。
PronunciationAssessment_EnableMiscue	誤った計算を有効にするかどうかを定義します。これを有効にすると、発音された単語が参照テキストと比較され、比較に基づいて省略または挿入がマークされます。既定の設定は [False] です。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::Create を使用します。バージョン 1.14.0 で追加されました。
PronunciationAssessment_PhonemeAlphabet	発音評価音素アルファベット。有効な値は "SAPI" (既定値) と "IPA" です。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::SetPhonemeAlphabet を使用します。バージョン 1.20.0 で追加されました。
PronunciationAssessment_NBestPhonemeCount	発音評価 nbest 音素数。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::SetNBestPhonemeCount を使用します。バージョン 1.20.0 で追加されました。
PronunciationAssessment_EnableProsodyAssessment	プロソディ評価を有効にするかどうか。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::EnableProsodyAssessment を使用します。バージョン 1.33.0 で追加されました。
PronunciationAssessment_Json	発音評価パラメーターの json 文字列通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::Create を使用します。バージョン 1.14.0 で追加されました。
PronunciationAssessment_Params	発音評価パラメーター。このプロパティは読み取り専用です。 SDK では内部的に使用されています。バージョン 1.14.0 で追加されました。
PronunciationAssessment_ContentTopic	発音評価のコンテンツトピック。通常の状況では、このプロパティを直接使用する必要はありません。代わりに、 PronunciationAssessmentConfig::EnableContentAssessmentWithTopic を使用します。バージョン 1.33.0 で追加されました。
SpeakerRecognition_Api_Version	Speaker Recognition バックエンド API のバージョン。このプロパティは、以前のバージョンの Speaker Recognition API (該当する場合) のテストと使用を可能にするために追加されます。バージョン 1.18.0 で追加されました。
SpeechTranslation_ModelName	音声翻訳に使用するモデルの名前。このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。
SpeechTranslation_ModelKey	音声翻訳に使用するモデルの復号化キー。このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。
KeywordRecognition_ModelName	キーワード (keyword)認識に使用するモデルの名前。このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。
KeywordRecognition_ModelKey	キーワード (keyword)認識に使用するモデルの復号化キー。このプロパティを直接使用しないでください。現在、これは EmbeddedSpeechConfig が使用されている場合にのみ有効です。
EmbeddedSpeech_EnablePerformanceMetrics	埋め込み音声を使用するデバイスの機能を評価するために使用できる埋め込み音声パフォーマンスメトリックのコレクションを有効にします。収集されたデータは、音声認識などの特定のシナリオの結果に含まれます。既定の設定は "false" です。すべての埋め込み音声シナリオでメトリックを使用できない場合があることに注意してください。

音声プロパティ ID を定義します。バージョン 1.4.0 で変更されました。

enum OutputFormat

値	説明
シンプル
詳細

出力形式。

enum ProfanityOption

値	説明
[マスク]	不適切な単語の文字をstar文字に置き換えます。
削除済み	不適切な単語を削除します。
Raw	不適切な言葉には何もしません。

不適切な表現 (悪口) を削除するか、不適切な単語の文字を星で置き換えます。バージョン 1.5.0 で追加されました。

enum ResultReason

値	説明
NoMatch	音声を認識できなかったことを示します。詳細については、NoMatchDetails オブジェクトを参照してください。
Canceled	認識が取り消されたことを示します。詳細については、CancellationDetails オブジェクトを使用して確認できます。
RecognizingSpeech	音声結果に仮説テキストが含まれていることを示します。
RecognizedSpeech	読み上げ結果に、認識された最終的なテキストが含まれていることを示します。これで、このフレーズに対する音声認識が完了しました。
RecognizingIntent	意図の結果に仮説のテキストと意図が含まれていることを示します。
RecognizedIntent	意図の結果に最終的なテキストと意図が含まれていることを示します。これで、音声認識と意図の決定がこのフレーズに対して完了しました。
TranslatingSpeech	翻訳結果に仮説テキストとその翻訳が含まれていることを示します。
TranslatedSpeech	翻訳結果に最終的なテキストと対応する翻訳が含まれていることを示します。これで、このフレーズに対する音声認識と翻訳が完了しました。
合成オーディオ	合成されたオーディオ結果に、0 以外の量のオーディオデータが含まれていることを示します。
SynthesizingAudioCompleted	合成されたオーディオがこのフレーズに対して完了したことを示します。
RecognizingKeyword	音声結果にテキストキーワード (keyword) (未検証) が含まれていることを示します。バージョン 1.3.0 で追加されました。
RecognizedKeyword	指定したキーワード (keyword)キーワード (keyword)認識が完了したことを示します。バージョン 1.3.0 で追加されました。
SynthesizingAudioStarted	音声合成が開始されたことを示します。バージョン 1.4.0 で追加されました。
TranslatingParticipantSpeech	文字起こし結果に、会話の他の参加者の仮説テキストとその翻訳が含まれていることを示します。バージョン 1.8.0 で追加されました。
TranslatedParticipantSpeech	文字起こし結果に、会話の他の参加者の最終的なテキストと対応する翻訳が含まれていることを示します。これで、このフレーズに対する音声認識と翻訳が完了しました。バージョン 1.8.0 で追加されました。
TranslatedInstantMessage	文字起こし結果にインスタントメッセージと対応する翻訳が含まれていることを示します。バージョン 1.8.0 で追加されました。
TranslatedParticipantInstantMessage	文字起こし結果に、会話の他の参加者のインスタントメッセージと、対応する翻訳が含まれていることを示します。バージョン 1.8.0 で追加されました。
EnrollingVoiceProfile	音声プロファイルが登録中であり、お客様は音声プロファイルを作成するためにさらに多くの音声を送信する必要があることを示します。バージョン 1.12.0 で追加されました。
EnrolledVoiceProfile	音声プロファイルが登録されています。バージョン 1.12.0 で追加されました。
RecognizedSpeakers	一部のスピーカーが正常に識別されたことを示します。バージョン 1.12.0 で追加されました。
RecognizedSpeaker	1 人の話者が正常に検証されたことを示します。バージョン 1.12.0 で追加されました。
ResetVoiceProfile	音声プロファイルが正常にリセットされたことを示します。バージョン 1.12.0 で追加されました。
DeletedVoiceProfile	音声プロファイルが正常に削除されたことを示します。バージョン 1.12.0 で追加されました。
VoicesListRetrieved	音声リストが正常に取得されたことを示します。バージョン 1.16.0 で追加されました。

認識結果が生成される可能性がある理由を指定します。

enum CancellationReason

値	説明
エラー	音声認識中にエラーが発生したことを示します。
EndOfStream	オーディオストリームの末尾に達したことを示します。
CancelledByUser	要求がユーザーによって取り消されたことを示します。バージョン 1.14.0 で追加されました。

認識結果が取り消される可能性がある理由を定義します。

enum CancellationErrorCode

値	説明
NoError	エラーなし。 CancellationReason が EndOfStream の場合、CancellationErrorCode は NoError に設定されます。
AuthenticationFailure	認証エラーを示します。サブスクリプションキーまたは承認トークンが無効であるか、有効期限が切れているか、使用されているリージョンと一致しない場合、認証エラーが発生します。
BadRequest	1 つ以上の認識パラメーターが無効であるか、オーディオ形式がサポートされていないことを示します。
TooManyRequests	並列要求の数が、サブスクリプションで許可されている同時文字起こしの数を超えたことを示します。
Forbidden	要求によって使用される無料サブスクリプションがクォータを使い果たしたことを示します。
ConnectionFailure	接続エラーを示します。
ServiceTimeout	サービスからの応答を待機中にタイムアウトエラーが発生したことを示します。
ServiceError	サービスによってエラーが返されることを示します。
ServiceUnavailable	サービスが現在使用できないことを示します。
RuntimeError	予期しないランタイムエラーを示します。
ServiceRedirectTemporary	Speech Service が別のエンドポイントへの再接続を一時的に要求することを示します。
ServiceRedirectPermanent	Speech Service が別のエンドポイントへの再接続を永続的に要求することを示します。
EmbeddedModelError	埋め込み音声 (SR または TTS) モデルが使用できない、または破損したことを示します。

CancellationReason が Error の場合のエラーコードを定義します。バージョン 1.1.0 で追加されました。

enum NoMatchReason

値	説明
NotRecognized	音声が検出されたが認識されなかったことを示します。
InitialSilenceTimeout	オーディオストリームの開始に無音のみが含まれており、サービスが音声の待機中にタイムアウトしたことを示します。
InitialBabbleTimeout	オーディオストリームの開始にノイズのみが含まれており、サービスが音声の待機中にタイムアウトしたことを示します。
KeywordNotRecognized	キーワード (keyword)検証サービスによってスポットされたキーワード (keyword)が拒否されたことを示します。バージョン 1.5.0 で追加されました。
EndSilenceTimeout	オーディオストリームに、最後に認識された語句の後に無音のみが含まれていることを示します。

認識結果が認識されない可能性がある考えられる理由を定義します。

enum ActivityJSONType

値	説明
Null
Object
Array
String
Double
UInt
int
Boolean

アクティビティの json 値に使用できる型を定義します。バージョン 1.5.0 で追加されました。

enum SpeechSynthesisOutputFormat

値	説明
Raw8Khz8BitMonoMULaw	raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren	riff-16khz-16kbps-mono-siren サービスでサポートされていません。この値は使用しないでください。
Audio16Khz16KbpsMonoSiren	audio-16khz-16kbps-mono-siren サービスでサポートされていません。この値は使用しないでください。
Audio16Khz32KBitRateMonoMp3	audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3	audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3	audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3	audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3	audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3	audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk	raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm	riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm	riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm	riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw	riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm	raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm	raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm	raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus	ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus	ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm	raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm	riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3	audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3	audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus	ogg-48khz-16bit-mono-opus バージョン 1.16.0 で追加
Webm16Khz16BitMonoOpus	webm-16khz-16bit-mono-opus バージョン 1.16.0 で追加
Webm24Khz16BitMonoOpus	webm-24khz-16bit-mono-opus バージョン 1.16.0 で追加
Raw24Khz16BitMonoTrueSilk	raw-24khz-16bit-mono-truesilk バージョン 1.17.0 で追加
Raw8Khz8BitMonoALaw	raw-8khz-8bit-mono-alaw バージョン 1.17.0 で追加
Riff8Khz8BitMonoALaw	riff-8khz-8bit-mono-alaw バージョン 1.17.0 で追加
Webm24Khz16Bit24KbpsMonoOpus	WebM コンテナー内の OPUS コーデックによって圧縮された webm-24khz-16bit-24kbps-mono-opus オーディオ。ビットレートは 24 kbps で、IoT シナリオ用に最適化されています。 (1.19.0 で追加)
Audio16Khz16Bit32KbpsMonoOpus	audio-16khz-16bit-32kbps-mono-opus コンテナーなしの OPUS コーデックによって圧縮され、ビットレートは 32 kbps です。 (1.20.0 で追加)
Audio24Khz16Bit48KbpsMonoOpus	audio-24khz-16bit-48kbps-mono-opus コンテナーなしの OPUS コーデックによって圧縮され、ビットレートは 48 kbps です。 (1.20.0 で追加)
Audio24Khz16Bit24KbpsMonoOpus	audio-24khz-16bit-24kbps-mono-opus コンテナーなしの OPUS コーデックによって圧縮されたオーディオ。ビットレートは 24 kbps です。 (1.20.0 で追加)
Raw22050Hz16BitMonoPcm	raw-22050hz-16bit-mono-pcm 22050Hz サンプリングレートと 16 ビット深度での RAW PCM オーディオ。 (1.22.0 で追加)
Riff22050Hz16BitMonoPcm	riff-22050hz-16bit-mono-pcm PCM オーディオ (22050Hz サンプリングレートと 16 ビット深度)、RIFF ヘッダー付き。 (1.22.0 で追加)
Raw44100Hz16BitMonoPcm	raw-44100hz-16bit-mono-pcm 44100Hz サンプリングレートと 16 ビット深度での RAW PCM オーディオ。 (1.22.0 で追加)
Riff44100Hz16BitMonoPcm	riff-44100hz-16bit-mono-pcm PCM オーディオ (44100Hz サンプリングレートと 16 ビット深度)、RIFF ヘッダー付き。 (1.22.0 で追加)
AmrWb16000Hz	amr-wb-16000hz AMR-WB オーディオ (16kHz サンプリングレート)。 (1.24.0 で追加)

可能な音声合成出力オーディオ形式を定義します。バージョン 1.19.0 で更新されました。

enum StreamStatus

値	説明
Unknown	オーディオデータストリームの状態が不明です。
Nodata	オーディオデータストリームにデータが含まれない。
PartialData	オーディオデータストリームには、読み上げ要求の部分的なデータが含まれています。
Alldata	オーディオデータストリームには、speak 要求のすべてのデータが含まれます。
Canceled	オーディオデータストリームが取り消されました。

オーディオデータストリームの使用可能な状態を定義します。バージョン 1.4.0 で追加されました。

enum ServicePropertyChannel

値	説明
UriQueryParameter	URI クエリパラメーターを使用して、プロパティ設定をサービスに渡します。
HttpHeader	HttpHeader を使用して、HTTP ヘッダーにキー/値を設定します。

プロパティ設定をサービスに渡すために使用されるチャネルを定義します。バージョン 1.5.0 で追加されました。

enum VoiceProfileType

値	説明
TextIndependentIdentification	テキストに依存しない話者識別。
TextDependentVerification	テキスト依存の話者の検証。
TextIndependentVerification	テキストに依存しない検証。

音声プロファイルの種類を定義します。

enum RecognitionFactorScope

値	説明
PartialPhrase	認識係数は、個々の部分フレーズとして参照できる文法に適用されます。

認識係数が適用されるスコープを定義します。

enum PronunciationAssessmentGradingSystem

値	説明
FivePoint	5 ポイントの校正。
HundredMark	100 のマーク。

発音スコア調整のポイントシステムを定義します。既定値は FivePoint です。バージョン 1.14.0 で追加されました。

enum PronunciationAssessmentGranularity

値	説明
音素	フルテキスト、単語、音素レベルのスコアを表示します。
Word	フルテキストレベルとワードレベルのスコアを表示します。
FullText	フルテキストレベルでのみスコアを表示します。

発音評価の粒度を定義します。既定値は Phoneme です。バージョン 1.14.0 で追加されました。

enum SynthesisVoiceType

値	説明
OnlineNeural	オンラインニューラル音声。
OnlineStandard	オンライン標準音声。
OfflineNeural	オフラインニューラル音声。
OfflineStandard	オフライン標準音声。

バージョン 1.16.0 で追加された合成音声の種類を定義します。

enum SynthesisVoiceGender

値	説明
Unknown	性別不明。
Female	女性の声。
Male	男性の声。

バージョン 1.17.0 で追加された合成音声の性別を定義します。

enum SpeechSynthesisBoundaryType

値	説明
Word	Word境界。
句読点	句読点の境界。
文	文の境界。

バージョン 1.21.0 で追加された音声合成境界イベントの境界の種類を定義します。

次の方法で共有