Custom Speech モデルのライフサイクル
Custom Speech モデルは、カスタム エンドポイントにデプロイした後、しばらくの間、使用できます。 新しいモデルが利用可能になると、古いモデルは廃止されます。 向上した精度と品質を利用するには、最新の基本モデルからカスタム モデルを定期的に再作成してトレーニングする必要があります。
モデルのライフサイクルに関連する主な用語は次のとおりです。
- トレーニング: 基本モデルを選択し、テキスト データやオーディオ データを使用して、ドメインやシナリオに合わせてカスタマイズすること。 REST API プロパティなどの一部のコンテキストでは、トレーニングは適応とも呼ばれます。
- 文字起こし: モデルを使用して音声認識を実行すること (音声をテキストにデコードする)。
- エンドポイント: 自分だけがアクセスできる基本モデルまたはカスタム モデルの特定のデプロイ。
注意
F0
Speech リソースによって使用されるエンドポイントは、7 日後に削除されます。
有効期限のタイムライン
モデル適応と文字起こしの有効期限のタイムラインを次に示します。
- トレーニングは、Microsoft が基本モデルを作成した四半期から 1 年間利用できます。
- 基本モデルでの文字起こしは、Microsoft が基本モデルを作成した四半期から 2 年間利用できます。
- カスタム モデルでの文字起こしは、基本モデルを作成した四半期から 2 年間利用できます。
この場合、四半期は 1 月 15 日、4 月 15 日、7 月 15 日、10 月 15 日に終了します。
モデルの有効期限が切れたときの操作
カスタム モデルまたは基本モデルの有効期限が切れると、文字起こしに使用できなくなります。 カスタム音声エンドポイントで使用されるモデルは、ダウンタイムなしで変更できます。
文字起こしルート | 期限切れのモデルの結果 | 推奨 |
---|---|---|
カスタム エンドポイント | 音声認識要求は、同じロケールの最新の基本モデルにフォールバックします。 結果は得られますが、認識によってドメイン データが正確に文字起こしされない場合があります。 | 「Custom Speech モデルのデプロイ」ガイドの説明に従って、エンドポイントのモデルを更新します。 |
バッチ文字起こし | 期限切れのモデルのバッチ文字起こし要求は、4xx エラーで失敗します。 | 各 Transcriptions_Create REST API 要求本文で、model プロパティを、期限切れになっていない基本モデルまたはカスタム モデルに設定します。 それ以外の場合は、最新の基本モデルを常に使用する model プロパティを含めないでください。 |
基本モデルの有効期限を取得する
カスタム モデルを作成したときに、トレーニングに基本モデルを使用できる最後の日付が表示されました。 詳細については、「Custom Speech モデルのトレーニング」を参照してください。
基本モデルの文字起こしの有効期限の取得には、次の手順に従います。
Speech Studio にサインインします。
[Custom Speech]> プロジェクト名 >[モデルをデプロイする] を選択します。
モデルの有効期限が [有効期限] 列に表示されます。 この日付は、文字起こしにモデルを使用できる最後の日付です。
基本モデルのトレーニングと文字起こしの有効期限を取得するには、 spx csr model status
コマンドを使用します。 次の手順に従って要求パラメーターを作成します。
url
パラメーターを、取得する基本モデルの URI に設定します。spx csr list --base
コマンドを実行して、すべてのロケールで使用可能な基本モデルを取得できます。
基本モデルのトレーニングと文字起こしの有効期限を取得する Speech CLI コマンドの例を次に示します。
spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f
応答では、adaptationDateTime
プロパティの日付をメモしておきます。 このプロパティは、トレーニングに基本モデルを使用できる最後の日付です。 transcriptionDateTime
プロパティの日付もメモしておきます。 この日付は、文字起こしに基本モデルを使用できる最後の日付です。
次の形式で応答本文を受け取る必要があります。
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
モデルに関する Speech CLI ヘルプを表示するには、次のコマンドを実行します。
spx help csr model
基本モデルのトレーニングと文字起こしの有効期限を取得するには、Speech to text REST API の Models_ListBaseModel 操作を使用します。 Models_ListBaseModels 要求を行って、すべてのロケールで使用可能な基本モデルを取得できます。
次の例に示すように、モデル URI を使用して HTTP GET 要求を行います。 BaseModelId
をモデル ID に置き換え、YourSubscriptionKey
を音声リソース キーに置き換えて、YourServiceRegion
を音声リソース リージョンに置き換えます。
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
応答では、adaptationDateTime
プロパティの日付をメモしておきます。 この日付は、トレーニングに基本モデルを使用できる最後の日付です。 transcriptionDateTime
プロパティの日付もメモしておきます。 この日付は、文字起こしに基本モデルを使用できる最後の日付です。
次の形式で応答本文を受け取る必要があります。
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
カスタム モデルの有効期限を取得する
カスタム モデルの文字起こしの有効期限を取得するには、次の手順に従います。
Speech Studio にサインインします。
[Custom Speech]> プロジェクト名 >[カスタム モデルのトレーニング] を選択します。
カスタム モデルの有効期限が [有効期限] 列に表示されます。 この日付は、文字起こしにカスタム モデルを使用できる最後の日付です。 基本モデルは、[カスタム モデルのトレーニング] ページには表示されません。
次の手順に従って、カスタム モデルの文字起こしの有効期限の取得もできます。
Speech Studio にサインインします。
[Custom Speech]> プロジェクト名 >[モデルをデプロイする] を選択します。
モデルの有効期限が [有効期限] 列に表示されます。 この日付は、文字起こしにモデルを使用できる最後の日付です。
カスタム モデルの文字起こしの有効期限の取得には、spx csr model status
コマンドを使用します。 次の手順に従って要求パラメーターを作成します。
url
パラメーターを、取得するモデルの URI に設定します。YourModelId
はモデル ID のキーに置き換えて、YourServiceRegion
は音声リソースのリージョンに置き換えます。
カスタム モデルの文字起こしの有効期限を取得する Speech CLI コマンドの例を次に示します。
spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId
応答では、transcriptionDateTime
プロパティの日付をメモしておきます。 この日付は、文字起こしにカスタム モデルを使用できる最後の日付です。 カスタム モデルは他のカスタム モデルのトレーニングに使用されないため、adaptationDateTime
プロパティは適用されません。
次の形式で応答本文を受け取る必要があります。
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}
モデルに関する Speech CLI ヘルプを表示するには、次のコマンドを実行します。
spx help csr model
カスタム モデルの文字起こしの有効期限を取得するには、Speech to text REST API の Models_GetCustomModel 操作を使用します。
次の例に示すように、モデル URI を使用して HTTP GET 要求を行います。 YourModelId
をモデル ID に置き換え、YourSubscriptionKey
を音声リソース キーに置き換えて、YourServiceRegion
を音声リソース リージョンに置き換えます。
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
応答では、transcriptionDateTime
プロパティの日付をメモしておきます。 この日付は、文字起こしにカスタム モデルを使用できる最後の日付です。 カスタム モデルは他のカスタム モデルのトレーニングに使用されないため、adaptationDateTime
プロパティは適用されません。
次の形式で応答本文を受け取る必要があります。
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}