Datasets - Create
Laddar upp och skapar en ny datauppsättning genom att hämta data från en angiven URL eller börjar vänta på att datablock ska laddas upp.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com). |
Begärandetext
Name | Obligatorisk | Typ | Description |
---|---|---|---|
displayName | True |
string |
Visningsnamnet för objektet. |
kind | True |
DatasetKind |
|
locale | True |
string |
Nationella inställningar för inneslutna data. |
contentUrl |
string |
URL:en för datamängden. |
|
customProperties |
object |
De anpassade egenskaperna för den här entiteten. Den maximala tillåtna nyckellängden är 64 tecken, den maximala tillåtna värdelängden är 256 tecken och antalet tillåtna poster är 10. |
|
description |
string |
Beskrivningen av objektet. |
|
project |
EntityReference |
||
properties |
DatauppsättningEgenskaper |
Svar
Name | Typ | Description |
---|---|---|
201 Created |
Svaret innehåller information om entiteten som nyttolast och dess plats som rubrik. Sidhuvuden Location: string |
|
Other Status Codes |
Ett fel inträffade. |
Säkerhet
Ocp-Apim-Subscription-Key
Ange din cognitive services-kontonyckel här.
Typ:
apiKey
I:
header
Authorization
Ange en åtkomsttoken från JWT som returneras av STS i den här regionen. Se till att lägga till hanteringsomfånget i token genom att lägga till följande frågesträng i STS-URL:en: ?scope=speechservicesmanagement
Typ:
apiKey
I:
header
Exempel
Create a dataset with content url |
Create dataset from data blocks |
Create a dataset with content url
Exempelbegäran
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"contentUrl": "https://contoso.com/location",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Exempelsvar
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Create dataset from data blocks
Exempelbegäran
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Exempelsvar
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
"commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
"listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
"uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "NotStarted",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definitioner
Name | Description |
---|---|
Dataset |
Datamängd |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Fel |
Error |
Felkod |
Inner |
InnerError |
Status |
Status |
Text |
TextNormalizationKind |
Dataset
Datamängd
Name | Typ | Description |
---|---|---|
contentUrl |
string |
URL:en för datauppsättningen. |
createdDateTime |
string |
Tidsstämpeln när objektet skapades. Tidsstämpeln kodas som datum- och tidsformatet ISO 8601 ("ÅÅÅÅ-MM-DDThh:mm:ssZ", se https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
De anpassade egenskaperna för den här entiteten. Den maximala tillåtna nyckellängden är 64 tecken, den maximala tillåtna värdelängden är 256 tecken och antalet tillåtna poster är 10. |
description |
string |
Beskrivningen av objektet. |
displayName |
string |
Objektets visningsnamn. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
Tidsstämpeln när den aktuella statusen angavs. Tidsstämpeln kodas som datum- och tidsformatet ISO 8601 ("ÅÅÅÅ-MM-DDThh:mm:ssZ", se https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
Nationella inställningar för inneslutna data. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
Platsen för den här entiteten. |
status |
Status |
DatasetKind
DatasetKind
Name | Typ | Description |
---|---|---|
Acoustic |
string |
En akustisk datauppsättning. |
AudioFiles |
string |
En datauppsättning för ljudfiler. |
Language |
string |
En språkdatauppsättning. |
LanguageMarkdown |
string |
En markdown-datauppsättning för språk. |
OutputFormatting |
string |
Datauppsättning som innehåller regler för att anpassa inverterad textnormalisering, versalisering, omformulering, svordomar och definierar även tester för validering av datauppsättningar |
Pronunciation |
string |
En uttalsdatauppsättning. |
DatasetLinks
DatasetLinks
Name | Typ | Description |
---|---|---|
commitBlocks |
string |
Platsen för att checka in listan över block när du laddar upp en datauppsättning med block. Mer information finns i åtgärden "Datasets_CommitBlocks". |
files |
string |
Platsen för att hämta alla filer för den här entiteten. Mer information finns i åtgärden "Datasets_ListFiles". |
listBlocks |
string |
Platsen där du vill visa de redan uppladdade blocken för den här entiteten när du laddar upp en datauppsättning med block. Mer information finns i åtgärden "Datasets_GetBlocks". |
uploadBlocks |
string |
Platsen att ladda upp block till när du laddar upp en datauppsättning med hjälp av block. Mer information finns i åtgärden "Datasets_UploadBlock". |
DatasetProperties
DatasetProperties
Name | Typ | Description |
---|---|---|
acceptedLineCount |
integer |
Antalet godkända rader för den här datauppsättningen. |
duration |
string |
Den totala varaktigheten för datauppsättningarna om den innehåller ljudfiler. Varaktigheten kodas som ISO 8601-varaktighet ("PnYnMnDTnHnMnS", se https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
E-postadressen som e-postaviseringar ska skickas till om åtgärden slutförs. Värdet tas bort när e-postmeddelandet har skickats. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
Antalet rader som har avvisats för den här datauppsättningen. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Name | Typ | Description |
---|---|---|
DataImportFailed |
string |
Dataimporten misslyckades. |
DeleteNotAllowed |
string |
Ta bort tillåts inte. |
DeployNotAllowed |
string |
Distribution tillåts inte. |
DeployingFailedModel |
string |
Distributionen av en misslyckad modell. |
EmptyRequest |
string |
Tom begäran. |
EndpointCannotBeDefault |
string |
Slutpunkten kan inte vara standard. |
EndpointNotUpdatable |
string |
Slutpunkten kan inte uppdateras. |
EndpointWithoutLogging |
string |
Slutpunkt utan loggning. |
ExceededNumberOfRecordingsUris |
string |
Överskred antalet inspelningar uris. |
FailedDataset |
string |
Datauppsättningen misslyckades. |
Forbidden |
string |
Förbjudet. |
InUseViolation |
string |
Vid användningsöverträdelse. |
InaccessibleCustomerStorage |
string |
Otillgänglig kundlagring. |
InvalidAdaptationMapping |
string |
Ogiltig anpassningsmappning. |
InvalidBaseModel |
string |
Ogiltig basmodell. |
InvalidCallbackUri |
string |
Ogiltig återanrops-uri. |
InvalidCollection |
string |
Ogiltig samling. |
InvalidDataset |
string |
Ogiltig datauppsättning. |
InvalidDocument |
string |
Ogiltigt dokument. |
InvalidDocumentBatch |
string |
Ogiltig dokumentbatch. |
InvalidLocale |
string |
Ogiltigt språk. |
InvalidLogDate |
string |
Ogiltigt loggdatum. |
InvalidLogEndTime |
string |
Ogiltig loggsluttid. |
InvalidLogId |
string |
Ogiltigt logg-ID. |
InvalidLogStartTime |
string |
Ogiltig starttid för loggen. |
InvalidModel |
string |
Ogiltig modell. |
InvalidModelUri |
string |
Ogiltig modell-URI. |
InvalidParameter |
string |
Ogiltig parameter. |
InvalidParameterValue |
string |
Ogiltigt parametervärde. |
InvalidPayload |
string |
Ogiltig nyttolast. |
InvalidPermissions |
string |
Ogiltiga behörigheter. |
InvalidPrerequisite |
string |
Ogiltig förutsättning. |
InvalidProductId |
string |
Ogiltigt produkt-ID. |
InvalidProject |
string |
Ogiltigt projekt. |
InvalidProjectKind |
string |
Ogiltig projekttyp. |
InvalidRecordingsUri |
string |
Ogiltig inspelnings-URI. |
InvalidRequestBodyFormat |
string |
Ogiltigt format för begärandetext. |
InvalidSasValidityDuration |
string |
Ogiltig varaktighet för sas-giltighet. |
InvalidSkipTokenForLogs |
string |
Ogiltig hopptoken för loggar. |
InvalidSourceAzureResourceId |
string |
Ogiltigt käll-Azure-resurs-ID. |
InvalidSubscription |
string |
Ogiltig prenumeration. |
InvalidTest |
string |
Ogiltigt test. |
InvalidTimeToLive |
string |
Ogiltig tid att leva. |
InvalidTopForLogs |
string |
Ogiltig överkant för loggar. |
InvalidTranscription |
string |
Ogiltig transkription. |
InvalidWebHookEventKind |
string |
Ogiltig webbhookhändelsetyp. |
MissingInputRecords |
string |
Indataposter saknas. |
ModelCopyOperationExists |
string |
Modellkopieringsåtgärden finns. |
ModelDeploymentNotCompleteState |
string |
Modelldistributionen är inte fullständigt. |
ModelDeprecated |
string |
Modellen är inaktuell. |
ModelExists |
string |
Modellen finns. |
ModelMismatch |
string |
Modellmatchningsfel. |
ModelNotDeployable |
string |
Modellen kan inte distribueras. |
ModelVersionIncorrect |
string |
Modellversionen är felaktig. |
NoUtf8WithBom |
string |
Ingen utf8 med bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Endast en av URL:erna eller containern eller datauppsättningen. |
ProjectGenderMismatch |
string |
Matchningsfel för projektkön. |
QuotaViolation |
string |
Kvotöverträdelse. |
SingleDefaultEndpoint |
string |
Enskild standardslutpunkt. |
SkuLimitsExist |
string |
Det finns SKU-gränser. |
SubscriptionNotFound |
string |
Det går inte att hitta prenumerationen. |
UnexpectedError |
string |
Oväntat fel. |
UnsupportedClassBasedAdaptation |
string |
Klassbaserad anpassning stöds inte. |
UnsupportedDelta |
string |
Delta stöds inte. |
UnsupportedDynamicConfiguration |
string |
Dynamisk konfiguration stöds inte. |
UnsupportedFilter |
string |
Filter som inte stöds. |
UnsupportedLanguageCode |
string |
Språkkod som inte stöds. |
UnsupportedOrderBy |
string |
Order som inte stöds av. |
UnsupportedPagination |
string |
Sidnumrering stöds inte. |
UnsupportedTimeRange |
string |
Tidsintervallet stöds inte. |
EntityError
EntityError
Name | Typ | Description |
---|---|---|
code |
string |
Koden för det här felet. |
message |
string |
Meddelandet för det här felet. |
EntityReference
EntityReference
Name | Typ | Description |
---|---|---|
self |
string |
Platsen för den refererade entiteten. |
Error
Fel
Name | Typ | Description |
---|---|---|
code |
Felkod |
|
details |
Error[] |
Ytterligare stödjande information om fel- och/eller förväntade principer. |
innerError |
InnerError |
|
message |
string |
Felmeddelande på hög nivå. |
target |
string |
Källan till felet. Det skulle till exempel vara "dokument" eller "dokument-ID" om dokumentet är ogiltigt. |
ErrorCode
Felkod
Name | Typ | Description |
---|---|---|
Conflict |
string |
Representerar konfliktfelkoden. |
Forbidden |
string |
Representerar den förbjudna felkoden. |
InternalCommunicationFailed |
string |
Representerar felkoden för den interna kommunikationen misslyckades. |
InternalServerError |
string |
Representerar den interna felkoden för servern. |
InvalidArgument |
string |
Representerar den ogiltiga argumentfelkoden. |
InvalidRequest |
string |
Representerar den ogiltiga felkoden för begäran. |
NotAllowed |
string |
Representerar den felkod som inte tillåts. |
NotFound |
string |
Representerar felkoden hittades inte. |
PipelineError |
string |
Representerar felkoden för pipelinefel. |
ServiceUnavailable |
string |
Representerar felkoden för tjänsten som inte är tillgänglig. |
TooManyRequests |
string |
Representerar felkoden för för många begäranden. |
Unauthorized |
string |
Representerar den obehöriga felkoden. |
UnprocessableEntity |
string |
Representerar felkoden för entiteten som inte kan bearbetas. |
UnsupportedMediaType |
string |
Representerar felkoden för medietypen som inte stöds. |
InnerError
InnerError
Name | Typ | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Ytterligare stödjande information om fel- och/eller förväntade principer. |
innerError |
InnerError |
|
message |
string |
Felmeddelande på hög nivå. |
target |
string |
Källan till felet. Det skulle till exempel vara "dokument" eller "dokument-ID" om dokumentet är ogiltigt. |
Status
Status
Name | Typ | Description |
---|---|---|
Failed |
string |
Den långvariga åtgärden misslyckades. |
NotStarted |
string |
Den långvariga åtgärden har ännu inte startats. |
Running |
string |
Den tidskrävande åtgärden bearbetas för närvarande. |
Succeeded |
string |
Den långvariga åtgärden har slutförts. |
TextNormalizationKind
TextNormalizationKind
Name | Typ | Description |
---|---|---|
Default |
string |
Standardtextnormalisering (t.ex. "2 till 3" ersätts med "två till tre" i en-US). |
None |
string |
Ingen textnormalisering tillämpas på indatatexten. Det här är ett åsidosättningsalternativ som endast ska användas när text normaliseras före uppladdningen. |