Datasets - Create

Laddar upp och skapar en ny datauppsättning genom att hämta data från en angiven URL eller börjar vänta på att datablock ska laddas upp.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string

Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com).

Begärandetext

Name Obligatorisk Typ Description
displayName True

string

Visningsnamnet för objektet.

kind True

DatasetKind

DatasetKind
Typ av dataimport.

locale True

string

Nationella inställningar för inneslutna data.

contentUrl

string

URL:en för datamängden.

customProperties

object

De anpassade egenskaperna för den här entiteten. Den maximala tillåtna nyckellängden är 64 tecken, den maximala tillåtna värdelängden är 256 tecken och antalet tillåtna poster är 10.

description

string

Beskrivningen av objektet.

project

EntityReference

EntityReference

properties

DatasetProperties

DatauppsättningEgenskaper

Svar

Name Typ Description
201 Created

Dataset

Svaret innehåller information om entiteten som nyttolast och dess plats som rubrik.

Sidhuvuden

Location: string

Other Status Codes

Error

Ett fel inträffade.

Säkerhet

Ocp-Apim-Subscription-Key

Ange din cognitive services-kontonyckel här.

Typ: apiKey
I: header

Authorization

Ange en åtkomsttoken från JWT som returneras av STS i den här regionen. Se till att lägga till hanteringsomfånget i token genom att lägga till följande frågesträng i STS-URL:en: ?scope=speechservicesmanagement

Typ: apiKey
I: header

Exempel

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Exempelbegäran

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Exempelsvar

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Exempelbegäran

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Exempelsvar

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definitioner

Name Description
Dataset

Datamängd

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Fel

ErrorCode

Felkod

InnerError

InnerError

Status

Status

TextNormalizationKind

TextNormalizationKind

Dataset

Datamängd

Name Typ Description
contentUrl

string

URL:en för datauppsättningen.

createdDateTime

string

Tidsstämpeln när objektet skapades. Tidsstämpeln kodas som datum- och tidsformatet ISO 8601 ("ÅÅÅÅ-MM-DDThh:mm:ssZ", se https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

De anpassade egenskaperna för den här entiteten. Den maximala tillåtna nyckellängden är 64 tecken, den maximala tillåtna värdelängden är 256 tecken och antalet tillåtna poster är 10.

description

string

Beskrivningen av objektet.

displayName

string

Objektets visningsnamn.

kind

DatasetKind

DatasetKind
Typ av dataimport.

lastActionDateTime

string

Tidsstämpeln när den aktuella statusen angavs. Tidsstämpeln kodas som datum- och tidsformatet ISO 8601 ("ÅÅÅÅ-MM-DDThh:mm:ssZ", se https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

Nationella inställningar för inneslutna data.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

Platsen för den här entiteten.

status

Status

Status
Beskriva API:ets aktuella tillstånd

DatasetKind

DatasetKind

Name Typ Description
Acoustic

string

En akustisk datauppsättning.

AudioFiles

string

En datauppsättning för ljudfiler.

Language

string

En språkdatauppsättning.

LanguageMarkdown

string

En markdown-datauppsättning för språk.

OutputFormatting

string

Datauppsättning som innehåller regler för att anpassa inverterad textnormalisering, versalisering, omformulering, svordomar och definierar även tester för validering av datauppsättningar

Pronunciation

string

En uttalsdatauppsättning.

DatasetLinks

Name Typ Description
commitBlocks

string

Platsen för att checka in listan över block när du laddar upp en datauppsättning med block. Mer information finns i åtgärden "Datasets_CommitBlocks".

files

string

Platsen för att hämta alla filer för den här entiteten. Mer information finns i åtgärden "Datasets_ListFiles".

listBlocks

string

Platsen där du vill visa de redan uppladdade blocken för den här entiteten när du laddar upp en datauppsättning med block. Mer information finns i åtgärden "Datasets_GetBlocks".

uploadBlocks

string

Platsen att ladda upp block till när du laddar upp en datauppsättning med hjälp av block. Mer information finns i åtgärden "Datasets_UploadBlock".

DatasetProperties

DatasetProperties

Name Typ Description
acceptedLineCount

integer

Antalet godkända rader för den här datauppsättningen.

duration

string

Den totala varaktigheten för datauppsättningarna om den innehåller ljudfiler. Varaktigheten kodas som ISO 8601-varaktighet ("PnYnMnDTnHnMnS", se https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

E-postadressen som e-postaviseringar ska skickas till om åtgärden slutförs. Värdet tas bort när e-postmeddelandet har skickats.

error

EntityError

EntityError

rejectedLineCount

integer

Antalet rader som har avvisats för den här datauppsättningen.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Typen av textnormalisering.

DetailedErrorCode

DetailedErrorCode

Name Typ Description
DataImportFailed

string

Dataimporten misslyckades.

DeleteNotAllowed

string

Ta bort tillåts inte.

DeployNotAllowed

string

Distribution tillåts inte.

DeployingFailedModel

string

Distributionen av en misslyckad modell.

EmptyRequest

string

Tom begäran.

EndpointCannotBeDefault

string

Slutpunkten kan inte vara standard.

EndpointNotUpdatable

string

Slutpunkten kan inte uppdateras.

EndpointWithoutLogging

string

Slutpunkt utan loggning.

ExceededNumberOfRecordingsUris

string

Överskred antalet inspelningar uris.

FailedDataset

string

Datauppsättningen misslyckades.

Forbidden

string

Förbjudet.

InUseViolation

string

Vid användningsöverträdelse.

InaccessibleCustomerStorage

string

Otillgänglig kundlagring.

InvalidAdaptationMapping

string

Ogiltig anpassningsmappning.

InvalidBaseModel

string

Ogiltig basmodell.

InvalidCallbackUri

string

Ogiltig återanrops-uri.

InvalidCollection

string

Ogiltig samling.

InvalidDataset

string

Ogiltig datauppsättning.

InvalidDocument

string

Ogiltigt dokument.

InvalidDocumentBatch

string

Ogiltig dokumentbatch.

InvalidLocale

string

Ogiltigt språk.

InvalidLogDate

string

Ogiltigt loggdatum.

InvalidLogEndTime

string

Ogiltig loggsluttid.

InvalidLogId

string

Ogiltigt logg-ID.

InvalidLogStartTime

string

Ogiltig starttid för loggen.

InvalidModel

string

Ogiltig modell.

InvalidModelUri

string

Ogiltig modell-URI.

InvalidParameter

string

Ogiltig parameter.

InvalidParameterValue

string

Ogiltigt parametervärde.

InvalidPayload

string

Ogiltig nyttolast.

InvalidPermissions

string

Ogiltiga behörigheter.

InvalidPrerequisite

string

Ogiltig förutsättning.

InvalidProductId

string

Ogiltigt produkt-ID.

InvalidProject

string

Ogiltigt projekt.

InvalidProjectKind

string

Ogiltig projekttyp.

InvalidRecordingsUri

string

Ogiltig inspelnings-URI.

InvalidRequestBodyFormat

string

Ogiltigt format för begärandetext.

InvalidSasValidityDuration

string

Ogiltig varaktighet för sas-giltighet.

InvalidSkipTokenForLogs

string

Ogiltig hopptoken för loggar.

InvalidSourceAzureResourceId

string

Ogiltigt käll-Azure-resurs-ID.

InvalidSubscription

string

Ogiltig prenumeration.

InvalidTest

string

Ogiltigt test.

InvalidTimeToLive

string

Ogiltig tid att leva.

InvalidTopForLogs

string

Ogiltig överkant för loggar.

InvalidTranscription

string

Ogiltig transkription.

InvalidWebHookEventKind

string

Ogiltig webbhookhändelsetyp.

MissingInputRecords

string

Indataposter saknas.

ModelCopyOperationExists

string

Modellkopieringsåtgärden finns.

ModelDeploymentNotCompleteState

string

Modelldistributionen är inte fullständigt.

ModelDeprecated

string

Modellen är inaktuell.

ModelExists

string

Modellen finns.

ModelMismatch

string

Modellmatchningsfel.

ModelNotDeployable

string

Modellen kan inte distribueras.

ModelVersionIncorrect

string

Modellversionen är felaktig.

NoUtf8WithBom

string

Ingen utf8 med bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Endast en av URL:erna eller containern eller datauppsättningen.

ProjectGenderMismatch

string

Matchningsfel för projektkön.

QuotaViolation

string

Kvotöverträdelse.

SingleDefaultEndpoint

string

Enskild standardslutpunkt.

SkuLimitsExist

string

Det finns SKU-gränser.

SubscriptionNotFound

string

Det går inte att hitta prenumerationen.

UnexpectedError

string

Oväntat fel.

UnsupportedClassBasedAdaptation

string

Klassbaserad anpassning stöds inte.

UnsupportedDelta

string

Delta stöds inte.

UnsupportedDynamicConfiguration

string

Dynamisk konfiguration stöds inte.

UnsupportedFilter

string

Filter som inte stöds.

UnsupportedLanguageCode

string

Språkkod som inte stöds.

UnsupportedOrderBy

string

Order som inte stöds av.

UnsupportedPagination

string

Sidnumrering stöds inte.

UnsupportedTimeRange

string

Tidsintervallet stöds inte.

EntityError

EntityError

Name Typ Description
code

string

Koden för det här felet.

message

string

Meddelandet för det här felet.

EntityReference

EntityReference

Name Typ Description
self

string

Platsen för den refererade entiteten.

Error

Fel

Name Typ Description
code

ErrorCode

Felkod
Felkoder på hög nivå.

details

Error[]

Ytterligare stödjande information om fel- och/eller förväntade principer.

innerError

InnerError

InnerError
Nytt format för inre fel som överensstämmer med Cognitive Services API Guidelines som finns på https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Detta innehåller de obligatoriska egenskaperna ErrorCode, message och optional properties target, details(key value pair), inner error(this can be nested).

message

string

Felmeddelande på hög nivå.

target

string

Källan till felet. Det skulle till exempel vara "dokument" eller "dokument-ID" om dokumentet är ogiltigt.

ErrorCode

Felkod

Name Typ Description
Conflict

string

Representerar konfliktfelkoden.

Forbidden

string

Representerar den förbjudna felkoden.

InternalCommunicationFailed

string

Representerar felkoden för den interna kommunikationen misslyckades.

InternalServerError

string

Representerar den interna felkoden för servern.

InvalidArgument

string

Representerar den ogiltiga argumentfelkoden.

InvalidRequest

string

Representerar den ogiltiga felkoden för begäran.

NotAllowed

string

Representerar den felkod som inte tillåts.

NotFound

string

Representerar felkoden hittades inte.

PipelineError

string

Representerar felkoden för pipelinefel.

ServiceUnavailable

string

Representerar felkoden för tjänsten som inte är tillgänglig.

TooManyRequests

string

Representerar felkoden för för många begäranden.

Unauthorized

string

Representerar den obehöriga felkoden.

UnprocessableEntity

string

Representerar felkoden för entiteten som inte kan bearbetas.

UnsupportedMediaType

string

Representerar felkoden för medietypen som inte stöds.

InnerError

InnerError

Name Typ Description
code

DetailedErrorCode

DetailedErrorCode
Detaljerad felkodsuppräkning.

details

object

Ytterligare stödjande information om fel- och/eller förväntade principer.

innerError

InnerError

InnerError
Nytt format för inre fel som överensstämmer med Cognitive Services API Guidelines som finns på https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Detta innehåller de obligatoriska egenskaperna ErrorCode, message och optional properties target, details(key value pair), inner error(this can be nested).

message

string

Felmeddelande på hög nivå.

target

string

Källan till felet. Det skulle till exempel vara "dokument" eller "dokument-ID" om dokumentet är ogiltigt.

Status

Status

Name Typ Description
Failed

string

Den långvariga åtgärden misslyckades.

NotStarted

string

Den långvariga åtgärden har ännu inte startats.

Running

string

Den tidskrävande åtgärden bearbetas för närvarande.

Succeeded

string

Den långvariga åtgärden har slutförts.

TextNormalizationKind

TextNormalizationKind

Name Typ Description
Default

string

Standardtextnormalisering (t.ex. "2 till 3" ersätts med "två till tre" i en-US).

None

string

Ingen textnormalisering tillämpas på indatatexten. Det här är ett åsidosättningsalternativ som endast ska användas när text normaliseras före uppladdningen.