Microsoft.MachineLearningServices ワークスペース/データセット 2020-05-01-preview

Bicep リソース定義

ワークスペース/データセットのリソースの種類は、次をターゲットとする操作でデプロイできます。

各 API バージョンの変更されたプロパティの一覧については、「 変更ログ」を参照してください。

リソース形式

Microsoft.MachineLearningServices/workspaces/datasets リソースを作成するには、次の Bicep をテンプレートに追加します。

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

プロパティ値

workspaces/datasets

名前 説明
name リソース名

Bicep で子リソースの名前と型を設定する方法を参照してください。
string (必須)
parent Bicep では、子リソースの親リソースを指定できます。 このプロパティを追加する必要があるのは、子リソースが親リソースの外部で宣言されている場合のみです。

詳細については、「 親リソースの外部にある子リソース」を参照してください。
種類のリソースのシンボル名: ワークスペース
datasetType データセットの種類を指定します。 'file'
'tabular' (必須)
parameters DatasetCreateRequestParameters (必須)
登録 DatasetCreateRequestRegistration (必須)
skipValidation 登録前にデータセットからデータを読み込むことができる検証をスキップします。 [bool]
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

名前 説明
header ヘッダーの種類。 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath パス情報をデータセット内に列として保持するかどうかを示すブール値。 既定値は False です。 これは、複数のファイルを読み取り、特定のレコードがどのファイルから生成されたかを把握したい場合や、ファイル パスに有用な情報を保持したい場合に便利です。 [bool]
partitionFormat 各パスのパーティション情報は、指定された形式に基づいて列に抽出されます。 形式の '{column_name}' の部分では文字列の列が、'{column_name:yyyy/MM/dd/HH/mm/ss}' では datetime の列が作成されます。ここで、'yyyy'、'MM'、'dd'、'HH'、'mm'、'ss' は datetime 型の年、月、日、時、分、秒の抽出に使用されます。 形式は、最初のパーティション キーの位置から始まり、ファイル パスの末尾までになります。 たとえば、パス '../USA/2019/01/01/data.parquet' で、パーティションが国/地域と時刻別である場合、partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' は、値 'USA' と datetime 列 'PartitionDate' と値 '2019-01-10' の文字列列 'CountryOrRegion' を作成します string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator 'delimited_files' sourceType の列を分割するために使用される区切り記号。 string
sourceType データ ソースの種類。 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

名前 説明
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL。 string

DatasetCreateRequestParametersPathDataPath

名前 説明
datastoreName データストア名。 string
relativePath データストア内のパス。 string

DatasetCreateRequestParametersQuery

名前 説明
datastoreName SQL/PostgreSQL/MySQL データストア名。 string
query SQL Quey。 string

DatasetCreateRequestRegistration

名前 説明
description データセットの説明。 string
name データセットの名前です。 string
tags データセットに関連付けられているタグ。 object

DatasetCreateRequestTimeSeries

名前 説明
coarseGrainTimestamp CoarseGrainTimestamp として使用する列名。 'fineGrainTimestamp' が指定されていて、'fineGrainTimestamp' と同じにできない場合にのみ使用できます。 string
fineGrainTimestamp FineGrainTimestamp として使用する列名 string

クイック スタート テンプレート

次のクイックスタート テンプレートでは、このリソースの種類をデプロイします。

Template 説明
データストアの相対パスからファイル データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースのデータストアの相対パスからファイル データセットを作成します。
Web URL から AML ワークスペースにファイル データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの Web URL からファイル データセットを作成します。
データストアの相対パスから表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースのデータストアの相対パスから表形式データセットを作成します。
SQL/PostgreSQL/MySQL データストアから表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの SQL/PostgreSQL/MySQL データストアの SQL クエリから表形式データセットを作成します。
Web URL から AML ワークスペースに表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの Web URL から表形式データセットを作成します。
データストア & 複数のデータセットを含む AML ワークスペースを作成する

Azure にデプロイする
このテンプレートは、データストア & 複数のデータセットを含む Azure Machine Learning ワークスペースを作成します。

ARM テンプレート リソース定義

ワークスペース/データセットリソースの種類は、次を対象とする操作でデプロイできます。

各 API バージョンの変更されたプロパティの一覧については、「 変更ログ」を参照してください。

リソース形式

Microsoft.MachineLearningServices/workspaces/datasets リソースを作成するには、次の JSON をテンプレートに追加します。

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

プロパティ値

workspaces/datasets

名前 説明
type リソースの種類 'Microsoft.MachineLearningServices/workspaces/datasets'
apiVersion リソース API のバージョン '2020-05-01-preview'
name リソース名

JSON ARM テンプレートで子リソースの名前と型を設定する方法を参照してください。
string (必須)
datasetType データセットの種類を指定します。 'file'
'tabular' (必須)
parameters DatasetCreateRequestParameters (必須)
登録 DatasetCreateRequestRegistration (必須)
skipValidation 登録前にデータセットからデータを読み込むことができる検証をスキップします。 [bool]
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

名前 説明
header ヘッダーの種類。 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath パス情報をデータセットの列として保持するブール値。 既定値は False です。 これは、複数のファイルを読み取り、特定のレコードがどのファイルから生成されたかを把握したい場合や、ファイル パスに有用な情報を保持したい場合に便利です。 [bool]
partitionFormat 各パスのパーティション情報は、指定された形式に基づいて列に抽出されます。 形式の '{column_name}' の部分では文字列の列が、'{column_name:yyyy/MM/dd/HH/mm/ss}' では datetime の列が作成されます。ここで、'yyyy'、'MM'、'dd'、'HH'、'mm'、'ss' は datetime 型の年、月、日、時、分、秒の抽出に使用されます。 形式は、最初のパーティション キーの位置から始まり、ファイル パスの末尾までになります。 たとえば、パス '../USA/2019/01/01/data.parquet' (パーティションが国/地域と時間別である) partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' は、値 'USA' と datetime 列 'PartitionDate' と値 '2019-01-10' の文字列列 'CountryOrRegion' を作成します string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator 'delimited_files' sourceType の列を分割するために使用される区切り記号。 string
sourceType データ ソースの種類。 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

名前 説明
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL。 string

DatasetCreateRequestParametersPathDataPath

名前 説明
datastoreName データストア名。 string
relativePath データストア内のパス。 string

DatasetCreateRequestParametersQuery

名前 説明
datastoreName SQL/PostgreSQL/MySQL データストア名。 string
query SQL Quey。 string

DatasetCreateRequestRegistration

名前 説明
description データセットの説明。 string
name データセットの名前です。 string
tags データセットに関連付けられているタグ。 object

DatasetCreateRequestTimeSeries

名前 説明
coarseGrainTimestamp CoarseGrainTimestamp として使用する列名。 'fineGrainTimestamp' が指定されていて、'fineGrainTimestamp' と同じにできない場合にのみ使用できます。 string
fineGrainTimestamp FineGrainTimestamp として使用する列名 string

クイック スタート テンプレート

次のクイックスタート テンプレートでは、このリソースの種類をデプロイします。

Template 説明
データストアの相対パスからファイル データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースのデータストアの相対パスからファイル データセットを作成します。
Web URL から AML ワークスペースにファイル データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの Web URL からファイル データセットを作成します。
データストアの相対パスから表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースのデータストアの相対パスから表形式データセットを作成します。
SQL/PostgreSQL/MySQL データストアから表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの SQL/PostgreSQL/MySQL データストアの SQL クエリから表形式データセットを作成します。
Web URL から AML ワークスペースに表形式データセットを作成する

Azure にデプロイする
このテンプレートは、Azure Machine Learning ワークスペースの Web URL から表形式データセットを作成します。
データストア & 複数のデータセットを含む AML ワークスペースを作成する

Azure にデプロイする
このテンプレートは、データストア & 複数のデータセットを含む Azure Machine Learning ワークスペースを作成します。

Terraform (AzAPI プロバイダー) リソース定義

ワークスペース/データセットリソースの種類は、次を対象とする操作でデプロイできます。

  • リソース グループ

各 API バージョンの変更されたプロパティの一覧については、「 変更ログ」を参照してください。

リソース形式

Microsoft.MachineLearningServices/workspaces/datasets リソースを作成するには、次の Terraform をテンプレートに追加します。

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

プロパティ値

workspaces/datasets

名前 説明
type リソースの種類 "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name リソース名 string (必須)
parent_id このリソースの親であるリソースの ID。 種類のリソースの ID: ワークスペース
datasetType データセットの種類を指定します。 "file"
"表形式" (必須)
parameters DatasetCreateRequestParameters (必須)
登録 DatasetCreateRequestRegistration (必須)
skipValidation 登録前にデータセットからデータを読み込むことができる検証をスキップします。 [bool]
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

名前 説明
header ヘッダーの種類。 "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath パス情報をデータセットの列として保持するブール値。 既定値は False です。 これは、複数のファイルを読み取り、特定のレコードがどのファイルから生成されたかを把握したい場合や、ファイル パスに有用な情報を保持したい場合に便利です。 [bool]
partitionFormat 各パスのパーティション情報は、指定された形式に基づいて列に抽出されます。 形式の '{column_name}' の部分では文字列の列が、'{column_name:yyyy/MM/dd/HH/mm/ss}' では datetime の列が作成されます。ここで、'yyyy'、'MM'、'dd'、'HH'、'mm'、'ss' は datetime 型の年、月、日、時、分、秒の抽出に使用されます。 形式は、最初のパーティション キーの位置から始まり、ファイル パスの末尾までになります。 たとえば、パス '../USA/2019/01/01/data.parquet' で、パーティションが国/地域と時刻別である場合、partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' は、値 'USA' と datetime 列 'PartitionDate' と値 '2019-01-10' の文字列列 'CountryOrRegion' を作成します string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator 'delimited_files' sourceType の列を分割するために使用される区切り記号。 string
sourceType データ ソースの種類。 "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

名前 説明
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL。 string

DatasetCreateRequestParametersPathDataPath

名前 説明
datastoreName データストア名。 string
relativePath データストア内のパス。 string

DatasetCreateRequestParametersQuery

名前 説明
datastoreName SQL/PostgreSQL/MySQL データストア名。 string
query SQL Quey。 string

DatasetCreateRequestRegistration

名前 説明
description データセットの説明。 string
name データセットの名前です。 string
tags データセットに関連付けられているタグ。 object

DatasetCreateRequestTimeSeries

名前 説明
coarseGrainTimestamp CoarseGrainTimestamp として使用する列名。 'fineGrainTimestamp' が指定されていて、'fineGrainTimestamp' と同じにできない場合にのみ使用できます。 string
fineGrainTimestamp FineGrainTimestamp として使用する列名 string