データ インジェストのプロパティ
データ インジェストは、テーブルにデータを追加し、クエリで使用できるようにするプロセスです。 インジェスト コマンドの with
キーワードの後ろにプロパティを追加します。
インジェストのプロパティ
重要
キュー内のインジェスト データは、インジェスト プロパティを使用してバッチ処理されます。 異なる ConstValue 値など、使用されるインジェスト マッピング プロパティが異なるほど、インジェストの断片化が増え、パフォーマンスが低下する可能性があります。
次の表に、サポートされているプロパティの一覧と説明を示し、例を示します。
プロパティ | 説明 | 例 |
---|---|---|
ingestionMapping |
ソース ファイルのデータをテーブルの実際の列にマップする方法を示す文字列値。 関連するマッピングの種類を使用して format の値を定義します。 「データ マッピング」を参照してください。 |
with (format="json", ingestionMapping = "[{\"column\":\"rownumber\", \"Properties\":{\"Path\":\"$.RowNumber\"}}, {\"column\":\"rowguid\", \"Properties\":{\"Path\":\"$.RowGuid\"}}]") (非推奨: avroMapping 、csvMapping 、jsonMapping ) |
ingestionMappingReference |
名前付きマッピング ポリシー オブジェクトを使用して、ソース ファイルのデータをテーブルの実際の列にマップする方法を示す文字列値。 関連するマッピングの種類を使用して format の値を定義します。 「データ マッピング」を参照してください。 |
with (format="csv", ingestionMappingReference = "Mapping1") (非推奨: avroMappingReference 、csvMappingReference 、jsonMappingReference ) |
creationTime |
取り込まれたデータ エクステントの作成時刻に使用する datetime 値 (ISO8601 文字列の形式)。 指定しない場合は、現在の値 (now() ) が使用されます。 保持ポリシーが正しく適用されるように、古いデータを取り込む場合は、既定値をオーバーライドすると便利です。 指定する場合、ターゲット テーブルの有効なエクステント マージ ポリシーの Lookback プロパティが、指定した値と整合していることを確認します。 |
with (creationTime="2017-02-13") |
extend_schema |
指定した場合、テーブルのスキーマを拡張するようにコマンドに指示するブール値 (既定値は false )。 このオプションは、.append コマンドと .set-or-append コマンドにのみ適用されます。 許可されるスキーマ拡張機能の最後には、テーブルに追加される列が増えています。 |
元のテーブル スキーマが (a:string, b:int) の場合、有効なスキーマ拡張は (a:string, b:int, c:datetime, d:string) になりますが、(a:string, c:datetime) は有効にはなりません |
folder |
ingest-from-query コマンドの場合、テーブルに割り当てるフォルダー。 テーブルが既に存在する場合、このプロパティはテーブルのフォルダーをオーバーライドします。 | with (folder="Tables/Temporary") |
format |
データ形式 (サポートされるデータ形式に関する記事を参照してください)。 | with (format="csv") |
ingestIfNotExists |
指定した場合、同じ値を持つ、ingest-by: タグでタグが付けられたデータが既にテーブルにある場合、インジェストが成功しないようにする文字列値。 これにより、べき等データ インジェストが確保されます。 詳細については、ingest-by: タグに関する記事を参照してください。 |
プロパティ with (ingestIfNotExists='["Part0001"]', tags='["ingest-by:Part0001"]') は、タグ ingest-by:Part0001 を備えたデータが既に存在する場合、現在のインジェストが完了されないことを示します。 まだ存在しない場合は、(今後インジェストで同じデータが再び取り込もうとされた場合に備えて、) この新しいインジェストにこのタグが設定されている必要があります。 |
ignoreFirstRecord |
true に設定されている場合、インジェストで、すべてのファイルの最初のレコードを無視することを示すブール値。 このプロパティは、ファイルの最初のレコードが列名である場合に、CSV および同様の形式のファイルに対して有用です。 既定では、false が想定されます。 |
with (ignoreFirstRecord=false) |
policy_ingestiontime |
ブール値。指定されている場合、このコマンドで作成されるテーブルで IngestionTime ポリシーを有効にするかどうかを記述します 既定では、 true です。 |
with (policy_ingestiontime=false) |
recreate_schema |
指定した場合、コマンドでテーブルのスキーマを再作成するかどうかを示すブール値。 このプロパティは、.set-or-replace コマンドに対してのみ適用されます。 両方が設定されている場合、extend_schema プロパティよりもこのプロパティが優先されます。 |
with (recreate_schema=true) |
tags |
JSON 文字列として書式設定された、取り込まれたデータに関連付けられるタグの一覧。 | with (tags="['Tag1', 'Tag2']") |
TreatGzAsUncompressed |
true に設定されている場合は、拡張子が.gz のファイルが圧縮されていないことを示すブール値。 このフラグは、Amazon AWS S3 から取り込むときに必要になることがあります。 |
with (treatGzAsUncompressed=true) |
validationPolicy |
CSV 形式を使用して表されるデータの取り込み中に実行する検証を示す JSON 文字列。 さまざまなオプションの説明については、「データ インジェスト」を参照してください。 | with (validationPolicy='{"ValidationOptions":1, "ValidationImplications":1}') (これが既定のポリシーです) |
zipPattern |
ZIP アーカイブを持つストレージからデータを取り込むときに、このプロパティを使用します。 これは、取り込む ZIP アーカイブ内のファイルを選択するときに使用する正規表現を示す文字列値です。 アーカイブ内の他のすべてのファイルは無視されます。 | with (zipPattern="*.csv") |
関連するコンテンツ
- サポートされるデータ形式の詳細を確認する
- データ インジェストの詳細を確認する