IndexingParametersConfiguration interface
インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。
プロパティ
allow |
true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、エンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに、元のファイル データを渡すことができます。 |
data |
Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の.jpgや.pngなどのイメージ ファイルに適用されます。 |
delimited |
CSV BLOB の場合、 は、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。 |
delimited |
CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。 |
document |
JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。 |
excluded |
Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。 |
execution |
インデクサーを実行する環境を指定します。 |
fail |
Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。 |
fail |
Azure BLOB の場合、サポートされていないコンテンツ タイプが見つかったときにインデックス作成を続行し、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。 |
first |
CSV BLOB の場合、 は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。 |
image |
Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。 |
indexed |
Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、インデックス作成を特定のアプリケーション ファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。 |
index |
Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity。 |
parsing |
Azure BLOB データ ソースからのインデックス作成の解析モードを表します。 |
pdf |
Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。 |
query |
"hh:mm:ss" の形式で指定された、Azure SQLデータベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。 |
プロパティの詳細
allowSkillsetToReadFileData
true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、エンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに、元のファイル データを渡すことができます。
allowSkillsetToReadFileData?: boolean
プロパティ値
boolean
dataToExtract
Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の.jpgや.pngなどのイメージ ファイルに適用されます。
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
プロパティ値
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
CSV BLOB の場合、 は、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。
delimitedTextDelimiter?: string
プロパティ値
string
delimitedTextHeaders
CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。
delimitedTextHeaders?: string
プロパティ値
string
documentRoot
JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。
documentRoot?: string
プロパティ値
string
excludedFileNameExtensions
Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。
excludedFileNameExtensions?: string
プロパティ値
string
executionEnvironment
インデクサーを実行する環境を指定します。
executionEnvironment?: "standard" | "private"
プロパティ値
"standard" | "private"
failOnUnprocessableDocument
Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。
failOnUnprocessableDocument?: boolean
プロパティ値
boolean
failOnUnsupportedContentType
Azure BLOB の場合、サポートされていないコンテンツ タイプが見つかったときにインデックス作成を続行し、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。
failOnUnsupportedContentType?: boolean
プロパティ値
boolean
firstLineContainsHeaders
CSV BLOB の場合、 は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。
firstLineContainsHeaders?: boolean
プロパティ値
boolean
imageAction
Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
プロパティ値
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、インデックス作成を特定のアプリケーション ファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。
indexedFileNameExtensions?: string
プロパティ値
string
indexStorageMetadataOnlyForOversizedDocuments
Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity。
indexStorageMetadataOnlyForOversizedDocuments?: boolean
プロパティ値
boolean
parsingMode
Azure BLOB データ ソースからのインデックス作成の解析モードを表します。
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
プロパティ値
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。
pdfTextRotationAlgorithm?: "none" | "detectAngles"
プロパティ値
"none" | "detectAngles"
queryTimeout
"hh:mm:ss" の形式で指定された、Azure SQLデータベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。
queryTimeout?: string
プロパティ値
string