IndexingParametersConfiguration interface

インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。

プロパティ

allowSkillsetToReadFileData

true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、エンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに、元のファイル データを渡すことができます。

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の.jpgや.pngなどのイメージ ファイルに適用されます。

delimitedTextDelimiter

CSV BLOB の場合、 は、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。

delimitedTextHeaders

CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

executionEnvironment

インデクサーを実行する環境を指定します。

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツ タイプが見つかったときにインデックス作成を続行し、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。

firstLineContainsHeaders

CSV BLOB の場合、 は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

indexedFileNameExtensions

Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、インデックス作成を特定のアプリケーション ファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity

parsingMode

Azure BLOB データ ソースからのインデックス作成の解析モードを表します。

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。

queryTimeout

"hh:mm:ss" の形式で指定された、Azure SQLデータベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。

プロパティの詳細

allowSkillsetToReadFileData

true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、エンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに、元のファイル データを渡すことができます。

allowSkillsetToReadFileData?: boolean

プロパティ値

boolean

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の.jpgや.pngなどのイメージ ファイルに適用されます。

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

プロパティ値

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV BLOB の場合、 は、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。

delimitedTextDelimiter?: string

プロパティ値

string

delimitedTextHeaders

CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

delimitedTextHeaders?: string

プロパティ値

string

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

documentRoot?: string

プロパティ値

string

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

excludedFileNameExtensions?: string

プロパティ値

string

executionEnvironment

インデクサーを実行する環境を指定します。

executionEnvironment?: "standard" | "private"

プロパティ値

"standard" | "private"

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnprocessableDocument?: boolean

プロパティ値

boolean

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツ タイプが見つかったときにインデックス作成を続行し、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。

failOnUnsupportedContentType?: boolean

プロパティ値

boolean

firstLineContainsHeaders

CSV BLOB の場合、 は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

firstLineContainsHeaders?: boolean

プロパティ値

boolean

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

プロパティ値

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、インデックス作成を特定のアプリケーション ファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。

indexedFileNameExtensions?: string

プロパティ値

string

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity

indexStorageMetadataOnlyForOversizedDocuments?: boolean

プロパティ値

boolean

parsingMode

Azure BLOB データ ソースからのインデックス作成の解析モードを表します。

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

プロパティ値

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。

pdfTextRotationAlgorithm?: "none" | "detectAngles"

プロパティ値

"none" | "detectAngles"

queryTimeout

"hh:mm:ss" の形式で指定された、Azure SQLデータベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。

queryTimeout?: string

プロパティ値

string