IndexingParametersConfiguration interface

リファレンス

パッケージ:: @azure/search-documents

インデクサー固有の構成プロパティのディクショナリ。各名前は、特定のプロパティの名前です。各値はプリミティブ型である必要があります。

プロパティ

allowSkillsetToReadFileData	true の場合、BLOB データソースからダウンロードされた元のファイルデータを表すオブジェクトであるパス //document//file_data が作成されます。これにより、エンリッチメントパイプライン内で処理するためのカスタムスキルまたはドキュメント抽出スキルに、元のファイルデータを渡すことができます。
dataToExtract	Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の.jpgや.pngなどのイメージファイルに適用されます。
delimitedTextDelimiter	CSV BLOB の場合、は、各行が新しいドキュメント ("\|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。
delimitedTextHeaders	CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソースフィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。
documentRoot	JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。
excludedFileNameExtensions	Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。
executionEnvironment	インデクサーを実行する環境を指定します。
failOnUnprocessableDocument	Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。
failOnUnsupportedContentType	Azure BLOB の場合、サポートされていないコンテンツタイプが見つかったときにインデックス作成を続行し、すべてのコンテンツタイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。
firstLineContainsHeaders	CSV BLOB の場合、は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。
imageAction	Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
indexedFileNameExtensions	Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。たとえば、インデックス作成を特定のアプリケーションファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。
indexStorageMetadataOnlyForOversizedDocuments	Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージメタデータのインデックスを作成するには、このプロパティを true に設定します。サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity。
parsingMode	Azure BLOB データソースからのインデックス作成の解析モードを表します。
pdfTextRotationAlgorithm	Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。
queryTimeout	"hh:mm:ss" の形式で指定された、Azure SQLデータベースデータソースの 5 分間の既定値を超えてタイムアウトを増やします。

プロパティの詳細

allowSkillsetToReadFileData

true の場合、BLOB データソースからダウンロードされた元のファイルデータを表すオブジェクトであるパス //document//file_data が作成されます。これにより、エンリッチメントパイプライン内で処理するためのカスタムスキルまたはドキュメント抽出スキルに、元のファイルデータを渡すことができます。

allowSkillsetToReadFileData?: boolean

プロパティ値

boolean

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、画像コンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の.jpgや.pngなどのイメージファイルに適用されます。

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

プロパティ値

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV BLOB の場合、は、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の 1 文字区切り記号を指定します。

delimitedTextDelimiter?: string

プロパティ値

string

delimitedTextHeaders

CSV BLOB の場合は、列ヘッダーのコンマ区切りのリストを指定します。これは、ソースフィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

delimitedTextHeaders?: string

プロパティ値

string

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

documentRoot?: string

プロパティ値

string

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

excludedFileNameExtensions?: string

プロパティ値

string

executionEnvironment

インデクサーを実行する環境を指定します。

executionEnvironment?: "standard" | "private"

プロパティ値

"standard" | "private"

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnprocessableDocument?: boolean

プロパティ値

boolean

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツタイプが見つかったときにインデックス作成を続行し、すべてのコンテンツタイプ (ファイル拡張子) を事前に把握していない場合は、false に設定します。

failOnUnsupportedContentType?: boolean

プロパティ値

boolean

firstLineContainsHeaders

CSV BLOB の場合、は、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

firstLineContainsHeaders?: boolean

プロパティ値

boolean

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

プロパティ値

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure BLOB ストレージから処理するときに選択するファイル名拡張子のコンマ区切りの一覧。たとえば、インデックス作成を特定のアプリケーションファイル ".docx, .pptx, .msg" に集中させ、これらのファイルの種類を具体的に含めることができます。

indexedFileNameExtensions?: string

プロパティ値

string

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージメタデータのインデックスを作成するには、このプロパティを true に設定します。サイズが大きい BLOB は、既定ではエラーとして扱われます。 BLOB サイズの制限については、「」を参照してください https://docs.microsoft.com/azure/search/search-limits-quotas-capacity。

indexStorageMetadataOnlyForOversizedDocuments?: boolean

プロパティ値

boolean

parsingMode

Azure BLOB データソースからのインデックス作成の解析モードを表します。

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

プロパティ値

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからのテキスト抽出のアルゴリズムを決定します。

pdfTextRotationAlgorithm?: "none" | "detectAngles"

プロパティ値

"none" | "detectAngles"

queryTimeout

"hh:mm:ss" の形式で指定された、Azure SQLデータベースデータソースの 5 分間の既定値を超えてタイムアウトを増やします。

queryTimeout?: string

プロパティ値

string

次の方法で共有

IndexingParametersConfiguration interface

プロパティ

プロパティの詳細

allowSkillsetToReadFileData

プロパティ値

dataToExtract

プロパティ値

delimitedTextDelimiter

プロパティ値

delimitedTextHeaders

プロパティ値

documentRoot

プロパティ値

excludedFileNameExtensions

プロパティ値

executionEnvironment

プロパティ値

failOnUnprocessableDocument

プロパティ値

failOnUnsupportedContentType

プロパティ値

firstLineContainsHeaders

プロパティ値

imageAction

プロパティ値

indexedFileNameExtensions

プロパティ値

indexStorageMetadataOnlyForOversizedDocuments

プロパティ値

parsingMode

プロパティ値

pdfTextRotationAlgorithm

プロパティ値

queryTimeout

プロパティ値

その他のリソース