IndexingParametersConfiguration interface
Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.
Özellikler
allow |
True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan //document//file_data yolunu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar. |
data |
Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, Azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir. |
delimited |
CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakter sınırlayıcısını belirtir (örneğin, "|"). |
delimited |
CSV blobları için, kaynak alanları bir dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir. |
document |
Yapılandırılmış veya yarı yapılandırılmış bir belge verilip JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz. |
excluded |
Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaların üzerine atlamak için ".png, .mp4" hariç tutabilirsiniz. |
execution |
Dizin oluşturucunun yürütülmesi gereken ortamı belirtir. |
fail |
Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine eklemeye devam etmek istiyorsanız false olarak ayarlayın. |
fail |
Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizine eklemeye devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın. |
first |
CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgiler içerdiğini gösterir. |
image |
Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "hiçbiri" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir. |
indexed |
Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarına dizin oluşturmayı odaklayabilirsiniz. |
index |
Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük boyutlu bloblar varsayılan olarak hata olarak kabul edilir. Blob boyutuyla ilgili sınırlar için bkz https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. . |
parsing |
Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder. |
pdf |
Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler. |
query |
"ss:mm:ss" biçiminde belirtilen Azure SQL veritabanı veri kaynakları için zaman aşımını 5 dakikalık varsayılandan daha fazla artırır. |
Özellik Ayrıntıları
allowSkillsetToReadFileData
True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan //document//file_data yolunu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.
allowSkillsetToReadFileData?: boolean
Özellik Değeri
boolean
dataToExtract
Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, Azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Özellik Değeri
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakter sınırlayıcısını belirtir (örneğin, "|").
delimitedTextDelimiter?: string
Özellik Değeri
string
delimitedTextHeaders
CSV blobları için, kaynak alanları bir dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.
delimitedTextHeaders?: string
Özellik Değeri
string
documentRoot
Yapılandırılmış veya yarı yapılandırılmış bir belge verilip JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.
documentRoot?: string
Özellik Değeri
string
excludedFileNameExtensions
Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaların üzerine atlamak için ".png, .mp4" hariç tutabilirsiniz.
excludedFileNameExtensions?: string
Özellik Değeri
string
executionEnvironment
Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.
executionEnvironment?: "standard" | "private"
Özellik Değeri
"standard" | "private"
failOnUnprocessableDocument
Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine eklemeye devam etmek istiyorsanız false olarak ayarlayın.
failOnUnprocessableDocument?: boolean
Özellik Değeri
boolean
failOnUnsupportedContentType
Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizine eklemeye devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.
failOnUnsupportedContentType?: boolean
Özellik Değeri
boolean
firstLineContainsHeaders
CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgiler içerdiğini gösterir.
firstLineContainsHeaders?: boolean
Özellik Değeri
boolean
imageAction
Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "hiçbiri" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Özellik Değeri
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarına dizin oluşturmayı odaklayabilirsiniz.
indexedFileNameExtensions?: string
Özellik Değeri
string
indexStorageMetadataOnlyForOversizedDocuments
Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük boyutlu bloblar varsayılan olarak hata olarak kabul edilir. Blob boyutuyla ilgili sınırlar için bkz https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. .
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Özellik Değeri
boolean
parsingMode
Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
Özellik Değeri
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Özellik Değeri
"none" | "detectAngles"
queryTimeout
"ss:mm:ss" biçiminde belirtilen Azure SQL veritabanı veri kaynakları için zaman aşımını 5 dakikalık varsayılandan daha fazla artırır.
queryTimeout?: string
Özellik Değeri
string