SharePoint belge kitaplıklarından dizin verileri

Önemli

SharePoint Online dizin oluşturucu desteği genel önizleme aşamasındadır. Ek Kullanım Koşulları altında "olduğu gibi" sunulur ve yalnızca en iyi çabayla desteklenir. Önizleme özellikleri üretim iş yükleri için önerilmez ve genel kullanıma sunulması garanti edilmez.

Başlamadan önce bilinen sınırlamalar bölümünü ziyaret edin.

Bu önizlemeyi kullanmak için bu formu doldurun. Herhangi bir erişim isteği gönderildikten sonra otomatik olarak kabul edildiği için hemen sonrasında onay bildirimi almazsınız. Erişim etkinleştirildikten sonra içeriğinizin dizinini oluşturmak için önizleme REST API'sini kullanın.

Bu makalede, Azure AI Search'te tam metin araması için SharePoint belge kitaplıklarında depolanan belgelerin dizinini oluşturmak için arama dizin oluşturucusunu yapılandırma açıklanmaktadır. Yapılandırma adımları önce, ardından davranışlar ve senaryolar eklenir

İşlev

Azure AI Search'teki dizin oluşturucu, bir veri kaynağından aranabilir verileri ve meta verileri ayıklayan bir gezgindir. SharePoint Online dizin oluşturucu, SharePoint sitenize bağlanır ve bir veya daha fazla belge kitaplığındaki belgeleri dizinler. Dizin oluşturucu aşağıdaki işlevleri sağlar:

  • Bir veya daha fazla belge kitaplığındaki dosyaları ve meta verileri dizine alın.
  • Yalnızca yeni ve değiştirilmiş dosyaları ve meta verileri alarak artımlı olarak dizin oluşturun.
  • Silme algılama yerleşik olarak bulunur. Belge kitaplığındaki silme işlemi sonraki dizin oluşturucu çalıştırmasında alınır ve belge dizinden kaldırılır.
  • Metin ve normalleştirilmiş görüntüler, dizine alınan belgelerden varsayılan olarak ayıklanır. İsteğe bağlı olarak, OCR veya metin çevirisi gibi daha derin yapay zeka zenginleştirmesi için bir beceri kümesi ekleyebilirsiniz.

Önkoşullar

Desteklenen belge biçimleri

SharePoint Online dizin oluşturucu aşağıdaki belge biçimlerinden metin ayıklayabilir:

  • CSV (bkz. CSV bloblarının dizinini oluşturma)
  • EML
  • EPUB
  • GZ
  • HTML
  • JSON (bkz. JSON bloblarını dizinleme)
  • KML (coğrafi gösterimler için XML)
  • Microsoft Office biçimleri: DOCX/DOC/DOCM, XLSX/XLS/XLSM, PPTX/PPT/PPTM, MSG (Outlook e-postaları), XML (hem 2003 hem de 2006 WORD XML)
  • Belge biçimlerini açma: ODT, ODS, ODP
  • PDF
  • Düz metin dosyaları (ayrıca bkz. Düz metin dizini oluşturma)
  • RTF
  • XML
  • ZIP

Sınırlamalar ve önemli noktalar

Bu özelliğin sınırlamaları şunlardır:

  • SharePoint Listelerinin dizinlenmesi desteklenmez.

  • SharePoint dizini oluşturma. ASPX site içeriği desteklenmez.

  • OneNote not defteri dosyaları desteklenmez.

  • Özel uç nokta desteklenmez.

  • SharePoint klasörünü yeniden adlandırmak artımlı dizin oluşturmayı tetiklemez. Yeniden adlandırılan bir klasör yeni içerik olarak değerlendirilir.

  • SharePoint, belge düzeyinde kullanıcı başına erişimi belirleyen ayrıntılı bir yetkilendirme modelini destekler. Dizin oluşturucu bu izinleri dizine çekmez ve Azure AI Search belge düzeyinde yetkilendirmeyi desteklemez. Bir belge SharePoint'ten arama hizmetine dizinlendiğinde, içerik dizine okuma erişimi olan herkes tarafından kullanılabilir. Belge düzeyinde izinlere ihtiyacınız varsa, sonuçları kırpmak ve izinleri dosya düzeyinde dizindeki bir alana kopyalamayı otomatikleştirmek için güvenlik filtrelerini göz önünde bulundurmanız gerekir.

  • Kullanıcı tarafından şifrelenen dosyaların dizinlenmesi, Bilgi Hakları Yönetimi (IRM) korumalı dosyalar, parolalı ZIP dosyaları veya benzer şifrelenmiş içerikler desteklenmez. Şifrelenmiş içeriğin işlenmesi için, belirli bir dosya üzerinde uygun izinlere sahip olan kullanıcının, dizin oluşturucu bir sonraki zamanlanmış yinelemeyi çalıştırdığında öğenin uygun şekilde dizine alınabilmesi için şifrelemeyi kaldırması gerekir.

  • Sağlanan belirli bir siteden özyinelemeli olarak alt siteleri dizine ekleme desteklenmez.

  • Microsoft ENTRA KIMLIĞI Koşullu Erişim etkinleştirildiğinde SharePoint Online dizin oluşturucu desteklenmez.

Bu özelliği kullanırken dikkat edilmesi gerekenler şunlardır:

  • SharePoint verileriyle sohbet etmek için özel bir Copilot / RAG (Alma Artırılmış Nesil) uygulaması oluşturmanız gerekiyorsa, önerilen yaklaşım bu önizleme özelliği yerine Microsoft Copilot Studio'yu kullanmaktır.

  • Üretim ortamında bir SharePoint içerik dizinleme çözümüne ihtiyacınız varsa, SharePoint Web Kancaları ile özel bir bağlayıcı oluşturmayı, verileri bir Azure Blob kapsayıcısına aktarmak için Microsoft Graph API'sini çağırmayı ve ardından artımlı dizin oluşturma için Azure blob dizin oluşturucusunu kullanmayı göz önünde bulundurun.

  • SharePoint yapılandırmanız Microsoft 365 işlemlerinin SharePoint dosya sistemi meta verilerini güncelleştirmesine izin veriyorsa, bu güncelleştirmelerin SharePoint Online dizin oluşturucusunu tetikleyebildiğini ve dizin oluşturucunun belgeleri birden çok kez almasına neden olabileceğini unutmayın. SharePoint Online dizin oluşturucu, Azure'a yönelik bir üçüncü taraf bağlayıcısı olduğundan, dizin oluşturucu yapılandırmayı okuyamaz veya davranışını değiştiremez. Bu güncelleştirmelerin nasıl yapıldığına bakılmaksızın yeni ve değiştirilmiş içerikteki değişikliklere yanıt verir. Bu nedenle, dizin oluşturucuyu ve yapay zeka zenginleştirmesini kullanmadan önce kurulumunuzu test edip belge işleme sayısını anladığınızdan emin olun.

SharePoint Online dizin oluşturucusunu yapılandırma

SharePoint Online dizin oluşturucusunu ayarlamak için hem Azure portalını hem de önizleme REST API'sini kullanın. 2020-06-30-preview veya üzerini kullanabilirsiniz. En son önizleme API'sini öneririz.

Bu bölümde adımlar sağlanır. Aşağıdaki videoyu da izleyebilirsiniz.

1. Adım (İsteğe bağlı): Sistem tarafından atanan yönetilen kimliği etkinleştirme

Arama hizmetinin sağlandığı kiracıyı otomatik olarak algılamak için sistem tarafından atanan yönetilen kimliği etkinleştirin.

SharePoint sitesi arama hizmetiyle aynı kiracıdaysa bu adımı gerçekleştirin. SharePoint sitesi farklı bir kiracıdaysa bu adımı atlayın. Kimlik dizin oluşturmak için kullanılmaz, yalnızca kiracı algılama için kullanılır. Kiracı kimliğini bağlantı dizesi eklemek istiyorsanız bu adımı atlayabilirsiniz.

Sistem tarafından atanan yönetilen kimliğin nasıl etkinleştirildiğini gösteren ekran görüntüsü.

Kaydet'i seçtikten sonra, arama hizmetinize atanmış bir Nesne Kimliği alırsınız.

Nesne tanımlayıcısının ekran görüntüsü.

2. Adım: Dizin oluşturucunun hangi izinleri gerektirdiğine karar verme

SharePoint Online dizin oluşturucu hem temsilci hem de uygulama izinlerini destekler. Senaryonuza göre kullanmak istediğiniz izinleri seçin.

Uygulama tabanlı izinler önerilir. Temsilci izinleri ile ilgili bilinen sorunlar için sınırlamalara bakın.

  • Dizin oluşturucunun tüm sitelere ve dosyalara erişimi olan SharePoint kiracısının kimliği altında çalıştığı uygulama izinleri (önerilir). Dizin oluşturucu bir istemci gizli dizisi gerektirir. Dizin oluşturucu, herhangi bir içeriğin dizinini oluşturabilmesi için kiracı yöneticisi onayı da gerektirir.

  • Dizin oluşturucunun isteği gönderen kullanıcı veya uygulamanın kimliği altında çalıştığı temsilci izinleri. Veri erişimi, çağıranın erişimi olan site ve dosyalarla sınırlıdır. Temsilci izinlerini desteklemek için dizin oluşturucu, kullanıcı adına oturum açmak için bir cihaz kodu istemi gerektirir. Kullanıcı tarafından atanan izinler, bu kimlik doğrulama türünü uygulamak için kullanılan en son güvenlik kitaplıkları başına her 75 dakikada bir belirteç süre sonu uygular. Bu, ayarlanabilen bir davranış değildir. Süresi dolan belirteç, Dizin Oluşturucuyu Çalıştır (önizleme) kullanılarak el ile dizin oluşturma gerektirir. Bu nedenle, bunun yerine uygulama tabanlı izinler isteyebilirsiniz.

3. Adım: Microsoft Entra uygulama kaydı oluşturma

SharePoint Online dizin oluşturucu, kimlik doğrulaması için bu Microsoft Entra uygulamasını kullanır.

  1. Azure Portal’ında oturum açın.

  2. Microsoft Entra Id'yi arayın veya adresine gidin, ardından Uygulama kayıtları'ı seçin.

  3. + Yeni kayıt'ı seçin:

    1. Uygulamanız için bir ad belirtin.
    2. Tek kiracı'ya tıklayın.
    3. URI belirleme adımını atlayın. Yeniden yönlendirme URI'sine gerek yoktur.
    4. Kaydet'i seçin.
  4. Sol tarafta API izinleri'ni, ardından İzin ekle'yi ve ardından Microsoft Graph'ı seçin.

    • Dizin oluşturucu uygulama API'si izinlerini kullanıyorsa Uygulama izinleri'ni seçin ve aşağıdakileri ekleyin:

      • Uygulama - Files.Read.All
      • Uygulama - Sites.Read.All

      Uygulama API'si izinlerinin ekran görüntüsü.

      Uygulama izinlerinin kullanılması, dizin oluşturucunun SharePoint sitesine hizmet bağlamında eriştiği anlamına gelir. Bu nedenle, dizin oluşturucuyu çalıştırdığınızda SharePoint kiracısında kiracı yöneticisi onayı gerektiren tüm içeriğe erişebilir. Kimlik doğrulaması için bir istemci gizli dizisi de gereklidir. İstemci gizli dizisinin ayarlanması bu makalenin devamında açıklanmıştır.

    • Dizin oluşturucu temsilcili API izinlerini kullanıyorsa, Temsilci izinleri'ni seçin ve aşağıdakileri ekleyin:

      • Temsilci - Files.Read.All
      • Temsilci - Sites.Read.All
      • Temsilci - User.Read

      Temsilci api izinlerini gösteren ekran görüntüsü.

      Temsilci izinleri, arama istemcisinin geçerli kullanıcının güvenlik kimliği altında SharePoint'e bağlanmasına izin verir.

  5. Yönetici onayı verin.

    Uygulama API'si izinleri kullanılırken kiracı yöneticisi onayı gereklidir. Bazı kiracılar, temsilci API izinleri için de kiracı yöneticisi onayı gerektiği şekilde kilitlenir. Bu koşullardan biri geçerliyse, dizin oluşturucuyu oluşturmadan önce kiracı yöneticisinin bu Microsoft Entra uygulaması için onay vermesi gerekir.

    Microsoft Entra uygulamasının yönetici onayı verme işlemini gösteren ekran görüntüsü.

  6. Kimlik Doğrulaması sekmesini seçin.

  7. Genel istemci akışlarına izin ver'i Evet olarak ayarlayın ve Kaydet'i seçin.

  8. + Platform ekle'yi, ardından Mobil ve masaüstü uygulamaları'ı ve ardından Yapılandır'ı seçinhttps://login.microsoftonline.com/common/oauth2/nativeclient.

    Microsoft Entra uygulama kimlik doğrulaması yapılandırmasını gösteren ekran görüntüsü.

  9. (Yalnızca Uygulama API İzinleri) Uygulama izinlerini kullanarak Microsoft Entra uygulamasında kimlik doğrulaması yapmak için dizin oluşturucu bir istemci gizli dizisi gerektirir.

    • Soldaki menüden Sertifikalar ve Gizli Diziler'i, ardından İstemci gizli dizileri'ni ve ardından Yeni istemci gizli dizisi'ni seçin.

      Yeni istemci gizli dizilerini gösteren ekran görüntüsü.

    • Açılan menüde yeni istemci gizli dizisi için bir açıklama girin. Gerekirse son kullanma tarihini ayarlayın. Gizli dizinin süresi dolarsa yeniden oluşturulması ve dizin oluşturucunun yeni gizli diziyle güncelleştirilmesi gerekir.

      İstemci gizli dizisinin nasıl ayarlandığını gösteren ekran görüntüsü.

    • Yeni gizli dizi gizli dizi, gizli dizi listesinde görünür. Sayfadan uzaklaştıktan sonra gizli dizi artık görünmez, bu nedenle kopyala düğmesini kullanarak kopyalayın ve güvenli bir konuma kaydedin.

      İstemci gizli dizisinin kopyalandığı yeri gösteren ekran görüntüsü.

4. Adım: Veri kaynağı oluşturma

Bu bölümden başlayarak, kalan adımlar için önizleme REST API'sini kullanın. En son önizleme API'sini öneririz.

Veri kaynağı, verilerdeki değişiklikleri (yeni, değiştirilmiş veya silinmiş satırlar) verimli bir şekilde tanımlamak için dizine eklenecek verileri, kimlik bilgilerini ve ilkeleri belirtir. Bir veri kaynağı, aynı arama hizmetinde birden çok dizin oluşturucu tarafından kullanılabilir.

SharePoint dizin oluşturma için veri kaynağının aşağıdaki gerekli özelliklere sahip olması gerekir:

  • ad , arama hizmetinizdeki veri kaynağının benzersiz adıdır.
  • türü "sharepoint" olmalıdır. Bu değer büyük/küçük harfe duyarlıdır.
  • kimlik bilgileri SharePoint uç noktasını ve Microsoft Entra uygulaması (istemci) kimliğini sağlar. SharePoint uç noktası örnek olarak verilmiştir https://microsoft.sharepoint.com/teams/MySharePointSite. SharePoint sitenizin giriş sayfasına gidip URL'yi tarayıcıdan kopyalayarak uç noktayı alabilirsiniz.
  • kapsayıcısı , dizine eklenecek belge kitaplığını belirtir. Özellikler hangi belgelerin dizine eklendiğini denetler.

Veri kaynağı oluşturmak için Veri Kaynağı Oluştur (önizleme) çağrısında bulunur.

POST https://[service name].search.windows.net/datasources?api-version=2024-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-datasource",
    "type" : "sharepoint",
    "credentials" : { "connectionString" : "[connection-string]" },
    "container" : { "name" : "defaultSiteLibrary", "query" : null }
}

Bağlantı dizesi biçimi

bağlantı dizesi biçimi, dizin oluşturucunun temsilcili API izinlerini mi yoksa uygulama API izinlerini mi kullandığına bağlı olarak değişir

  • Temsilcili API izinleri bağlantı dizesi biçimi

    SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];TenantId=[SharePoint site tenant id]

  • Uygulama API'si izinleri bağlantı dizesi biçimi

    SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];ApplicationSecret=[Azure AD App client secret];TenantId=[SharePoint site tenant id]

Not

SharePoint sitesi arama hizmetiyle aynı kiracıdaysa ve sistem tarafından atanan yönetilen kimlik etkinleştirildiyse, TenantId bağlantı dizesi dahil edilmesi gerekmez. SharePoint sitesi arama hizmetinden farklı bir kiracıdaysa, TenantId dahil edilmelidir.

5. Adım: Dizin oluşturma

Dizin, bir belgedeki alanları, öznitelikleri ve arama deneyimini şekillendiren diğer yapıları belirtir.

Dizin oluşturmak için Dizin Oluştur 'u (önizleme) çağırarak:

POST https://[service name].search.windows.net/indexes?api-version=2024-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-index",
    "fields": [
        { "name": "id", "type": "Edm.String", "key": true, "searchable": false },
        { "name": "metadata_spo_item_name", "type": "Edm.String", "key": false, "searchable": true, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_path", "type": "Edm.String", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_content_type", "type": "Edm.String", "key": false, "searchable": false, "filterable": true, "sortable": false, "facetable": true },
        { "name": "metadata_spo_item_last_modified", "type": "Edm.DateTimeOffset", "key": false, "searchable": false, "filterable": false, "sortable": true, "facetable": false },
        { "name": "metadata_spo_item_size", "type": "Edm.Int64", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
    ]
}

Önemli

Yalnızca metadata_spo_site_library_item_id SharePoint Online dizin oluşturucu tarafından doldurulan bir dizinde anahtar alanı olarak kullanılabilir. Veri kaynağında bir anahtar alanı yoksa, metadata_spo_site_library_item_id anahtar alanıyla otomatik olarak eşlenir.

6. Adım: Dizin oluşturucu oluşturma

Dizin oluşturucu bir veri kaynağını hedef arama dizinine bağlar ve veri yenilemeyi otomatikleştirmek için bir zamanlama sağlar. Dizin ve veri kaynağı oluşturulduktan sonra dizin oluşturucuyu oluşturabilirsiniz.

Temsilci izinleri kullanıyorsanız, bu adım sırasında SharePoint sitesine erişimi olan kuruluş kimlik bilgileriyle oturum açmanız istenir. Mümkünse, yeni bir kuruluş kullanıcı hesabı oluşturmanızı ve bu yeni kullanıcıya dizin oluşturucunun sahip olmasını istediğiniz tam izinleri vermenizi öneririz.

Dizin oluşturucu oluşturmanın birkaç adımı vardır:

  1. Dizin Oluşturucu Oluşturma (önizleme) isteği gönderme:

    POST https://[service name].search.windows.net/indexers?api-version=2024-05-01-preview
    Content-Type: application/json
    api-key: [admin key]
    
    {
        "name" : "sharepoint-indexer",
        "dataSourceName" : "sharepoint-datasource",
        "targetIndexName" : "sharepoint-index",
        "parameters": {
        "batchSize": null,
        "maxFailedItems": null,
        "maxFailedItemsPerBatch": null,
        "base64EncodeKeys": null,
        "configuration": {
            "indexedFileNameExtensions" : ".pdf, .docx",
            "excludedFileNameExtensions" : ".png, .jpg",
            "dataToExtract": "contentAndMetadata"
          }
        },
        "schedule" : { },
        "fieldMappings" : [
            { 
              "sourceFieldName" : "metadata_spo_site_library_item_id", 
              "targetFieldName" : "id", 
              "mappingFunction" : { 
                "name" : "base64Encode" 
              } 
             }
        ]
    }
    

    Uygulama izinlerini kullanıyorsanız dizininizi sorgulamaya başlamadan önce ilk çalıştırma tamamlanana kadar beklemeniz gerekir. Bu adımda sağlanan aşağıdaki yönergeler özellikle temsilci izinleriyle ilgilidir ve uygulama izinleri için geçerli değildir.

  2. Dizin oluşturucuyu ilk kez oluşturduğunuzda, Dizin Oluşturucu Oluştur (önizleme) isteği bir sonraki adımı tamamlayana kadar bekler. Bağlantıyı almak ve yeni cihaz kodunuzu girmek için Dizin Oluşturucu Durumunu Al'ı aramanız gerekir.

    GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2024-05-01-preview
    Content-Type: application/json
    api-key: [admin key]
    

    Dizin Oluşturucu Durumunu Al'ı 10 dakika içinde çalıştırmazsanız kodun süresi dolar ve veri kaynağını yeniden oluşturmanız gerekir.

  3. Dizin Oluşturucu Durumu Al yanıtından cihaz oturum açma kodunu kopyalayın. Cihaz oturum açma bilgileri "errorMessage" içinde bulunabilir.

    {
        "lastResult": {
            "status": "transientFailure",
            "errorMessage": "To sign in, use a web browser to open the page https://microsoft.com/devicelogin and enter the code <CODE> to authenticate."
        }
    }
    
  4. Hata iletisine dahil edilen kodu sağlayın.

    Cihaz kodunun nasıl girilir gösteren ekran görüntüsü.

  5. SharePoint Online dizin oluşturucu, oturum açmış kullanıcı olarak SharePoint içeriğine erişecektir. Bu adım sırasında oturum açan kullanıcı, oturum açan kullanıcı olacaktır. Bu nedenle, dizine eklemek istediğiniz Belge Kitaplığı'ndaki bir belgeye erişimi olmayan bir kullanıcı hesabıyla oturum açarsanız, dizin oluşturucunun bu belgeye erişimi olmaz.

    Mümkünse, yeni bir kullanıcı hesabı oluşturmanızı ve bu yeni kullanıcıya dizin oluşturucunun sahip olmasını istediğiniz tam izinleri vermenizi öneririz.

  6. İstenen izinleri onaylayın.

    API izinlerini onaylamayı gösteren ekran görüntüsü.

  7. Yukarıda sağlanan tüm izinler doğruysa ve 10 dakikalık zaman çerçevesi içindeyse Dizin Oluşturucu Oluştur (önizleme) ilk isteği tamamlar.

Not

Microsoft Entra uygulaması yönetici onayı gerektiriyorsa ve oturum açmadan önce onaylanmamışsa aşağıdaki ekranı görebilirsiniz. Devam etmek için yönetici onayı gereklidir. Yönetici onayının gerekli olduğunu gösteren ekran görüntüsü.

7. Adım: Dizin oluşturucunun durumunu denetleme

Dizin oluşturucu oluşturulduktan sonra Dizin Oluşturucu Durumunu Al'ı çağırabilirsiniz:

GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2024-05-01-preview
Content-Type: application/json
api-key: [admin key]

Veri kaynağını güncelleştirme

Veri kaynağı nesnesinde güncelleştirme yoksa, dizin oluşturucu herhangi bir kullanıcı etkileşimi olmadan bir zamanlamaya göre çalışır.

Ancak, cihaz kodunun süresi dolduğunda veri kaynağı nesnesini değiştirirseniz, dizin oluşturucunun çalışması için yeniden oturum açmanız gerekir. Örneğin, veri kaynağı sorgusunu değiştirirseniz, kullanarak yeniden https://microsoft.com/devicelogin oturum açın ve yeni cihaz kodunu alın.

Süresi dolmuş bir cihaz kodu varsayarak veri kaynağını güncelleştirme adımları şunlardır:

  1. Dizin oluşturucu yürütmesini el ile başlatmak için Çalıştır Dizin Oluşturucusu'na (önizleme) çağrı yapın.

    POST https://[service name].search.windows.net/indexers/sharepoint-indexer/run?api-version=2024-05-01-preview  
    Content-Type: application/json
    api-key: [admin key]
    
  2. Dizin oluşturucunun durumunu denetleyin.

    GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2024-05-01-preview
    Content-Type: application/json
    api-key: [admin key]
    
  3. adresini ziyaret https://microsoft.com/deviceloginetmenizi isteyen bir hata alırsanız, sayfayı açın ve yeni kodu kopyalayın.

  4. Kodu iletişim kutusuna yapıştırın.

  5. Dizin oluşturucuyu el ile yeniden çalıştırın ve dizin oluşturucunun durumunu denetleyin. Bu kez dizin oluşturucu çalıştırması başarıyla başlatılmalıdır.

Belge meta verilerini dizinleme

Belge meta verilerini ("dataToExtract": "contentAndMetadata" ) dizine kaydediyorsanız, aşağıdaki meta veriler dizine alınabilir.

Tanımlayıcı Type Açıklama
metadata_spo_site_library_item_id Edm.String Sitenin belge kitaplığındaki bir öğeyi benzersiz olarak tanımlayan site kimliği, kitaplık kimliği ve öğe kimliğinin birleşim anahtarı.
metadata_spo_site_id Edm.String SharePoint sitesinin kimliği.
metadata_spo_library_id Edm.String Belge kitaplığının kimliği.
metadata_spo_item_id Edm.String Kitaplıktaki (belge) öğenin kimliği.
metadata_spo_item_last_modified Edm.DateTimeOffset Öğenin son değiştirme tarihi/saati (UTC).
metadata_spo_item_name Edm.String Öğenin adı.
metadata_spo_item_size Edm.Int64 Öğenin boyutu (bayt cinsinden).
metadata_spo_item_content_type Edm.String Öğenin içerik türü.
metadata_spo_item_extension Edm.String Öğenin uzantısı.
metadata_spo_item_weburi Edm.String Öğenin URI'sini.
metadata_spo_item_path Edm.String Üst yol ve öğe adının birleşimi.

SharePoint Online dizin oluşturucu, her belge türüne özgü meta verileri de destekler. Daha fazla bilgi için Bkz . Azure AI Search'te kullanılan içerik meta verileri özellikleri.

Not

Özel meta verileri dizine almak için veri kaynağının sorgu parametresinde "additionalColumns" belirtilmelidir.

Dosya türüne göre dahil et veya hariç tut

Dizin oluşturucu tanımının "parametreler" bölümünde ekleme ve dışlama ölçütlerini ayarlayarak hangi dosyaların dizine alınabileceğini denetleyebilirsiniz.

Belirli dosya uzantılarını, virgülle ayrılmış dosya uzantıları listesine ayarlayarak "indexedFileNameExtensions" (baştaki noktayla) ekleyin. Atlanması gereken uzantıları ayarlayarak "excludedFileNameExtensions" belirli dosya uzantılarını hariç tutun. Aynı uzantı her iki listede de yer alırsa dizin oluşturmanın dışında tutulur.

PUT /indexers/[indexer name]?api-version=2024-05-01-preview
{
    "parameters" : { 
        "configuration" : { 
            "indexedFileNameExtensions" : ".pdf, .docx",
            "excludedFileNameExtensions" : ".png, .jpeg" 
        } 
    }
}

Dizine alınan belgeleri denetleme

Tek bir SharePoint Online dizin oluşturucu, bir veya daha fazla belge kitaplığındaki içeriği dizine alabilir. Dizine eklenecek siteleri ve belge kitaplıklarını belirtmek için veri kaynağı tanımındaki "container" parametresini kullanın.

Veri kaynağı "kapsayıcı" bölümü bu görev için iki özelliğe sahiptir: "name" ve "query".

Veri Akışı Adı

"name" özelliği gereklidir ve üç değerden biri olmalıdır:

Value Açıklama
defaultSiteLibrary Sitenin varsayılan belge kitaplığındaki tüm içeriği dizine alın.
allSiteLibraries Sitedeki tüm belge kitaplıklarındaki tüm içeriği dizine alın. Bir alt siteden gelen belge kitaplıkları kapsam dışında/ Alt sitelerden içeriğe ihtiyacınız varsa, "useQuery" öğesini seçin ve "includeLibrariesInSite" öğesini belirtin.
useQuery Yalnızca "sorguda" tanımlanan içeriği dizine ekleyin.

Sorgu

Veri kaynağının "query" parametresi anahtar sözcük/değer çiftlerinden oluşur. Aşağıda, kullanılabilecek anahtar sözcükler yer almaktadır. Değerler site URL'leri veya belge kitaplığı URL'leridir.

Not

Belirli bir anahtar sözcüğün değerini almak için, eklemeye/dışlamaya çalıştığınız belge kitaplığına gidip URI'yi tarayıcıdan kopyalamanızı öneririz. Bu, sorgudaki bir anahtar sözcükle kullanılacak değeri almanın en kolay yoludur.

Anahtar sözcük Değer açıklaması ve örnekler
boş Null veya boşsa, kapsayıcı adına bağlı olarak varsayılan belge kitaplığını veya tüm belge kitaplıklarını dizine ekleyin.

Örnek:

"container" : { "name" : "defaultSiteLibrary", "query" : null }
includeLibrariesInSite bağlantı dizesi belirtilen sitenin altındaki tüm kitaplıklardan içerik dizini oluşturun. Değer, sitenin veya alt sitenin URI'si olmalıdır.

Örnek 1:

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/mysite" }

Örnek 2 (yalnızca birkaç alt site içerir):

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/sites/TopSite/SubSite1;includeLibrariesInSite=https://mycompany.sharepoint.com/sites/TopSite/SubSite2" }
includeLibrary Bu kitaplıktan tüm içeriği dizine alın. Değer, tarayıcınızdan kopyalanabilen kitaplığın tam yoludur:

Örnek 1 (tam yol):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary" }

Örnek 2 (tarayıcınızdan kopyalanan URI):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }
excludeLibrary Bu kitaplıktan içerik dizini oluşturmayın. Değer, tarayıcınızdan kopyalanabilen kitaplığın tam yoludur:

Örnek 1 (tam yol):

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mysite.sharepoint.com/subsite1; excludeLibrary=https://mysite.sharepoint.com/subsite1/MyDocumentLibrary" }

Örnek 2 (tarayıcınızdan kopyalanan URI):

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/teams/mysite; excludeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }
additionalColumns Belge kitaplığındaki dizin sütunları. Değer, dizine eklemek istediğiniz sütun adlarının virgülle ayrılmış bir listesidir. Sütun adlarında noktalı virgüllerden ve virgüllerden kurtulmak için çift ters eğik çizgi kullanın:

Örnek 1 (additionalColumns=MyCustomColumn,MyCustomColumn2):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary;additionalColumns=MyCustomColumn,MyCustomColumn2" }

Örnek 2 (çift ters eğik çizgi kullanan kaçış karakterleri):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx;additionalColumns=MyCustomColumnWith\\,,MyCustomColumnWith\\;" }

Hataları işleme

Varsayılan olarak, SharePoint Online dizin oluşturucu desteklenmeyen içerik türüne (örneğin bir resim) sahip bir belgeyle karşılaştığında durur. Parametresini excludedFileNameExtensions kullanarak belirli içerik türlerini atlayabilirsiniz. Ancak, tüm olası içerik türlerini önceden bilmeden belgeleri dizine almanız gerekebilir. Desteklenmeyen bir içerik türüyle karşılaşıldığında dizin oluşturma işlemine devam etmek için yapılandırma parametresini failOnUnsupportedContentType false olarak ayarlayın:

PUT https://[service name].search.windows.net/indexers/[indexer name]?api-version=2024-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    ... other parts of indexer definition
    "parameters" : { "configuration" : { "failOnUnsupportedContentType" : false } }
}

Bazı belgeler için Azure AI Search içerik türünü belirleyemiyor veya başka şekilde desteklenen içerik türüne sahip bir belgeyi işleyemiyor. Bu hata modunu yoksaymak için yapılandırma parametresini failOnUnprocessableDocument false olarak ayarlayın:

"parameters" : { "configuration" : { "failOnUnprocessableDocument" : false } }

Azure AI Search, dizine alınan belgelerin boyutunu sınırlar. Bu sınırlar Azure AI Search'teki Hizmet Sınırları bölümünde belgelenmiştir. Büyük büyük belgeler varsayılan olarak hata olarak değerlendirilir. Ancak, yapılandırma parametresini true olarak ayarlarsanız indexStorageMetadataOnlyForOversizedDocuments , büyük büyük belgelerin depolama meta verilerini dizine almaya devam edebilirsiniz:

"parameters" : { "configuration" : { "indexStorageMetadataOnlyForOversizedDocuments" : true } }

Ayrıca, belgeler ayrıştırırken veya bir dizine belge eklerken herhangi bir işleme noktasında hata oluşursa dizine eklemeye devam edebilirsiniz. Belirli sayıda hatayı yoksaymak için ve maxFailedItemsPerBatch yapılandırma parametrelerini istenen değerlere ayarlayınmaxFailedItems. Örneğin:

{
    ... other parts of indexer definition
    "parameters" : { "maxFailedItems" : 10, "maxFailedItemsPerBatch" : 10 }
}

SharePoint sitesindeki bir dosyada şifreleme etkinleştirildiyse, aşağıdakine benzer bir hata iletisiyle karşılaşılabilir:

Code: resourceModified Message: The resource has changed since the caller last read it; usually an eTag mismatch Inner error: Code: irmEncryptFailedToFindProtector

Hata iletisi aşağıdaki desende SharePoint site kimliğini, sürücü kimliğini ve sürücü öğesi kimliğini de içerir: <sharepoint site id> :: <drive id> :: <drive item id>. Bu bilgiler, SharePoint ucunda hangi öğenin başarısız olduğunu belirlemek için kullanılabilir. Kullanıcı daha sonra sorunu çözmek için öğeden şifrelemeyi kaldırabilir.

Ayrıca bkz.