Graph 連接器Microsoft企業網站

Graph 連接器Microsoft企業網站可讓您的組織 從公司擁有的網站為文章和內容編製索引。 設定連接器並從網站同步處理內容之後,使用者就可以從任何Microsoft搜尋客戶端搜尋該內容。

注意事項

請閱讀 Microsoft 365 系統管理中心 文章中的設定 Microsoft Graph 連接器,以瞭解一般連接器設定指示。

本文適用於設定、執行及監視企業網站連接器的任何人。 它會補充一般設定程式,並顯示僅適用於企業網站連接器的指示。 本文也包含 疑難解答的相關信息。

步驟 1:在 Microsoft 365 系統管理中心 中新增連接器

新增企業網站連接器

(如需詳細資訊,請參閱一般 設定指示)

步驟 2:命名連線

指定下列屬性:

  • 需要 (名稱)
  • 需要 (連線標識碼)
  • 選擇性) (描述
  • 選取必要) (複選框

線上標識碼會為您的連接器建立隱含屬性。 它必須是唯一的,而且最多只能包含32個英數位元。 若要變更標識碼,請移至 [進階設定]。

步驟 3:設定連線設定

若要連線到您的數據源,請填入網站的根URL,然後選取結果的自定義垂直。 完成這項信息之後,請選取 [測試連線] 以驗證您的設定。

網站 URL

指定您想要編目之網站的根目錄。 企業網站連接器會使用此 URL 作為起點,並遵循此 URL 中的所有連結進行編目。

連接器只會編目根 URL 網域中的網頁,不支援編目網域外 URL。 只有相同網域內才支援重新導向。 如果網頁中有要編目的重新導向,您可以直接在要編目的 URL 清單中新增重新導向的 URL。

注意事項

您可以在單一連線中編製最多 50 個不同網站 URL 的索引。 在 [URL] 欄位中,輸入以逗號分隔的網站 URL (,) 。 例如,https://www.contoso.com,https://www.contosoelectronics.com

使用網站圖進行編目

選取連接器時,只會編目網站映射中所列的 URL。 此選項也可讓您在稍後的步驟中設定累加編目。 如果未選取或找不到網站地圖,連接器會對網站根 URL 上找到的所有鏈接進行深層編目。

動態網站設定

如果您的網站包含動態內容,例如,位於 Confluence 或 Unily 等內容管理系統中的網頁,您可以啟用動態編目程式。 若要開啟它,請選取 [啟用動態網站的編目]。 編目程式會等候動態內容在開始編目之前進行轉譯。

企業 Web 連接器的 [連線器的 [連線器) 的[連線器) 設定] 窗格螢幕快照。

除了複選框之外,還有三個選擇性欄位可供使用:

  1. DOM 就緒:輸入編目程式應該使用的 DOM 元素,作為完整轉譯內容且應該開始編目的訊號。
  2. 要新增的標頭:指定編目程式在傳送該特定 Web URL 時應包含哪些 HTTP 標頭。 您可以為不同的網站設定多個標頭。 我們建議包含驗證令牌值。
  3. 要略過的標頭:指定任何應該從動態編目要求中排除的不必要標頭。

標頭應在下列語法中新增: {"Root-URL":["TKey=TValue"]}

範例:{"https://www.contoso.com":["Token=Value","Type=Value2"]}

注意事項

只有代理程式編目模式才支援動態編目。

編目模式:雲端或內部部署

編目模式會決定您想要編製索引的網站類型,包括雲端或內部部署。 針對您的雲端網站,選取 [雲端 ] 作為編目模式。

此外,連接器現在支援對內部部署網站進行編目。 若要存取內部部署資料,您必須先安裝並設定連接器代理程式。 若要深入瞭解,請參閱 Microsoft Graph 連接器代理程式。

針對您的內部部署網站,選取 [代理 程式] 作為編目模式,然後在 [ 內部部署代理 程式] 欄位中,選擇您稍早安裝並設定的 Graph 連接器代理程式。

驗證

不需要驗證

基本 需要使用者名稱和密碼。

具有 Microsoft Entra IDOAuth 2.0 需要資源識別碼、用戶端識別碼和客戶端密碼。

資源識別碼、用戶端識別碼和客戶端密碼值取決於您為網站設定 Microsoft Entra ID 型驗證的方式:

  1. 如果您使用應用程式作為識別提供者和用戶端應用程式來存取網站,則用戶端標識碼和資源識別元是應用程式的應用程式識別碼,而客戶端密碼是您在應用程式中產生的密碼。

    設定用戶端應用程式之後,請務必前往應用程式的 [ 憑證 & 秘密 ] 區段來建立新的客戶端密碼。 複製頁面中顯示的客戶端密碼值,因為它不會再顯示。

    在下列螢幕快照中,如果您要自行建立應用程式,您可以看到取得用戶端標識碼、用戶端密碼及設定應用程式的步驟。

    • 品牌區段上的設定檢視:

    • 驗證區段上的設定檢視:

      注意事項

      您的網站中不需要有上述指定的重新導向 URI 路由。 只有當您在網站中使用 Azure 所傳送的使用者令牌進行驗證時,您才需要有路由。

    • Essentials 區段上的用戶端識別檢視:

    • 在 [ 憑證 & 秘密 ] 區段上檢視客戶端密碼:

  2. 如果您使用應用程式作為網站的識別提供者做為資源,而使用不同的應用程式來存取網站,則用戶端標識碼是您第二個應用程式的應用程式識別碼,而客戶端密碼則是在第二個應用程式中設定的秘密。 不過,資源標識碼是您第一個應用程式的標識碼。

    注意事項

    如需將用戶端應用程式設定為識別提供者的步驟,請參閱快速入門:向 Microsoft 身分識別平台 註冊應用程式和設定您的 App Service 或 Azure Functions 應用程式以使用 Microsoft Entra 登入

    您不需要在此應用程式中設定客戶端密碼,但您必須在 [ 應用程式 角色] 區段中新增應用程式角色,稍後會指派給您的用戶端應用程式。 請參閱影像以瞭解如何新增應用程式角色。

    • 建立新的應用程式角色:

    • 編輯新的應用程式角色:

      設定資源應用程式之後,請建立用戶端應用程式,並藉由在用戶端應用程式的 API 許可權中新增上述設定的應用程式角色,為其授與存取資源應用程式的許可權。

      注意事項

      若要瞭解如何將許可權授與用戶端應用程式,請 參閱快速入門:設定用戶端應用程式以存取 Web API

    下列螢幕快照顯示將許可權授與用戶端應用程式的區段。

    • 新增權限:

    • 選取權限:

    • 新增權限:

    指派許可權之後,您必須移至 [憑證 & 秘密] 區段,為此應用程式建立新的客戶端密碼。 複製頁面中顯示的客戶端密碼值,因為它不會再次顯示。 使用此應用程式的應用程式識別碼作為用戶端標識碼、使用此應用程式的秘密作為客戶端密碼,並使用第一個應用程式的應用程式識別碼作為資源識別符。

SiteMinder 需要格式正確的 URL、 https://custom_siteminder_hostname/smapi/rest/createsmsession使用者名稱和密碼。

Windows 驗證只能在代理程式模式中使用。 它需要使用者名稱、網域和密碼。 您必須在 [用戶名稱] 字段中 提供使用者名稱和網域,格式如下:domain\username 或 username@domain。 密碼必須在 [ 密碼] 欄 位中輸入。 針對 Windows 驗證,提供的使用者名稱也必須是安裝代理程式之伺服器的系統管理員。

步驟 4:中繼標籤設定

連接器會擷取根 URL 可能擁有的任何中繼標籤,並顯示它們。 您可以選取要包含哪些標籤以進行編目。

已選取作者、地區設定和其他標籤設定。

選取的中繼標記可用來建立自定義屬性。 此外,您可以在 [架構] 頁面上進一步管理它們, (可查詢、可搜尋、可擷取、可精簡的) 。

步驟 5:自定義屬性設定

您可以為選取的中繼標記或連接器的預設屬性建立自定義屬性,藉此擴充索引數據。

使用 Team 中繼資料規則設定的自訂屬性。

若要新增自訂屬性:

  1. 輸入屬性名稱。 此名稱會出現在此連接器的搜尋結果中。
  2. 針對值,選取 [靜態] 或 [字串/Regex 對應]。 靜態值會包含在此連接器的所有搜尋結果中。 字串/regex 值會根據您新增的規則而有所不同。
  3. 選取 [編輯值]
  4. 如果您選取靜態值,請輸入您要顯示的字串。
  5. 如果您選取字串/regex 值:
    • 在 [ 新增表達式] 區段的 [ 屬性 ] 列表中,從清單中選取預設屬性或中繼標記。
    • 針對 [範例值],輸入字串來表示可能出現的值類型。 當您預覽規則時,會使用此範例。
    • 針對 [表達式],輸入 regex 表達式來定義應該出現在搜尋結果中的屬性值部分。 您最多可以新增三個運算式。 若要深入瞭解 regex 表達式,請參閱 .NET 正則表示式 或在 Web 中搜尋 regex 表達式參考指南。
    • 在 [ 建立公式] 區段中,輸入公式來結合從表達式擷取的值。

步驟 6:新增 URL 以排除 (選擇性編目限制)

有兩種方式可防止頁面編目:不允許在您的 robots.txt 檔案中編目頁面,或將它們新增至排除清單。

支援 robots.txt

連接器會檢查根網站是否有 robots.txt 檔案。 如果有的話,它會遵循並遵循該檔案中找到的指示。 如果您不想讓連接器編目網站上的特定頁面或目錄,請在 robots.txt 檔案的 「不允許」宣告中包含頁面或目錄。

新增要排除的 URL

如果內容敏感或不值得編目,您可以選擇性地建立 排除清單 ,以排除某些 URL 不進行編目。 若要建立排除清單,請流覽根URL。 您可以在設定程式期間,將排除的URL新增至清單。

步驟 7:指派屬性標籤

您可以從選項選單中選擇,將來源屬性指派給每個標籤。 雖然此步驟並非必要,但擁有某些屬性標籤可改善搜尋相關性,並確保使用者的搜尋結果更精確。

步驟 8:管理架構

在 [ 管理架構 ] 畫面上,您可以變更架構屬性 (選項為 [查詢]、[ 搜尋]、[擷 ] 和 [ 精簡) 與預設或自定義屬性相關聯、新增選擇性別名,然後選擇 Content 屬性。

步驟 9:管理搜尋許可權

企業網站連接器只支援每個人都能看見的搜尋權 。 索引數據會出現在搜尋結果中,且組織中的所有使用者都可以看到。

步驟 10:設定重新整理排程

企業網站連接器支援完整和累加編目。 只有在啟用網站對應編目設定的連線時,才支援累加編目。 您可以在步驟 3 中選取編目網站圖。

在累加式重新整理間隔期間,只會編目自上次累加式重新整理之後已修改的 URL。 在完整重新整理間隔中,連接器會重新編目所有網站的內容。 如需完整重新整理,建議您設定一到兩周之間的大型重新整理排程間隔,以確保連接器有足夠的時間來完成編目。 我們建議您排程重新整理。

步驟 11:檢閱連線

請遵循一般 設定指示

疑難排解

發佈連線之後,您可以在系統管理中心的 [數據源] 索引卷標下檢閱狀態。 若要瞭解如何進行更新和刪除,請參閱 管理您的連接器。 您可以 在這裡找到常見問題的疑難解答步驟。

如果您有任何其他問題或想要提供意見反應,請在 Microsoft Graph 與我們連絡 |支援