AlwaysOn 可用性群組疑難排解和監視指南

 

THIS TOPIC APPLIES TO: yesSQL Server (starting with 2008) noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

本指南可協助您開始在疑難排解某些常見的問題中 AlwaysOn 可用性群組和監視 AlwaysOn 可用性群組。 它被用來提供原始內容,以及已經發行在其他地方的實用資訊的登陸頁面。

雖然本指南不能完全討論可以在 AlwaysOn 可用性群組所涵蓋的大型表面區域發生的所有問題,它可以為您在根原因分析和解決的問題中正確的方向。 如同 AlwaysOn 可用性群組的整合式的技術,許多您遇到的問題就是資料庫系統中的其他問題的徵狀。 設定可用性群組,例如可用性資料庫暫停狀態並造成一些問題。 其他問題可以包含 SQL Server 的其他層面,例如 SQL Server 設定,您可以隔離的問題,資料庫檔案部署和全面的效能問題與無關可用性群組、 複本或資料庫。 仍有其他問題,例如網路 I/O、 TCP/IP、 Active Directory 及 Windows Server 容錯移轉叢集 (WSFC) 存在於 SQL Server 的外部。 通常會造成問題,介面可用性群組中,複本或資料庫需要您進行疑難排解之前,您可以識別根的多項技術。

疑難排解案例

下表包含常見的疑難排解案例的連結,AlwaysOn 可用性群組。 它們被分類的案例型別,例如設定、 用戶端連接性、 容錯移轉及效能。

狀況 Scenario 類型 Description
疑難排解 AlwaysOn 可用性群組組態 (SQL Server ) 組態 提供的資訊可協助您疑難排解 AlwaysOn 可用性群組的設定伺服器執行個體時常見的問題。 一般組態問題包含已停用 AlwaysOn 可用性群組、 正確地設定帳戶、 資料庫鏡像端點不存在、 端點是無法存取 (SQL Server 錯誤 1418)、 網路存取不存在,和聯結資料庫命令失敗 (SQL Server 錯誤 35250)。
疑難排解 「 驗證 WSFC 仲裁投票組態 」 警告 組態 當您使用 Microsoft SQL Server 2012 中的 新增可用性群組精靈建立 AlwaysOn 可用性群組時,您會收到類似下列的警告訊息: 「 目前的 WSFC 叢集仲裁投票組態不建議這個可用性群組 」。
建立可用性群組接聽程式時疑難排解問題 組態 嘗試建立可用性群組接聽程式時發生錯誤。
疑難排解失敗的加入檔案作業 (AlwaysOn 可用性群組 ) 組態 加入檔案作業會造成次要資料庫暫停並處於 NOT SYNCHRONIZING 狀態。
修正︰ 錯誤 41009,當您嘗試建立多個可用性群組 組態 嘗試建立多個可用性群組時,就會發生錯誤 41009。
無法連接到可用性群組接聽程式多重子網路環境中 用戶端連接性 設定可用性群組接聽程式之後,您就無法偵測的接聽程式,或從應用程式連接到它。
疑難排解失敗的自動容錯移轉 容錯移轉 自動容錯移轉未順利完成。
疑難排解︰ 可用性群組超過 RTO 效能 自動容錯移轉或之後不會遺失資料的已規劃手動容錯移轉,容錯移轉時間會超過您的 RTO。 或者,您評估時 (例如自動容錯移轉夥伴) 的同步認可次要複本的容錯移轉時間,尋找它,超過您的 RTO。
疑難排解︰ 可用性群組超過 RPO 效能 在您執行強制手動容錯移轉之後,您會遺失資料超過您的 RPO。 或者,當您計算潛在資料遺失的非同步認可次要複本,請尋找它,超過您的 RPO。
疑難排解︰ 在主要複本上的變更不會反映在次要複本上 效能 用戶端應用程式的主要複本上的更新已順利完成,但是查詢次要複本會顯示此變更不會反映。

有用的工具進行疑難排解

當設定或執行 AlwaysOn 可用性群組時,不同的工具可協助您診斷不同類型的問題。 下表提供有用資訊的連結的工具。

工具 Description
使用 AlwaysOn 儀表板 (SQL Server Management Studio) 報告方便使用的介面中的可用性群組的健全狀況的檢視,在摘要。
AlwaysOn 原則 使用 AlwaysOn 儀表板。
SQL Server 錯誤記錄檔 (AlwaysOn 可用性群組 ) 記錄檔狀態可用性群組、 複本和資料庫的其他 AlwaysOn 元件與 AlwaysOn 錯誤狀態轉換的事件。
叢集。記錄檔 (AlwaysOn 可用性群組 ) 記錄檔叢集事件,包括狀態轉換的可用性群組資源,以及事件和 SQL Server 資源 DLL 中的錯誤。
AlwaysOn 健全狀況診斷記錄檔 記錄報告至 WSFC 叢集 (SQL Server 資源 DLL) 的 SQL Server 的健全狀況診斷sp_server_diagnostics (TRANSACT-SQL ).
動態管理檢視和系統目錄檢視 (AlwaysOn 可用性群組 ) 報告可用性群組,例如設定、 健康狀態及效能度量的資訊。
擴充事件的 AlwaysOn 根本原因分析提供詳細的 diagnotics 可用性群組和很有用。
AlwaysOn 等候類型 提供等候統計資料與有用的專屬可用性群組進行效能微調。
AlwaysOn 效能計數器 監視 AlwaysOn 可用性群組的活動會反映在 系統監視器和適用於效能微調。 如需詳細資訊,請參閱SQL Server、 可用性複本SQL Server、 資料庫複本
AlwaysOn 信號緩衝區 記錄內部診斷,在 SQL Server 系統中的警示,並可用於偵錯的可用性群組的相關問題。

監視 AlwaysOn 可用性群組

疑難排解可用性群組的理想時機是之前的問題必須在容錯移轉,是否自動或手動。 這可藉由監視可用性群組的效能度量和可用性複本執行您的服務等級協定 (SLA) 的範圍外時傳送警示。 例如,如果同步的次要複本有會導致估計的容錯移轉時間,以提高的效能問題,您不想等到自動容錯移轉,而且您了解容錯移轉的時間超過您的復原時間目標。

AlwaysOn 可用性群組是高可用性和災害復原解決方案,來監視最重要的效能度量是估計的容錯移轉時間,這會影響您的復原時間目標 (RTO),也可能遺失資料損毀時,這會影響您的復原點目標 (RPO) 中。 您可以從 SQL Server 會在任何時候,公開,讓您可警示您系統的 HADR 功能的問題之前就會發生實際的失敗事件的資料收集這些度量。 因此,務必讓自己熟悉如何使用 AlwaysOn 可用性群組的資料同步處理程序,並據以收集度量。

此表會將您導向主題可協助您監視 AlwaysOn 可用性群組解決方案的健全狀況。

主題 Description
AlwaysOn 可用性群組的監視效能 監視可用性群組; 時,資料同步處理程序描述 AlwaysOn 可用性群組、 流量控制閘道,和實用的度量同時也顯示如何收集 RTO 和 RPO 度量。
監視可用性群組 (SQL Server ) 提供工具來監視可用性群組資訊。
AlwaysOn 健全狀況模型第 1 部--健全狀況模型架構 提供 AlwaysOn 健全狀況模型的概觀。
AlwaysOn 健全狀況模型第 2 部--擴充健全狀況模型 示範如何自訂 AlwaysOn 健全狀況模型及自訂 AlwaysOn 儀表板顯示額外的資訊。
監視 AlwaysOn 健全狀況與 PowerShell-第 1 部︰ 基本指令程式概觀 提供可用來監視可用性群組的健全狀況的 AlwaysOn PowerShell 指令程式的基本概觀。
監視 AlwaysOn 健全狀況與 PowerShell-第 2 部︰ 進階 Cmdlet 使用方式 提供進階使用 AlwaysOn PowerShell 指令程式來監視可用性群組的健全狀況的相關資訊。
監視 AlwaysOn 健全狀況與 PowerShell-第 3 部︰ 簡單監控應用程式 示範如何自動監視可用性群組與應用程式。
監視 AlwaysOn 健全狀況與 PowerShell-第 4 部︰ 與 SQL Server Agent 整合 提供如何整合與 SQL Server Agent 的可用性群組監視,並設定適當的合作對象的通知,發生問題時的相關資訊。

另請參閱

SQL Server AlwaysOn 團隊部落格
CSS SQL Server 工程師部落格