邏輯架構 (Analysis Services – 資料採礦)

資料採礦是涉及多個元件互動的程序。

  • 您可以存取 SQL Server 資料庫或任何其他資料來源中的資料來源,以供定型、測試或預測使用。

  • SQL Server Data Tools (SSDT) 或 Visual Studio 可用來定義資料採礦結構和模型。

  • SQL Server Management Studio 則可用來管理資料採礦物件及建立預測和查詢。

  • 當此方案完成時,可將其部署到 Analysis Services 的執行個體。

其他地方已經描述建立這些方案物件的程序。 如需詳細資訊,請參閱<資料採礦方案>。

下列章節描述資料採礦方案中物件的邏輯架構。

資料採礦來源資料

採礦結構

採礦模型

自訂資料採礦物件

資料採礦來源資料

資料採礦方案中不會儲存用於資料採礦的資料,而只會儲存繫結。 資料可能位於以舊版的 SQL Server 所建立的資料庫、CRM 系統或甚至一般檔案中。 當您以處理方式來定型結構或模型時,便會建立資料的統計摘要,並將其儲存在快取中,該快取可以保留供之後的作業使用,或是在處理之後加以刪除。 如需詳細資訊,請參閱<採礦結構 (Analysis Services - 資料採礦)>。

您會結合 Analysis Services 資料來源檢視 (DSV) 物件中的不同資料,這樣會在資料來源頂端提供抽象層。 您可以在資料表之間指定聯結,或是加入具有多對一關聯性的資料表,以建立巢狀資料表資料行。 這些物件的定義、資料來源和資料來源檢視會儲存在方案內,而且副檔名為 *.ds 和 *.dsv。 如需有關建立及使用 Analysis Services 資料來源和資料來源檢視的詳細資訊,請參閱<支援的資料來源類型 (SSAS 多維度)>。

您也可以使用 AMO 或 XMLA 來定義及更改資料來源和資料來源檢視。 如需有關以程式設計方式處理這些物件的詳細資訊,請參閱<邏輯架構概觀 (Analysis Services - 多維度資料)>。

回到頁首

採礦結構

資料採礦結構是定義資料網域 (從中建立採礦模型) 的邏輯資料容器。 單一採礦結構可以支援多個採礦模型。

當您需要使用資料採礦方案中的資料時,Analysis Services 會從來源讀取資料,並產生彙總與其他資訊的快取。 預設會保存此快取,以便重複使用定型資料來支援其他模型。 如果您需要刪除快取,請將採礦結構物件上的 CacheMode 屬性變更為 ClearAfterProcessing 值。 如需詳細資訊,請參閱<AMO 資料採礦類別>。

SQL Server 2012 Analysis Services (SSAS) 也提供將資料分為定型資料集與測試資料集的功能,讓您可以在隨機選取但具代表性的資料集上測試採礦模型。 資料實際上並不會分開儲存,而是以某個屬性來標示結構快取中的案例資料,該屬性指出特定案例是否用於定型或測試。 如果快取遭到刪除,就無法擷取該資訊。

如需詳細資訊,請參閱<採礦結構 (Analysis Services - 資料採礦)>。

資料採礦結構可以包含巢狀資料表。 巢狀資料表會提供有關主要資料表中模型化之案例的詳細資料。 如需詳細資訊,請參閱<巢狀資料表 (Analysis Services - 資料採礦)>。

回到頁首

採礦模型

在處理之前,資料採礦模型只是中繼資料屬性的組合。 這些屬性會指定採礦結構、指定資料採礦演算法,以及定義對資料處理方法造成影響之參數和篩選設定的集合。 如需詳細資訊,請參閱<採礦模型 (Analysis Services - 資料採礦)>。

當您處理模型時,儲存在採礦結構快取中的定型資料會用來產生模式 (根據資料的統計屬性以及演算法和其參數所定義的啟發學習法)。 這就是所謂的「定型」(Training) 模型。

定型的結果是包含在「模型內容」(Model Content) 中的一組摘要資料,可描述所找到的模式並提供產生預測所根據的規則。 如需詳細資訊,請參閱<採礦模型內容 (Analysis Services - 資料採礦)>。

在受限的案例中,模型的邏輯結構也可以匯出到檔案中,該檔案代表根據標準格式 (預測模型標記語言,PMML) 的模型公式與資料繫結。 這個邏輯結構可以匯入到利用 PMML 的其他系統中,然後這樣的模型可用來預測。 如需詳細資訊,請參閱<了解 Select 陳述式 (DMX)>。

回到頁首

自訂資料採礦物件

您在資料採礦專案內容中使用的其他物件 (例如精確度圖表或預測查詢) 不會保存在方案中,但是可以使用 ASSL 撰寫指令碼或使用 AMO 來建立。

此外,您也可以加入以下自訂物件來擴充 Analysis Services 執行個體上提供的服務和功能:

  • 自訂組件
    .NET 組件可以使用任何 CLR 或 COM 相容的語言來定義,然後向 SQL Server 執行個體註冊。 組件檔案會從應用程式定義的位置載入,而且會將複本連同資料儲存在伺服器中。 組件檔案的複本是用在每次啟動服務時載入組件。

    如需詳細資訊,請參閱<多維度模型組件管理>。

  • 自訂預存程序
    Analysis Services 資料採礦支援使用預存程序來處理資料採礦物件。 您可以建立自己的預存程序來擴充功能,並更輕鬆地處理預測查詢和內容查詢所傳回的資料。

    定義預存程序

    執行交叉驗證時支援使用下列預存程序。

    資料採礦預存程序 (Analysis Services - 資料採礦)

    此外,Analysis Services 也包含許多系統預存程序,可在內部用來進行資料採礦。 雖然系統預存程序供內部使用,但是您可能會發現這些是非常實用的捷徑。 Microsoft 保留視需要變更這些預存程序的權利;因此在實際使用上,我們建議您最好使用 DMX、AMO 或 XMLA 建立查詢。

  • 建立外掛程式演算法
    Analysis Services 提供一個機制讓您建立自己的演算法,然後將演算法當做新的資料採礦服務加入至伺服器執行個體。

    Analysis Services 會使用 COM 介面與外掛程式演算法通訊。 若要深入了解如何實作新的演算法,請參閱<外掛程式演算法>。

    您必須先註冊每一個新的演算法,然後才能使用。 若要註冊演算法,請在 Analysis Services 執行個體的 .ini 檔案中加入演算法的必要中繼資料。 您必須在您打算使用新演算法的每一個執行個體中加入該資訊。 在您加入演算法之後,您可以重新啟動執行個體,然後使用 MINING_SERVICES 結構描述資料列集來檢視新的演算法,包括演算法所支援的選項和提供者。

回到頁首

請參閱

參考

資料採礦延伸模組 (DMX) 參考

概念

多維度模型物件處理