探索目標郵寄模型 (資料採礦教學課程)

在您的專案中,模型處理過後,可以使用資料採礦設計師中的 [採礦模型檢視器] 索引標籤來檢視。您可以使用索引標籤頂端的 [採礦模型] 清單,檢查採礦結構中的個別模型。

下列章節說明如何在檢視器中探索採礦模型。

  • Microsoft 決策樹模型
  • Microsoft 群集模型
  • Microsoft 貝氏機率模型

Microsoft 決策樹模型

當您在 Adventure Works DM 教學課程專案中切換到資料採礦設計師的 [採礦模型檢視器] 索引標籤時,設計師會直接開啟到達作為目標的郵件採礦模型,也就是結構中的第 1 個模型。您在 Analysis Services 中用來建立模型的每一個演算法,都會傳回不同類型的結果。因此,Analysis Services 會為每一個演算法提供個別的檢視器。當您瀏覽採礦模型時,就會以該模型的適當檢視器將模型顯示在 [採礦模型檢視器] 索引標籤。在這個情況下,會針對決策樹模型使用 Microsoft 樹狀檢視器。這個檢視器包含 2 個索引標籤:[決策樹][相依性網路]

決策樹

[決策樹] 索引標籤,您可以檢查組成採礦模型的所有樹狀模型。由於本教學課程專案中,作為目標的郵件模型只包含單一的可預測屬性 Bike Buyer,因此只有一個樹狀結構可供檢視。如果有多個樹狀結構,您可以使用 [樹狀結構] 方塊來選擇另一個樹狀結構。

依預設,Microsoft 樹狀檢視器只顯示樹狀結構的前 3 個層級。如果樹狀結構的層級不到 3 個,則檢視器只顯示現有的層級。您可以使用 [顯示層級] 滑動軸或 [預設展開] 清單檢視更多層級。如需有關設定檢視器的詳細資訊,請參閱<以 Microsoft 樹狀檢視器檢視採礦模型>。

若要修改樹狀結構

  1. [顯示層級] 滑動到 5。

  2. [背景] 清單變更為 [1]

    藉由變更 [背景] 設定,您可以迅速查看等於 1 同時存在於每一個節點中之 Bike Buyer 案例數目。節點的陰影愈深,表示節點中有愈多案例存在。

決策樹中的每一個節點都會顯示以下資訊:

  • 從前一個節點到達該節點所需的條件。您可以在 [採礦圖例] 中查看完整的節點路徑,或將滑鼠指標停留在節點上方,即可顯示「資訊提示」。
  • 長條圖;能依普及程度的順序,說明可預測資料行的狀態分佈情形。您可以使用 [長條圖] 控制項來控制長條圖中顯示幾種狀態。
  • 如果在 [背景] 控制項中已指定可預測屬性的狀態,就會顯示案例的聚集程度。

在節點上按一下滑鼠右鍵,接著選取 [鑽研],即可查看每一個節點所支援的培訓案例。

相依性網路

[相依性網路] 索引標籤能顯示對於採礦模型的預測能力有所幫助的變數之間的關聯性。

相依性網路的中央節點 Bike Buyer 代表採礦模型中的可預測屬性。周圍的每一個節點都代表能夠影響可預測屬性所產生結果的屬性。您可以使用索引標籤左側的滑動軸來控制所顯示連結的強度。若將滑動軸往下移動,便只顯示最強的連結。

請按一下網路中的個別節點,接著參考索引標籤底端的色彩圖例,查看所選取的節點預測哪些節點,或哪些節點是由所選取的節點所預測的。

Microsoft 群集模型

您可以使用 [採礦模型檢視器] 索引標籤頂端的 [採礦模型] 清單,切換到 TM_Clustering 模型。這個模型的相關檢視器 Microsoft 群集檢視器包含 4 個索引標籤:[群集圖表][群集設定檔][群集特性][群集辨識]。依預設,檢視器會在第一次開啟時顯示 [群集圖表] 索引標籤。

如需有關設定 Microsoft 群集檢視器的詳細資訊,請參閱<以 Microsoft 群集檢視器檢視採礦模型>。

群集圖表

您可以使用 [群集圖表] 索引標籤來探索演算法所找到的群集之間的關聯性。群集之間的線代表「相似程度」,並根據群集的相似程度加上陰影。每一個群集的實際色彩各代表變數的頻率和在群集中的狀態。您可以在節點頂端的 [陰影變數][狀態] 方塊選取變數及狀態。預設變數是 Population,不過您可以將它變更成為模型中的任何變數,以探索哪些群集包含內有您所想要之變數的成員。利用網路左側的滑動軸,您可以篩選出較弱的連結,找出關聯性最近的群集。

例如,可將 [陰影變數] 設定為 [Bike Buyer],將 [狀態] 設定為 [1]。您就會看到群集 5 包含最高密度的自行車買主,同時最強的關聯性是在群集 4 與群集 7 之間。

群集設定檔

[群集設定檔] 索引標籤提供 TM_Clustering 模型的整體概觀。您可以從檢視器中看出,[群集設定檔] 索引標籤包含模型中每一個群集的資料行。第一個資料行列出至少與一個群集相關聯的變數。檢視器的其餘部份含有每一個群集的變數,其狀態的分佈情形。分隔變數的分佈情形顯示成為著色圖列,其中最大數目的圖列顯示在 [長條圖列] 清單中。連續變數是以鑽石圖顯示,代表在每一個群集中的平均與標準差。

群集特性

您可以使用 [群集特性] 索引標籤更詳細地檢查組成群集的特性。例如,如果使用 [群集] 清單來顯示本教學課程假設狀況中的群集 5,您可以看出這個群集中的人士 (以往曾購買自行車的顧客) 傾向於具有下列特性:僅通勤 0-1 哩、沒有汽車,並且已婚。

群集辨識

您可以使用 [群集辨識] 索引標籤來探索區分群集的特性。從 [群集 1][群集 2] 方塊選取 2 個群集之後,檢視器會判斷群集之間的差異,並且依照最能區分群集的變數作為順序,將差異顯示出來。

例如,請比較 TM_Clustering 模型的群集 5 與群集 7。群集 5 含有最高密度的自行車買主,群集 7 則含有最低密度的自行車買主。群集 7 中的人士較多來自北美,同時比較年輕,年齡 23 到 31 之間,而群集 5 中的人士較多來自歐洲,並且傾向於短距離通勤,在 0 到 1 哩之間。

Microsoft 貝氏機率模型

您可以使用 [採礦模型檢視器] 索引標籤頂端的 [採礦模型] 清單,切換到 TM_NaiveBayes 模型。這個模型的相關檢視器 Microsoft 貝氏機率分類檢視器包含 4 個索引標籤:[相依性網路][屬性設定檔][屬性特性][屬性辨識]

如需有關 Microsoft 貝氏機率分類檢視器使用方法的詳細資訊,請參閱<以 Microsoft 貝氏機率分類檢視器檢視採礦模型>。

相依性網路

[相依性網路] 索引標籤的作用正類似 Microsoft 樹狀檢視器的 [相依性網路] 索引標籤。檢視器中的每一個節點各代表變數,節點之間的線條則代表關聯性。在檢視器中,您可以查看對於可預測屬性 Bike Buyer 的狀態具有影響的所有屬性。

隨著您將滑動軸往下移,便只留下對 Bike Buyer 資料行影響最大的變數。藉由調整滑動軸,您可以發現,擁有的車輛數目是決定某人是否為自行車買主的最大因素。

屬性設定檔

[屬性設定檔] 索引標籤說明輸入屬性的不同狀態如何影響可預測屬性的結果。

[可預測] 方塊中,請確認已選取 [Bike Buyer]。能夠影響這個可預測屬性所處狀態的屬性,會與輸入屬性每一個狀態的值及其在可預測屬性每一個狀態中的分佈情況等一同列出。

屬性特性

您可以使用 [屬性特性] 索引標籤選取變數及值,以查看其他變數的值顯示在所選取值案例中的頻率如何。

[變數] 清單中,確認已選取 [Bike Buyer],並且在 [值] 清單中選取 [1]。在檢視器中,您可看出至工作地點通勤 0 到 1 哩之間的人士和居住在北美地區的人多半有購買自行車的傾向。

屬性辨識

您可以使用 [屬性辨識] 索引標籤來調查所選取可預測屬性的兩個分隔值與其他屬性值之間的關聯性。因為 TM_NaiveBayes 模型只有 2 個狀態 (即 1 與 0),所以您完全不需要變更檢視器。

在檢視器中,您可以看出,沒有汽車的人士傾向於購買自行車,擁有兩輛汽車的人士也傾向於不購買自行車。

本課程的下一項工作

測試採礦模型的精確度 (資料採礦教學課程)