PredictCaseLikelihood (DMX)

只適用於群集模型。這個函數會傳回輸入案例符合現有模型的可能性。

語法

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

引數

  • NORMALIZED
    傳回值包含模型內案例的機率除以無模型案例的機率。

  • NONNORMALIZED
    傳回值包含案例的原始機率,也就是案例屬性機率的乘積。

適用於

使用 Microsoft 群集與 Microsoft 時序群集演算法建立的模型。

傳回類型

介於 0 和 1 之間的雙精度浮點數。較接近 1 的數字代表案例在此模型中發生的機率較高。較接近 0 的數字代表案例較不可能在此模型中發生。

備註

依預設,PredictCaseLikelihood 函數的結果會正規化。隨著案例中的屬性數增加,而任兩個案例之間的原始機率差異更小時,正規化的值通常會變得更有用。

下列方程式是在 x 和 y 已知時,用來計算正規化的值:

  • x = 以群集模型為基礎的案例可能性

  • y = 臨界案例可能性,根據計算培訓案例而計算為案例的對數可能性

  • Z = Exp( log(x) – Log(Y))

正規化 = (z/ (1+z))

範例

下列範例會傳回特定案例將會發生在<資料採礦基本教學課程>內所建立之群集模型中的可能性。

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

預期的結果:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

這些結果之間的差異示範了正規化的效果。

變更記錄

更新的內容

已修正範例,可精確顯示原始正規化與非正規化 (原始) 機率之間的差異。