PredictCaseLikelihood (DMX)
Uniquement utilisée avec les modèles de clustering. Cette fonction retourne la probabilité qu'un cas d'entrée corresponde au modèle existant.
Syntaxe
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Arguments
NORMALIZED
La valeur de retour contient la probabilité du cas au sein du modèle divisée par la probabilité du cas sans le modèle.NONNORMALIZED
La valeur de retour contient la probabilité brute du cas, qui est le produit des probabilités des attributs de cas.
Application
Les modèles générés par les algorithmes Microsoft Clustering et Microsoft Sequence Clustering.
Type de valeur renvoyé
Nombre à virgule flottante double précision compris entre 0 et 1. Un nombre plus proche de 1 indique que le cas a une probabilité plus élevée de se produire dans ce modèle. Un nombre plus proche de 0 indique qu'il est moins probable que le cas se produise dans ce modèle.
Notes
Le résultat de la fonction PredictCaseLikelihood est normalisé par défaut. Les valeurs normalisées sont généralement plus utiles lorsque le nombre d'attributs d'un cas augmente et que les différences entre les probabilités brutes de deux cas deviennent beaucoup moins importantes.
L'équation suivante est utilisée pour calculer les valeurs normalisées pour des valeurs x et y données :
x = probabilité du cas en fonction du modèle de clustering
y = probabilité de cas marginale, calculée comme le logarithme du rapport de vraisemblance du cas en fonction des cas d'apprentissage
Z = Exp( log(x) – Log(Y))
Valeur normalisée = (z/ (1+z))
Exemple
L'exemple suivant retourne la probabilité selon laquelle le cas spécifié se produira dans le modèle de clustering créé dans le Didacticiel sur l'exploration de données de base.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Résultats attendus :
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
La différence entre ces résultats montre l'effet de la normalisation.
Voir aussi
Référence
Concepts
Historique des modifications
Mise à jour du contenu |
---|
Correction de l'exemple pour illustrer avec précision les différences entre les probabilités brutes normalisées et non normalisées. |