Éditeur de transformation d'extraction de terme (onglet Avancé)

Utilisez l'onglet Avancé de la boîte de dialogue Éditeur de transformation d'extraction de terme pour définir les propriétés de l'extraction, telles que la fréquence et la longueur, et indiquer si les mots ou les phrases doivent être extraites.

Pour en savoir plus sur la transformation d'extraction de terme, consultez Transformation d'extraction de terme.

Options

  • Nom
    Indique que la transformation extrait uniquement des noms individuels.

  • Expression nominale
    Indique que la transformation extrait uniquement des expressions nominales.

  • Nom et expression nominale
    Indique que la transformation extrait des noms et des expressions nominales.

  • Fréquence
    Indique que le score correspond à la fréquence du terme.

  • TFIDF
    Indique que le score correspond à la valeur TFIDF du terme. Le score TFIDF est le produit de la fréquence des termes (TF, Term Frequency) et de la fréquence inverse de documents (IDF, Inverse Document Frequency), défini comme suit : TFIDF d'un terme T = (fréquence de T) * log( (#lignes en entrée) / (#lignes ayant T))

  • Seuil de fréquence
    Définissez le nombre d'occurrences d'un mot ou d'une expression avant son extraction. La valeur par défaut est 2.

  • Longueur maximale du terme
    Définissez la longueur maximale d'une expression en nombre de mots. Cette option affecte uniquement les expressions nominales. La valeur par défaut est 12.

  • Utiliser l'extraction de terme respectant la casse
    Indiquez si l'extraction doit respecter la casse. La valeur par défaut est False.

  • Configurer l'affichage des erreurs
    Utilisez la boîte de dialogue Configurer l'affichage des erreurs pour définir la gestion des erreurs de lignes.