Editor trasformazione Estrazione termini (Scheda Avanzate)

Utilizzare la scheda Avanzate della finestra di dialogo Editor trasformazione Estrazione termini per specificare le proprietà per l'estrazione, ad esempio la frequenza, la lunghezza e le eventuali parole o frasi da estrarre.

Per ulteriori informazioni sulla trasformazione Estrazione termini, vedere Trasformazione Estrazione termini.

Opzioni

  • Sostantivo
    Consente di specificare che la trasformazione estrarrà solo singoli sostantivi.

  • Sintagma nominale
    Consente di specificare che la trasformazione estrarrà solo sintagmi nominali.

  • Sostantivo e sintagma nominale
    Consente di specificare che la trasformazione estrarrà sia sostantivi che sintagmi nominali.

  • Frequenza
    Consente di specificare che il punteggio è rappresentato dalla frequenza del termine.

  • TFIDF
    Consente di specificare che il punteggio è rappresentato dal valore TFIDF del termine. Il punteggio TFIDF è il prodotto tra la frequenza del termine (TF) e l'inverso della frequenza nei documenti (IDF) espresso dalla ponderazione seguente: TFIDF di un termine T = (frequenza di T) * log( (numero di righe in input) / (numero di righe contenenti il termine T) )

  • Soglia di frequenza
    Consente di specificare il numero di volte in cui una parola o una frase deve ricorrere prima che venga estratta. Il valore predefinito è 2.

  • Lunghezza massima termine
    Consente di specificare la lunghezza massima in parole di una frase. Questa opzione ha effetto soltanto sui sintagmi nominali. Il valore predefinito è 12.

  • Estrazione con distinzione maiuscole/minuscole
    Consente di specificare se eseguire l'estrazione rilevando la distinzione tra maiuscole e minuscole. Il valore predefinito è False.

  • Configura output errori
    Consente di utilizzare la finestra di dialogo Configura output errori per specificare le opzioni di gestione degli errori per le righe che causano errori.