microsoftml.n_gram: convierte texto en características mediante n-gramas
Uso
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
Descripción
Extrae n-gramas de texto y los convierte en vectores mediante el diccionario.
Argumentos
ngram_length
Longitud de los n-gramas (configuración).
skip_length
Número máximo de tokens que se omitirán al construir un n-grama (configuración).
all_lengths
Indica si deben incluirse todas las longitudes de n-grama hasta NgramLength o solo NgramLength (configuración).
max_num_terms
Número máximo de n-gramas que se almacenarán en el diccionario (configuración).
weighting
Criterios de ponderación (configuración).