FastForestBinaryFeaturizationEstimator Classe
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Oggetto IEstimator<TTransformer> per trasformare il vettore di funzionalità di input in funzionalità basate su albero.
public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
- Ereditarietà
Commenti
Colonne di input e output
I dati della colonna dell'etichetta di input devono essere Boolean. I dati delle colonne delle funzionalità di input devono essere un vettore di dimensioni note di Single.
Questo strumento di stima restituisce le colonne seguenti:
Nome colonna di output | Tipo di colonna | Descrizione |
---|---|---|
Trees |
Vettore di dimensioni note di Single | Valori di output di tutti gli alberi. Le dimensioni sono identiche al numero totale di alberi nel modello di insieme di alberi. |
Leaves |
Vettore di dimensioni note di Single | Rappresentazione vettoriale da 0 a 1 agli ID di tutte le foglie in cui rientra il vettore di funzionalità di input. La sua dimensione è il numero di foglie totali nel modello di insieme di alberi. |
Paths |
Vettore di dimensioni note di Single | Rappresentazione vettoriale 0-1 nei percorsi il vettore di funzionalità di input passato per raggiungere le foglie. La dimensione è il numero di nodi non foglia nel modello di insieme di alberi. |
Queste colonne di output sono tutte facoltative e gli utenti possono modificare i nomi. Impostare i nomi delle colonne ignorate su Null in modo che non vengano prodotti.
Dettagli stima
Questo strumento di stima produce diverse colonne di output da un modello di insieme di alberi. Si supponga che il modello contenga un solo albero delle decisioni:
Node 0
/ \
/ \
/ \
/ \
Node 1 Node 2
/ \ / \
/ \ / \
/ \ Leaf -3 Node 3
Leaf -1 Leaf -2 / \
/ \
Leaf -4 Leaf -5
Si supponga che il vettore di funzionalità di input cada in Leaf -1
. L'output Trees
può essere un vettore a 1 elemento in cui l'unico valore è il valore decisionale trasportato da Leaf -1
. L'output Leaves
è un vettore 0-1. Se la foglia raggiunta è la $i$-th (indicizzata da $-(i+1)$, quindi la prima foglia è Leaf -1
) nell'albero, il valore $i$-th in Leaves
sarà 1 e tutti gli altri valori saranno 0. L'output Paths
è una rappresentazione 0-1 dei nodi passati prima di raggiungere la foglia. L'elemento $i$-th in Paths
indica se il nodo $i$-th (indicizzato da $i$) viene toccato.
Ad esempio, raggiungere Leaf -1
porta a $[1, 1, 0, 0]$ come Paths
. Se sono presenti più alberi, questo strumento di stima concatena Trees
solo 's, Leaves
's, Paths
's da tutti gli alberi (le informazioni del primo albero vengono prima nei vettori concatenati).
Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.
Metodi
Fit(IDataView) |
Generare un TreeEnsembleModelParameters oggetto che esegue il mapping della colonna chiamata InputColumnName in |
GetOutputSchema(SchemaShape) |
PretrainedTreeFeaturizationEstimator aggiunge tre colonne float-vector in |
Metodi di estensione
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit. |