FastForestBinaryFeaturizationEstimator Класс

Определение

Объект IEstimator<TTransformer> для преобразования вектора входных признаков в признаки на основе дерева.

public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Наследование
FastForestBinaryFeaturizationEstimator

Комментарии

Входные и выходные столбцы

Входные данные столбца меток должны иметь тип Boolean. Данные столбца входных признаков должны быть вектором известного Singleразмера .

Этот оценщик выводит следующие столбцы:

Имя выходного столбца Тип столбца Описание
Trees Известный размер вектора Single Выходные значения всех деревьев. Его размер идентичен общему количеству деревьев в модели ансамбля деревьев.
Leaves Известный размер вектора Single Векторное представление от 0 до 1 для идентификаторов всех листьев, в которые попадает вектор входных признаков. Его размер — это количество общих листьев в модели ансамбля дерева.
Paths Известный размер вектора Single Векторное представление от 0 до 1 для путей, через которые вектор входных признаков прошел для достижения листьев. Его размер — это количество неконечных узлов в модели ансамбля дерева.

Эти выходные столбцы являются необязательными, и пользователь может изменить свои имена. Присвойте имена пропущенным столбцам значение NULL, чтобы они не были созданы.

Сведения о прогнозе

Этот оценщик создает несколько выходных столбцов из модели ансамбля дерева. Предположим, что модель содержит только одно дерево принятия решений:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Предположим, что вектор входной функции попадает в Leaf -1. Выходные данные Trees могут быть вектором из 1 элемента, где единственным значением является значение принятия решения, перевозимое .Leaf -1 Выходные данные Leaves — вектор от 0 до 1. Если достигнутый лист является $i$-й (индексируется по $-(i+1)$, поэтому первый лист является Leaf -1) в дереве, $i$-й значение в Leaves будет равно 1, а все остальные значения будут равны 0. Выходные данные Paths представляют собой 0–1-е представление узлов, передаваемых до достижения конечной части. Элемент $i$th в Paths указывает, касается ли узел $i$-й (индексируется по $i$). Например, достижение Leaf -1 параметра привести к $[1, 1, 0, 0]$ в Pathsкачестве . Если деревьев несколько, этот оценщик просто сцепляет Trees's, Leaves's, Paths's из всех деревьев (информация первого дерева приходит первым в сцепленных векторах).

Ссылки на примеры использования см. в разделе См. также.

Методы

Fit(IDataView)

Создает объект , TreeEnsembleModelParameters который сопоставляет вызываемые InputColumnName столбцы с input тремя выходными столбцами.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator добавляет три столбца с плавающей векторной точкой в inputSchema. При наличии столбца вектора признаков добавленные столбцы являются прогнозируемыми значениями всех деревьев, идентификаторами листов, в которые попадает вектор признаков, и путями к этим листьям.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте контрольную точку кэширования в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Полезно иметь контрольную точку кэширования перед инструкторами, которые принимают несколько проходов данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, верните объект-оболочку, который будет вызывать делегат после Fit(IDataView) вызова . Оценщику часто важно возвращать сведения о том, что подходит, поэтому Fit(IDataView) метод возвращает объект конкретного типа, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры с большим количеством объектов, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. Для этого сценария с помощью этого метода можно подключить делегат, который будет вызываться после вызова fit.

Применяется к

См. также раздел