FastForestBinaryTrainer Класс
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Обучение IEstimator<TTransformer> модели двоичной классификации дерева принятия решений с помощью Fast Forest.
public sealed class FastForestBinaryTrainer : Microsoft.ML.Trainers.FastTree.RandomForestTrainerBase<Microsoft.ML.Trainers.FastTree.FastForestBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>,Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>
type FastForestBinaryTrainer = class
inherit RandomForestTrainerBase<FastForestBinaryTrainer.Options, BinaryPredictionTransformer<FastForestBinaryModelParameters>, FastForestBinaryModelParameters>
Public NotInheritable Class FastForestBinaryTrainer
Inherits RandomForestTrainerBase(Of FastForestBinaryTrainer.Options, BinaryPredictionTransformer(Of FastForestBinaryModelParameters), FastForestBinaryModelParameters)
- Наследование
Комментарии
Чтобы создать этот обучатель, используйте FastForest или FastForest(Options).
Входные и выходные столбцы
Входные данные столбца меток должны иметь тип Boolean. Входные данные столбцов должны быть вектором известного Singleразмера.
Этот алгоритм обучения выводит следующие столбцы:
Имя выходного столбца | Тип столбца | Описание | |
---|---|---|---|
Score |
Single | Несвязанная оценка, вычисляемая моделью. | |
PredictedLabel |
Boolean | Прогнозируемая метка, зависящая от знака оценки. Отрицательная оценка соответствует значению false , а положительная — значению true . |
|
Probability |
Single | Вероятность, вычисляемая путем калибровки оценки значения true в качестве метки. Значение вероятности находится в диапазоне [0, 1]. |
Характеристики тренера
Задача машинного обучения | Двоичная классификация |
Требуется ли нормализация? | нет |
Требуется ли кэширование? | нет |
Обязательный NuGet в дополнение к Microsoft.ML | Microsoft.ML.FastTree |
Экспортируемый в ONNX | Да |
Сведения о алгоритме обучения
Деревья принятия решений — это непараметрические модели, выполняющие последовательность простых тестов на входных данных. Эта процедура принятия решений сопоставляет их с выходными данными из обучающего набора данных, входные данные которого похожи на обрабатываемый экземпляр. Решение принимается на каждом узле структуры данных двоичного дерева с учетом степени схожести, которая рекурсивно сопоставляет каждый экземпляр через ветви дерева, пока не будет достигнут соответствующий листовой узел и не будет возвращено выходное решение.
Деревья принятия решений имеют следующие преимущества:
- Они эффективны с точки зрения вычисления и использования памяти во время обучения и прогнозирования.
- Они могут представлять границы нелинейного принятия решений.
- Они выполняют встроенный выбор признаков и классификацию.
- Кроме того, они являются устойчивыми при наличии шумовых признаков.
Быстрый лес — это реализация случайного леса. Эта модель состоит из совокупности деревьев принятия решений. Каждое дерево в лесу принятия решений выводит распределение Гаусса путем прогнозирования. По совокупностям деревьев выполняется агрегирование с целью найти распределение по Гауссу, ближайшее к объединенному распределению для всех деревьев модели. Классификатор леса принятия решения состоит из совокупности деревьев принятия решений.
Вообще говоря, модели совокупности обеспечивают большее покрытие и точность, чем одно дерево принятия решений. Каждое дерево в лесу принятия решений выводит распределение Гаусса.
Дополнительные сведения см. в статье
- Википедия: случайный лес (статья на английском языке)
- Quantile regression forest (Лес квантильной регрессии)
- From Stumps to Trees to Forests (От пней к деревьям и лесам)
Ознакомьтесь с разделом "См. также" ссылки на примеры использования.
Поля
FeatureColumn |
Столбец признаков, который ожидает тренер. (Унаследовано от TrainerEstimatorBase<TTransformer,TModel>) |
GroupIdColumn |
Необязательный столбец groupID, который ожидает тренеры ранжирования. (Унаследовано от TrainerEstimatorBaseWithGroupId<TTransformer,TModel>) |
LabelColumn |
Столбец меток, который ожидает тренер. Может иметь значение |
WeightColumn |
Столбец веса, который ожидает тренер. Может быть |
Свойства
Info |
Обучение IEstimator<TTransformer> модели двоичной классификации дерева принятия решений с помощью Fast Forest. (Унаследовано от FastTreeTrainerBase<TOptions,TTransformer,TModel>) |
Методы
Fit(IDataView, IDataView) |
Обучает как обучающие FastForestBinaryTrainer , так и проверочный данные, возвращает значение BinaryPredictionTransformer<TModel>. |
Fit(IDataView) |
Поезда и возвращается ITransformer. (Унаследовано от TrainerEstimatorBase<TTransformer,TModel>) |
GetOutputSchema(SchemaShape) |
Обучение IEstimator<TTransformer> модели двоичной классификации дерева принятия решений с помощью Fast Forest. (Унаследовано от TrainerEstimatorBase<TTransformer,TModel>) |
Методы расширения
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Добавьте "контрольную точку кэширования" в цепочку оценщика. Это обеспечит обучение подчиненных оценщиков на основе кэшированных данных. Рекомендуется создать контрольную точку кэширования перед обучением, которые принимают несколько передач данных. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Учитывая оценщик, возвращает объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было в форме, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры со многими объектами, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия. |