FastForestBinaryTrainer クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
IEstimator<TTransformer>高速フォレストを使用してデシジョン ツリーのバイナリ分類モデルをトレーニングする場合。
public sealed class FastForestBinaryTrainer : Microsoft.ML.Trainers.FastTree.RandomForestTrainerBase<Microsoft.ML.Trainers.FastTree.FastForestBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>,Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>
type FastForestBinaryTrainer = class
inherit RandomForestTrainerBase<FastForestBinaryTrainer.Options, BinaryPredictionTransformer<FastForestBinaryModelParameters>, FastForestBinaryModelParameters>
Public NotInheritable Class FastForestBinaryTrainer
Inherits RandomForestTrainerBase(Of FastForestBinaryTrainer.Options, BinaryPredictionTransformer(Of FastForestBinaryModelParameters), FastForestBinaryModelParameters)
- 継承
注釈
このトレーナーを作成するには、 FastForest または FastForest(オプション) を使用します。
入力列と出力列
入力ラベル列データは Boolean にする必要があります。 入力特徴列データは、既知のサイズの Singleベクターである必要があります。
このトレーナーからは、以下の列が出力されます。
出力列の名前 | 列の型 | 説明 | |
---|---|---|---|
Score |
Single | モデルによって計算された無制限のスコア。 | |
PredictedLabel |
Boolean | スコアの符号に基づく予測ラベル。 負のスコアは false にマップされ、正のスコアは true にマップされます。 |
|
Probability |
Single | ラベルとして true を持つスコアを調整することによって計算される確率。 確率値の範囲は [0, 1] です。 |
トレーナーの特性
機械学習タスク | 二項分類 |
正規化は必要ですか? | いいえ |
キャッシュは必要ですか? | いいえ |
Microsoft.ML に加えて必要な NuGet | Microsoft.ML.FastTree |
ONNX にエクスポート可能 | はい |
トレーニング アルゴリズムの詳細
デシジョン ツリーは、入力に対して一連の単純なテストを実行するノンパラメトリック モデルです。 この決定手順では、入力が処理されているインスタンスに似ているトレーニング データセット内の出力にマップされます。 適切なリーフ ノードに到達して出力決定が返されるまで、各インスタンスをツリーの分岐を通じて再帰的にマップする類似性の尺度に基づいて、バイナリ ツリー データ構造の各ノードで決定が行われます。
デシジョン ツリーには、次のようないくつかの利点があります。
- トレーニング時と予測時における計算とメモリ使用量の両方の点で効率に優れている。
- 非線形の決定境界を表すことができる。
- 統合された特徴選択と分類が行われる。
- ノイズの多い特徴が存在する状況での回復性がある。
高速フォレストは、ランダム フォレストの実装です。 このモデルは、複数のデシジョン ツリーの集団から成ります。 デシジョン フォレストに含まれる各ツリーからは、予測の手段としてガウス分布が出力されます。 ツリーの集団に対して集計 (アグリゲーション) を行うことによって、モデルに含まれる全ツリーの分布の組み合わせに最も近いガウス分布を見つけ出します。 このデシジョン フォレスト分類器は、デシジョン ツリーのアンサンブルで構成されます。
一般に、アンサンブル モデルは、単一のデシジョン ツリーと比べ、カバレッジと正確性が優れています。 デシジョン フォレストに含まれる各ツリーからは、ガウス分布が出力されます。
詳細については、以下を参照してください。
使用法の例へのリンクについては、「参照」セクションを参照してください。
フィールド
FeatureColumn |
トレーナーが期待する特徴列。 (継承元 TrainerEstimatorBase<TTransformer,TModel>) |
GroupIdColumn |
ランク付けトレーナーが期待するオプションの groupID 列。 (継承元 TrainerEstimatorBaseWithGroupId<TTransformer,TModel>) |
LabelColumn |
トレーナーが期待するラベル列。 できます |
WeightColumn |
トレーナーが期待する重み列。 できます。 |
プロパティ
Info |
IEstimator<TTransformer>高速フォレストを使用してデシジョン ツリーのバイナリ分類モデルをトレーニングする場合。 (継承元 FastTreeTrainerBase<TOptions,TTransformer,TModel>) |
メソッド
Fit(IDataView, IDataView) |
トレーニングデータと検証データの FastForestBinaryTrainer 両方を使用してトレーニングを行い、 BinaryPredictionTransformer<TModel>. |
Fit(IDataView) |
をトレーニングして返します ITransformer。 (継承元 TrainerEstimatorBase<TTransformer,TModel>) |
GetOutputSchema(SchemaShape) |
IEstimator<TTransformer>高速フォレストを使用してデシジョン ツリーのバイナリ分類モデルをトレーニングする場合。 (継承元 TrainerEstimatorBase<TTransformer,TModel>) |
拡張メソッド
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
エスティメーター チェーンに 'キャッシュ チェックポイント' を追加します。 これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。 複数のデータを受け取るトレーナーが渡す前にキャッシュ チェックポイントを設定すると便利です。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップ オブジェクトが呼び出されます。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。 |