FastTreeRankingFeaturizationEstimator クラス

定義

IEstimator<TTransformer>入力特徴ベクトルをツリーベースの特徴に変換する 。

public sealed class FastTreeRankingFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeRankingFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeRankingFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
継承
FastTreeRankingFeaturizationEstimator

注釈

入力列と出力列

入力ラベル データ型はキー型または Single である必要があります。 ラベルの値によって関連性が決まります。値が高いほど関連性が高くなります。 ラベルがキー型の場合、キーのインデックスは関連性の値です。ここで、最小のインデックスは最も低い関連性です。 ラベルが Single の場合、値が大きいほど関連性が高いことを示します。 特徴列は の既知のサイズの Single ベクターである必要があり、入力行グループ列は キー 型である必要があります。

この推定器は、次の列を出力します。

出力列の名前 列の型 説明
Trees の既知のサイズのベクター Single すべてのツリーの出力値。 そのサイズは、ツリー アンサンブル モデルのツリーの合計数と同じです。
Leaves の既知のサイズのベクター Single 入力特徴ベクトルが入るすべての葉の ID に対する 0 から 1 のベクトル表現。 そのサイズは、ツリー アンサンブル モデルの総葉数です。
Paths の既知のサイズのベクター Single 入力特徴ベクトルが葉に到達するために渡されたパスへの 0 から 1 のベクトル表現。 そのサイズは、ツリー アンサンブル モデル内の非リーフ ノードの数です。

これらの出力列はすべて省略可能であり、ユーザーは名前を変更できます。 スキップされた列の名前を null に設定して、生成されないようにしてください。

予測の詳細

この推定器は、ツリー アンサンブル モデルから複数の出力列を生成します。 モデルに含まれるデシジョン ツリーは 1 つだけであるとします。

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

入力特徴ベクトルが に Leaf -1分類されるとします。 出力 Trees は 1 要素ベクトルで、唯一の値は によって Leaf -1実行される決定値です。 出力 Leaves は 0 から 1 のベクトルです。 到達したリーフが$i $-th ($-(i+1)$ でインデックス付けされているため、最初のリーフが Leaf -1) ツリー内のリーフである場合、 の Leaves $i$番目の値は 1 になり、他のすべての値は 0 になります。 出力 Paths は、リーフに到達する前に渡されたノードの 0 から 1 の表現です。 の $i$-th 要素 Paths は、$i$番目のノード ($i$ でインデックス付き) がタッチされているかどうかを示します。 たとえば、 に達すると Leaf -1 、 として Paths$[1, 1, 0, 0]$ になります。 複数のツリーがある場合、この推定器は、すべてのツリーから 's、Leaves's、Paths's を連結Treesするだけです (最初のツリーの情報は、連結されたベクトルの最初に入ります)。

使用例へのリンクについては、「関連項目」セクションを参照してください。

メソッド

Fit(IDataView)

TreeEnsembleModelParametersinput 呼び出InputColumnNameされた列を 3 つの出力列にマップする を生成します。

(継承元 TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator に 3 つの float-vector 列を inputSchema追加します。 特徴ベクトル列を指定すると、追加された列は、すべてのツリーの予測値、特徴ベクトルが分類されるリーフ ID、およびそれらのリーフへのパスです。

(継承元 TreeEnsembleFeaturizationEstimatorBase)

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

推定チェーンに "キャッシュ チェックポイント" を追加します。 これにより、ダウンストリーム推定器がキャッシュされたデータに対してトレーニングされるようになります。 複数のデータ パスを受け取るトレーナーの前にキャッシュ チェックポイントを用意しておくと便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

推定器を指定すると、デリゲートが呼び出されると Fit(IDataView) 呼び出されるラップ オブジェクトを返します。 推定器は、多くの場合、適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerな ではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得する推定器がこのチェーンのどこかに埋もれている場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 そのシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

こちらもご覧ください