fastTrees: fastTrees
rxEnsemble で FastTree モデルをトレーニングするための関数名と引数を含むリストを作成します。
使用方法
fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
splitFraction = 1, numBins = 255, firstUsePenalty = 0,
gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
randomSeed = NULL, ...)
引数
numTrees
アンサンブルに作成するデシジョン ツリーの総数を指定します。 作成するデシジョン ツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。 既定値は 100 です。
numLeaves
ツリーに作成できるリーフ (終端ノード) の最大数。 値を大きくすると、ツリーのサイズが大きくなって精度が向上する可能性がありますが、オーバーフィットが発生し、トレーニング時間が長くなるリスクがあります。 既定値は 20 です。
learningRate
学習プロセスの各ステップで、勾配の方向に対して実行されるステップのサイズを決定します。 これにより、学習器がどの程度の速さ (遅さ) で最適解に収束するかが決まります。 ステップ サイズが大きすぎると、最適解から離れていってしまう可能性があります。 ステップ サイズが小さすぎると、トレーニングが最適解に収束するまでの時間が長くなります。
minSplit
リーフを形成するために必要なトレーニング インスタンスの最小数。 つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。 既定値は 10 です。 インスタンスが重み付けされた場合でも、インスタンスの数だけがカウントされます。
exampleFraction
各ツリーに使用するランダムに選択されたインスタンスの割合。 既定値は 0.7 です。
featureFraction
各ツリーに使用するランダムに選択された特徴の割合。 既定値は 1 です。
splitFraction
各分割に使用するランダムに選択された特徴の割合。 既定値は 1 です。
numBins
特徴ごとの個別の値 (ビン) の最大数。 特徴の値が指定された数よりも小さい場合、それぞれの値が独自のビンに配置されます。 値が多い場合、アルゴリズムによって numBins
個のビンが作成されます。
firstUsePenalty
特徴の初回使用ペナルティ係数。 これは、ツリーの作成時に新しい特徴を使用するとペナルティが発生する正則化の形式です。 この値を大きくすると、多数の特徴を使用しないツリーが作成されます。 既定値は 0 です。
gainConfLevel
ツリー フィット ゲイン信頼度要件 ([0, 1) の範囲内である必要があります)。 既定値は 0 です。
unbalancedSets
TRUE
の場合、不均衡セットに最適化された導関数が使用されます。 type
が "binary"
に等しい場合にのみ適用されます。 既定値は FALSE
です。
trainThreads
トレーニングで使用するスレッドの数。 既定値は 8 です。
randomSeed
ランダム シードを指定します。 既定値は NULL
です。
...
追加の引数。