fastLinear: fastLinear
rxEnsemble で高速線形モデルをトレーニングするための関数名と引数を含むリストを作成します。
使用方法
fastLinear(lossFunction = NULL, l2Weight = NULL, l1Weight = NULL,
trainThreads = NULL, convergenceTolerance = 0.1, maxIterations = NULL,
shuffle = TRUE, checkFrequency = NULL, ...)
引数
lossFunction
最適化する経験損失関数を指定します。 二項分類の場合、次の選択肢があります。
- logLoss: 対数損失。 既定値です。
- hingeLoss: SVM ヒンジ損失。 このパラメーターは、マージン サイズを表します。
- smoothHingeLoss: 平滑化されたヒンジ損失。 このパラメーターは、平滑化定数を表します。
線形回帰では、二乗損失 squaredLoss が現在サポートされています。 このパラメーターがNULL
に設定されている場合、既定値は学習の種類によって異なります。 - 二項分類の場合は logLoss。
- 線形回帰の場合は squaredLoss。
l2Weight
L2 正則化の重みを指定します。 この値は、負以外または NULL
とする必要があります。 NULL
を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 既定値は NULL
です。
l1Weight
L1 正則化の重みを指定します。 この値は、負以外または NULL
とする必要があります。 NULL
を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 既定値は NULL
です。
trainThreads
アルゴリズムを実行するために使用できる同時実行スレッドの数を指定します。 このパラメーターが NULL
に設定されている場合、使用されるスレッドの数は、プロセスで使用できる論理プロセッサの数と、データの密度に基づいて決定されます。 アルゴリズムを 1 つのスレッドで実行するには、1
に設定します。
convergenceTolerance
収束条件として使用される許容しきい値を指定します。 0 から 1 の範囲である必要があります。 既定値は 0.1
です。 このアルゴリズムは、相対的な双対ギャップ (双対ギャップとプライマル損失の間の比率) が指定した収束許容値を下回った場合に、収束していると見なされます。
maxIterations
トレーニングの反復数の上限を指定します。 このパラメーターは正の値または NULL
にする必要があります。 NULL
を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 反復のたびにトレーニング データを完全に渡す必要があります。 反復の合計数が指定した上限に達した後、または損失関数が収束したときのいずれか早い方でトレーニングが終了します。
shuffle
トレーニング データをシャッフルするかどうかを指定します。 データをシャッフルするには TRUE
、シャッフルしない場合は FALSE
を設定します。 既定値は TRUE
です。 SDCA は確率的最適化アルゴリズムです。 シャッフルがオンになっている場合、反復のたびにトレーニング データがシャッフルされます。
checkFrequency
損失関数が計算され、収束したかどうかを判断するためにチェックされるまでの反復回数。 正の整数または NULL
を値として指定する必要があります。 NULL
の場合、実際の値はデータ セットに基づいて自動的に計算されます。 それ以外の場合、たとえば checkFrequency = 5
を指定すると、5 回反復するごとに損失関数が計算され、収束がチェックされます。 損失関数の計算のためには、個別にトレーニング データを完全に渡す必要があります。
...
追加の引数。