fastLinear: fastLinear

rxEnsemble で高速線形モデルをトレーニングするための関数名と引数を含むリストを作成します。

使用方法

  fastLinear(lossFunction = NULL, l2Weight = NULL, l1Weight = NULL,
    trainThreads = NULL, convergenceTolerance = 0.1, maxIterations = NULL,
    shuffle = TRUE, checkFrequency = NULL, ...)
 

引数

lossFunction

最適化する経験損失関数を指定します。 二項分類の場合、次の選択肢があります。

  • logLoss: 対数損失。 既定値です。
  • hingeLoss: SVM ヒンジ損失。 このパラメーターは、マージン サイズを表します。
  • smoothHingeLoss: 平滑化されたヒンジ損失。 このパラメーターは、平滑化定数を表します。
    線形回帰では、二乗損失 squaredLoss が現在サポートされています。 このパラメーターが NULL に設定されている場合、既定値は学習の種類によって異なります。
  • 二項分類の場合は logLoss
  • 線形回帰の場合は squaredLoss

l2Weight

L2 正則化の重みを指定します。 この値は、負以外または NULL とする必要があります。 NULL を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 既定値は NULL です。

l1Weight

L1 正則化の重みを指定します。 この値は、負以外または NULL とする必要があります。 NULL を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 既定値は NULL です。

trainThreads

アルゴリズムを実行するために使用できる同時実行スレッドの数を指定します。 このパラメーターが NULL に設定されている場合、使用されるスレッドの数は、プロセスで使用できる論理プロセッサの数と、データの密度に基づいて決定されます。 アルゴリズムを 1 つのスレッドで実行するには、1 に設定します。

convergenceTolerance

収束条件として使用される許容しきい値を指定します。 0 から 1 の範囲である必要があります。 既定値は 0.1 です。 このアルゴリズムは、相対的な双対ギャップ (双対ギャップとプライマル損失の間の比率) が指定した収束許容値を下回った場合に、収束していると見なされます。

maxIterations

トレーニングの反復数の上限を指定します。 このパラメーターは正の値または NULL にする必要があります。 NULL を指定した場合、実際の値はデータ セットに基づいて自動的に計算されます。 反復のたびにトレーニング データを完全に渡す必要があります。 反復の合計数が指定した上限に達した後、または損失関数が収束したときのいずれか早い方でトレーニングが終了します。

shuffle

トレーニング データをシャッフルするかどうかを指定します。 データをシャッフルするには TRUE、シャッフルしない場合は FALSE を設定します。 既定値は TRUE です。 SDCA は確率的最適化アルゴリズムです。 シャッフルがオンになっている場合、反復のたびにトレーニング データがシャッフルされます。

checkFrequency

損失関数が計算され、収束したかどうかを判断するためにチェックされるまでの反復回数。 正の整数または NULL を値として指定する必要があります。 NULL の場合、実際の値はデータ セットに基づいて自動的に計算されます。 それ以外の場合、たとえば checkFrequency = 5 を指定すると、5 回反復するごとに損失関数が計算され、収束がチェックされます。 損失関数の計算のためには、個別にトレーニング データを完全に渡す必要があります。

...

追加の引数。