Readaptar um modelo

Saiba como treinar novamente um modelo de machine learning no ML.NET.

O mundo e seus dados mudam constantemente. Dessa forma, os modelos precisam mudar e se atualizar também. O ML.NET fornece funcionalidade para retreinar modelos usando parâmetros de modelo aprendidos como ponto de partida para desenvolver continuamente a experiência anterior, em vez de começar sempre do zero.

Os seguintes algoritmos podem ser treinados novamente no ML.NET:

Carregar modelo pré-treinado

Primeiro, carregue o modelo pré-treinado em seu aplicativo. Saiba mais sobre: Para saber mais sobre o carregamento de pipelines e modelos de treinamento, consulte Salvar e carregar um modelo treinado.

// Create MLContext
MLContext mlContext = new MLContext();

// Define DataViewSchema of data prep pipeline and trained model
DataViewSchema dataPrepPipelineSchema, modelSchema;

// Load data preparation pipeline
ITransformer dataPrepPipeline = mlContext.Model.Load("data_preparation_pipeline.zip", out dataPrepPipelineSchema);

// Load trained model
ITransformer trainedModel = mlContext.Model.Load("ogd_model.zip", out modelSchema);

Extraia parâmetros do modelo pré-treinado

Depois que o modelo for carregado, extraia os parâmetros do modelo aprendido acessando a propriedade Model do modelo pré-treinado. O modelo pré-treinado foi treinado usando o modelo de regressão linear OnlineGradientDescentTrainer, que cria um RegressionPredictionTransformer que gera LinearRegressionModelParameters. Esses parâmetros de modelo de regressão linear contêm o desvio aprendido e os pesos ou os coeficientes do modelo. Esses valores são usados como ponto de partida para o novo modelo retreinado.

// Extract trained model parameters
LinearRegressionModelParameters originalModelParameters =
    ((ISingleFeaturePredictionTransformer<object>)trainedModel).Model as LinearRegressionModelParameters;

Observação

A saída dos parâmetros de modelo depende do algoritmo usado. Por exemplo OnlineGradientDescentTrainer usa LinearRegressionModelParameters, enquanto LbfgsMaximumEntropyMulticlassTrainer gera saídas MaximumEntropyModelParameters. Ao extrair parâmetros de modelo, conversão para o tipo apropriado.

Readaptar um modelo

O processo de treinar novamente um modelo não é diferente daquele de treinar um modelo. A única diferença é que o método Fit, além dos dados, também pega os parâmetros originais do modelo aprendido como entrada e os utiliza como ponto de partida no processo de retreinamento.

// New Data
HousingData[] housingData = new HousingData[]
{
    new HousingData
    {
        Size = 850f,
        HistoricalPrices = new float[] { 150000f,175000f,210000f },
        CurrentPrice = 205000f
    },
    new HousingData
    {
        Size = 900f,
        HistoricalPrices = new float[] { 155000f, 190000f, 220000f },
        CurrentPrice = 210000f
    },
    new HousingData
    {
        Size = 550f,
        HistoricalPrices = new float[] { 99000f, 98000f, 130000f },
        CurrentPrice = 180000f
    }
};

//Load New Data
IDataView newData = mlContext.Data.LoadFromEnumerable<HousingData>(housingData);

// Preprocess Data
IDataView transformedNewData = dataPrepPipeline.Transform(newData);

// Retrain model
RegressionPredictionTransformer<LinearRegressionModelParameters> retrainedModel =
    mlContext.Regression.Trainers.OnlineGradientDescent()
        .Fit(transformedNewData, originalModelParameters);

Nesse ponto, você pode salvar seu modelo treinado novamente e usá-lo em seu aplicativo. Para obter mais informações, consulte salvar e carregar um modelo treinado e fazer previsões com guias de modelo treinados.

Comparar parâmetros de modelo

Como saber se a reciclagem realmente aconteceu? Uma maneira seria comparar se os parâmetros do modelo retreinado são diferentes daqueles do modelo original. O exemplo de código a seguir compara o original com os pesos do modelo treinado novamente e os envia para o console.

// Extract Model Parameters of re-trained model
LinearRegressionModelParameters retrainedModelParameters = retrainedModel.Model as LinearRegressionModelParameters;

// Inspect Change in Weights
var weightDiffs =
    originalModelParameters.Weights.Zip(
        retrainedModelParameters.Weights, (original, retrained) => original - retrained).ToArray();

Console.WriteLine("Original | Retrained | Difference");
for(int i=0;i < weightDiffs.Count();i++)
{
    Console.WriteLine($"{originalModelParameters.Weights[i]} | {retrainedModelParameters.Weights[i]} | {weightDiffs[i]}");
}

A tabela a seguir mostra a aparência da saída.

Original Treinado novamente Diferença
33039,86 56293,76 -23253,9
29099,14 49586,03 -20486,89
28938,38 48609,23 -19670,85
30484,02 53745,43 -23261,41