Maskininlärningsmodell i Microsoft Fabric

En maskininlärningsmodell är en fil som tränats att identifiera vissa typer av mönster. Du tränar en modell över en uppsättning data och ger den en algoritm som använder för att resonera över och lära sig av den datauppsättningen. När du har tränat modellen kan du använda den för att resonera över data som den aldrig sett tidigare och göra förutsägelser om dessa data.

I MLflow kan en maskininlärningsmodell innehålla flera modellversioner. Här kan varje version representera en modell-iteration. I den här artikeln får du lära dig hur du interagerar med ML-modeller för att spåra och jämföra modellversioner.

Skapa en maskininlärningsmodell

I MLflow innehåller maskininlärningsmodeller ett standardpaketeringsformat. Det här formatet tillåter användning av dessa modeller i olika nedströmsverktyg, inklusive batch-slutsatsdragning på Apache Spark. Formatet definierar en konvention för att spara en modell i olika "smaker" som olika underordnade verktyg kan förstå.

Du kan skapa en maskininlärningsmodell direkt från infrastrukturgränssnittet. MLflow-API:et kan också skapa modellen direkt.

Om du vill skapa en maskininlärningsmodell från användargränssnittet kan du:

  1. Skapa en ny datavetenskapsarbetsyta eller välj en befintlig datavetenskapsarbetsyta.

  2. I listrutan + Ny väljer du Modell för att skapa en tom modell på din datavetenskapsarbetsyta.

    Screenshot showing the New drop-down menu.

  3. När modellen har skapats kan du börja lägga till modellversioner för att spåra körningsmått och parametrar. Registrera eller spara experimentkörningar till en befintlig modell.

Du kan också skapa ett maskininlärningsexperiment direkt från din redigeringsupplevelse med API:et mlflow.register_model() . Om det inte finns någon registrerad maskininlärningsmodell med det angivna namnet skapar API:et den automatiskt.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Hantera versioner i en maskininlärningsmodell

En maskininlärningsmodell innehåller en samling modellversioner för förenklad spårning och jämförelse. I en modell kan en dataexpert navigera mellan olika modellversioner för att utforska underliggande parametrar och mått. Dataexperter kan också göra jämförelser mellan modellversioner för att identifiera om nyare modeller kan ge bättre resultat eller inte.

Spåra maskininlärningsmodeller

En maskininlärningsmodellversion representerar en enskild modell som är registrerad för spårning.

Screenshot showing the details screen of a model.

Varje modellversion innehåller följande information:

  • Skapad tid: Datum och tid då modellen skapades.
  • Körnamn: Identifieraren för experimentkörningarna som används för att skapa den här specifika modellversionen.
  • Hyperparametrar: Hyperparametrar sparas som nyckel/värde-par. Både nycklar och värden är strängar.
  • Mått: Kör mått som sparats som nyckel/värde-par. Värdet är numeriskt.
  • Modellschema/signatur: En beskrivning av modellens indata och utdata.
  • Loggade filer: Loggade filer i valfritt format. Du kan till exempel spela in bilder, miljö, modeller och datafiler.

Jämföra och filtrera maskininlärningsmodeller

Om du vill jämföra och utvärdera kvaliteten på maskininlärningsmodellversioner kan du jämföra parametrar, mått och metadata mellan valda versioner.

Jämföra maskininlärningsmodeller visuellt

Du kan visuellt jämföra körningar i en befintlig modell. Med visuell jämförelse kan du enkelt navigera mellan och sortera mellan flera versioner.

Screenshot showing a list of runs for comparison.

Om du vill jämföra körningar kan du:

  1. Välj en befintlig maskininlärningsmodell som innehåller flera versioner.
  2. Välj fliken Visa och gå sedan till vyn Modelllista . Du kan också välja alternativet för att visa modelllistan direkt från informationsvyn.
  3. Du kan anpassa kolumnerna i tabellen. Expandera fönstret Anpassa kolumner . Därifrån kan du välja de egenskaper, mått och hyperparametrar som du vill se.
  4. Slutligen kan du välja flera versioner, för att jämföra deras resultat, i jämförelsefönstret för mått. I det här fönstret kan du anpassa diagrammen med ändringar i diagramrubriken, visualiseringstypen, X-axeln, Y-axeln med mera.

Jämföra maskininlärningsmodeller med MLflow-API:et

Dataexperter kan också använda MLflow för att söka bland flera modeller som sparats på arbetsytan. Gå till MLflow-dokumentationen för att utforska andra MLflow-API:er för modellinteraktion.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Använda maskininlärningsmodeller

När du har tränat en modell på en datauppsättning kan du använda modellen på data som den aldrig såg för att generera förutsägelser. Vi kallar den här modellen för användning av teknikbedömning eller slutsatsdragning. Mer information om Microsoft Fabric-modellbedömning finns i nästa avsnitt.