Använda scikit-learn i Azure Databricks
Den här sidan innehåller exempel på hur du kan använda scikit-learn
paketet för att träna maskininlärningsmodeller i Azure Databricks. scikit-learn är ett av de mest populära Python-biblioteken för maskininlärning med en nod och ingår i Databricks Runtime och Databricks Runtime ML. Se Viktig information om Databricks Runtime för scikit-learn-biblioteksversionen som ingår i klustrets körning.
Du kan importera dessa notebook-filer och köra dem på din Azure Databricks-arbetsyta.
Ytterligare exempel på notebook-filer för att komma igång snabbt med Azure Databricks finns i Självstudier: Kom igång med AI och maskininlärning.
Grundläggande exempel med scikit-learn
Den här notebook-filen ger en snabb översikt över maskininlärningsmodellträning i Azure Databricks. Det använder paketet scikit-learn
för att träna en enkel klassificeringsmodell. Det illustrerar också användningen av MLflow för att spåra modellutvecklingsprocessen och Optuna för att automatisera justering av hyperparametrar.
Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:
scikit-learn-klassificeringsanteckningsbok (Unity Catalog)
Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:
scikit-learn-klassificeringsanteckningsbok
Exempel från slutpunkt till slutpunkt med scikit-learn i Azure Databricks
Den här notebook-filen använder scikit-learn för att illustrera ett komplett exempel från slutpunkt till slutpunkt på inläsning av data, modellträning, distribuerad hyperparameterjustering och modellinferens. Den illustrerar också modelllivscykelhantering med MLflow Model Registry för att logga och registrera din modell.
Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:
Använda scikit-learn med MLflow-integrering på Databricks (Unity Catalog)
Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen: