Använda Apache Spark MLlib på Azure Databricks

Den här sidan innehåller exempel på notebook-filer som visar hur du använder MLlib på Azure Databricks.

Apache Spark MLlib är Apache Spark-maskininlärningsbiblioteket som består av vanliga inlärningsalgoritmer och verktyg, inklusive klassificering, regression, klustring, samarbetsfilter, dimensionsminskning samt underliggande optimeringsprimitiver. För referensinformation om MLlib-funktioner rekommenderar Azure Databricks följande Apache Spark API-referenser:

Information om hur du använder Apache Spark MLlib från R finns i dokumentationen för R-maskininlärning .

Exempel på binär klassificering – notebook-fil

Den här notebook-filen visar hur du skapar ett program för binär klassificering med hjälp av API:et för Apache Spark MLlib-pipelines.

Notebook-fil för binär klassificering

Hämta notebook-fil

Exempelanteckningsböcker för beslutsträd

De här exemplen visar olika användningsområden för beslutsträd med hjälp av API:et för Apache Spark MLlib-pipelines.

Beslutsträd

Dessa notebook-filer visar hur du utför klassificeringar med beslutsträd.

Beslutsträd för notebook-fil för sifferigenkänning

Hämta notebook-fil

Beslutsträd för notebook-fil för SFO-undersökning

Hämta notebook-fil

GBT-regression med MLlib-pipelines

Den här notebook-filen visar hur du använder MLlib-pipelines för att utföra en regression med förbättrade träd för att förutsäga antalet cykeluthyrningar (per timme) utifrån information som veckodag, väder, säsong och så vidare.

Regressions-notebook-fil för cykeldelning

Hämta notebook-fil

Exempel på avancerad Apache Spark MLlib-notebook-fil

Den här notebook-filen visar hur du skapar en anpassad transformator.

Notebook-fil för anpassad transformator

Hämta notebook-fil