Använda Apache Spark MLlib på Azure Databricks
Den här sidan innehåller exempel på notebook-filer som visar hur du använder MLlib på Azure Databricks.
Apache Spark MLlib är Apache Spark-maskininlärningsbiblioteket som består av vanliga inlärningsalgoritmer och verktyg, inklusive klassificering, regression, klustring, samarbetsfilter, dimensionsminskning samt underliggande optimeringsprimitiver. För referensinformation om MLlib-funktioner rekommenderar Azure Databricks följande Apache Spark API-referenser:
Information om hur du använder Apache Spark MLlib från R finns i dokumentationen för R-maskininlärning .
Exempel på binär klassificering – notebook-fil
Den här notebook-filen visar hur du skapar ett program för binär klassificering med hjälp av API:et för Apache Spark MLlib-pipelines.
Notebook-fil för binär klassificering
Exempelanteckningsböcker för beslutsträd
De här exemplen visar olika användningsområden för beslutsträd med hjälp av API:et för Apache Spark MLlib-pipelines.
Beslutsträd
Dessa notebook-filer visar hur du utför klassificeringar med beslutsträd.
Beslutsträd för notebook-fil för sifferigenkänning
Beslutsträd för notebook-fil för SFO-undersökning
GBT-regression med MLlib-pipelines
Den här notebook-filen visar hur du använder MLlib-pipelines för att utföra en regression med förbättrade träd för att förutsäga antalet cykeluthyrningar (per timme) utifrån information som veckodag, väder, säsong och så vidare.
Regressions-notebook-fil för cykeldelning
Exempel på avancerad Apache Spark MLlib-notebook-fil
Den här notebook-filen visar hur du skapar en anpassad transformator.