Azure Databricks에서 Apache Spark MLlib 사용

이 페이지에서는 Azure Databricks에서 MLlib를 사용하는 방법을 보여주는 예제 notebook을 제공합니다.

Apache Spark MLlib는 분류, 회귀, 클러스터링, 공동 작업 필터링, 차원 감소, 기본 최적화 기본 요소 등 일반적인 학습 알고리즘 및 유틸리티로 구성된 Apache Spark 기계 학습 라이브러리입니다. MLlib 기능에 대한 참조 정보에 대해 Azure Databricks는 다음 Apache Spark API 참조를 권장합니다.

R에서 Apache Spark MLlib를 사용하는 방법에 대한 자세한 내용은 R 기계 학습 설명서를 참조하세요.

이진 분류 예제 notebook

이 Notebook에서는 Apache Spark MLlib 파이프라인 API를 사용해 이진 분류 애플리케이션을 빌드하는 방법을 설명합니다.

이진 분류 Notebook

notebook 가져오기

의사 결정 트리 예제 Notebook

이 예제에서는 Apache Spark MLlib Pipelines API를 사용하여 의사 결정 트리의 다양한 애플리케이션을 보여줍니다.

의사 결정 트리

이 Notebook은 의사 결정 트리로 분류를 수행하는 방법을 보여줍니다.

숫자 인식을 위한 의사 결정 트리 Notebook

notebook 가져오기

SFO 설문 조사를 위한 의사 결정 트리 Notebook

notebook 가져오기

MLlib 파이프라인을 사용한 GBT 회귀

이 notebook에서는 MLlib 파이프라인을 사용하여 요일, 날씨, 계절 등의 정보로부터 자전거 대여 횟수(시간당)를 예측하기 위해 경사 부스팅 트리를 사용하여 회귀를 수행하는 방법을 보여드립니다.

자전거 공유 회귀 Notebook

notebook 가져오기

고급 Apache Spark MLlib notebook 예제

이 Notebook에서는 사용자 정의 transformer를 만드는 방법에 대해 설명합니다.

사용자 지정 변환기 notebook

notebook 가져오기