MLflow-Experiment

Die MLflow-Experimentdatenquelle bietet eine Standard-API zum Laden von MLflow-Experimentlaufdaten. Sie können Daten aus dem Notebookexperiment laden oder den Namen bzw. die Experiment-ID des MLflow-Experiments verwenden.

Anforderungen

Databricks Runtime 6.0 ML oder höher.

Daten aus dem Notebookexperiment laden

Verwenden Sie load(), um Daten aus dem Notebookexperiment zu laden.

Python

df = spark.read.format("mlflow-experiment").load()
display(df)

Scala

val df = spark.read.format("mlflow-experiment").load()
display(df)

Daten mit Experiment-IDs laden

Um Daten aus einem oder mehreren Arbeitsbereichsexperimenten zu laden, geben wie gezeigt Sie die Experiment-IDs an.

Python

df = spark.read.format("mlflow-experiment").load("3270527066281272")
display(df)

Scala

val df = spark.read.format("mlflow-experiment").load("3270527066281272,953590262154175")
display(df)

Daten mit Experimentnamen laden

Sie können den Experimentnamen auch an die load()-Methode übergeben.

Python

expId = mlflow.get_experiment_by_name("/Shared/diabetes_experiment/").experiment_id
df = spark.read.format("mlflow-experiment").load(expId)
display(df)

Scala

val expId = mlflow.getExperimentByName("/Shared/diabetes_experiment/").get.getExperimentId
val df = spark.read.format("mlflow-experiment").load(expId)
display(df)

Filtern von Daten auf Basis von Metriken und Parametern

Die Beispiele in diesem Abschnitt zeigen, wie Sie Daten filtern können, nachdem Sie sie aus einem Experiment geladen haben.

Python

df = spark.read.format("mlflow-experiment").load("3270527066281272")
filtered_df = df.filter("metrics.loss < 0.01 AND params.learning_rate > '0.001'")
display(filtered_df)

Scala

val df = spark.read.format("mlflow-experiment").load("3270527066281272")
val filtered_df = df.filter("metrics.loss < 1.85 AND params.num_epochs > '30'")
display(filtered_df)

Schema

Das Schema des von der Datenquelle zurückgegebenen DataFrames lautet wie folgt:

root
|-- run_id: string
|-- experiment_id: string
|-- metrics: map
|    |-- key: string
|    |-- value: double
|-- params: map
|    |-- key: string
|    |-- value: string
|-- tags: map
|    |-- key: string
|    |-- value: string
|-- start_time: timestamp
|-- end_time: timestamp
|-- status: string
|-- artifact_uri: string