steps Paket
Enthält vordefinierte Schritte, die in einer Azure Machine Learning-Pipeline ausgeführt werden können.
Azure ML-Pipelineschritte können zusammen konfiguriert werden, um eine Pipeline zu erstellen, die einen gemeinsam nutzbaren und wiederverwendbaren Azure Machine Learning-Workflow darstellt. Jeder Schritt einer Pipeline kann so konfiguriert werden, dass die vorherigen Ausführungsergebnisse wiederverwendet werden können, wenn die Schrittinhalte (Skripts und Abhängigkeiten) sowie Eingaben und Parameter unverändert bleiben.
Die Klassen in diesem Paket werden in der Regel zusammen mit den Klassen im core-Paket verwendet. Das core-Paket enthält Klassen zum Konfigurieren von Daten (PipelineData), zum Planen (Schedule) und zum Verwalten der Ausgabe von Schritten (StepRun).
Die vordefinierten Schritte in diesem Paket decken zahlreiche gängige Szenarien in Workflows für maschinelles Lernen ab. Informationen zu den ersten Schritten mit vordefinierten Pipelineschritten finden Sie hier:
Module
adla_step |
Enthält Funktionen zum Erstellen eines Azure ML Pipeline-Schritts zum Ausführen eines U-SQL Skripts mit Azure Data Lake Analytics. |
automl_step |
Enthält Funktionen zum Hinzufügen und Verwalten eines automatisierten ML-Pipelineschritts in Azure Machine Learning. |
azurebatch_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, der eine ausführbare Windows in Azure Batch. |
command_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, in dem Befehle Skript ausgeführt werden. |
data_transfer_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, der Daten zwischen Speicheroptionen überträgt. |
databricks_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts zum Ausführen eines Databricks-Notebooks oder Python-Skripts in DBFS. |
estimator_step |
Enthält Funktionen zum Erstellen eines Pipelineschritts, mit dem ein Estimator für das Training eines ML-Modells ausgeführt wird. |
hyper_drive_step |
Enthält Funktionen zum Erstellen und Verwalten von Azure ML-Pipelineschritten zum Ausführen der Hyperparameteroptimierung. |
kusto_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts zum Ausführen eines Kusto-Notebooks. |
module_step |
Enthält Funktionen zum Hinzufügen eines Azure Machine Learning Pipelineschritts mit einer vorhandenen Version eines Moduls. |
mpi_step |
Enthält Funktionen zum Hinzufügen eines Azure ML-Pipelineschritts zum Ausführen eines MPI-Auftrags für Machine Learning Modelltrainings. |
parallel_run_config |
Enthält Funktionen zum Konfigurieren eines ParallelRunStep. |
parallel_run_step |
Enthält Funktionen zum Hinzufügen eines Schritts zum Ausführen eines Benutzerskripts im parallelen Modus auf mehreren AmlCompute-Zielen. |
python_script_step |
Enthält Funktionalität zum Erstellen eines Azure ML-Pipelineschritts, in dem das Python-Skript ausgeführt wird. |
r_script_step |
Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, in dem das R-Skript ausgeführt wird. |
synapse_spark_step |
Enthält Funktionen zum Erstellen eines Azure ML-Synapse-Schritts zum Ausführen des Python-Skripts. |
Klassen
AdlaStep |
Erstellt einen Azure ML-Pipelineschritt zum Ausführen eines U-SQL-Skripts mit Azure Data Lake Analytics. Ein Beispiel für die Verwendung von AutoMLStep finden Sie im Notebook https://aka.ms/pl-adla. Erstellen Sie einen Azure ML Pipeline-Schritt, um ein U-SQL-Skript mit Azure Data Lake Analytics auszuführen. |
AutoMLStep |
Erstellt einen Azure ML-Pipelineschritt, der eine automatisierte ML-Ausführung kapselt. Ein Beispiel für die Verwendung von AutoMLStep finden Sie im Notebook https://aka.ms/pl-automl. Initialisieren Sie autoMLStep. |
AutoMLStepRun |
Enthält Informationen zu einer Experimentausführung des automatisierten maschinellen Lernens und Methoden zum Abrufen von Standardausgaben. Die AutoMLStepRun-Klasse wird verwendet, um den Status zu verwalten und zu überprüfen sowie Ausführungsdetails abzurufen, sobald eine Ausführung des automatisierten maschinellen Lernens in einer Pipeline übermittelt wird. Darüber hinaus kann diese Klasse verwendet werden, um die Standardausgabe von AutoMLStep über die StepRun-Klasse zu erhalten. Initialisieren Sie eine Automl-Schrittausführung. |
AzureBatchStep |
Erstellt einen Azure ML-Pipelineschritt zum Übermitteln von Aufträgen an Azure Batch. Hinweis: Dieser Schritt unterstützt nicht das Hoch-/Herunterladen von Verzeichnissen und deren Inhalt. Ein Beispiel für die Verwendung von AzureBatchStep finden Sie im Notebook https://aka.ms/pl-azbatch. Erstellen Sie einen Azure ML Pipeline-Schritt zum Übermitteln von Aufträgen an Azure Batch. |
CommandStep |
Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Befehl ausgeführt wird. Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Befehl ausgeführt wird. |
DataTransferStep |
Erstellt einen Azure ML-Pipelineschritt, der Daten zwischen Speicheroptionen überträgt. DataTransferStep unterstützt gängige Speichertypen wie Azure Blob Storage und Azure Data Lake als Quellen und Senken. Weitere Informationen finden Sie im Abschnitt Hinweise. Ein Beispiel für die Verwendung von DatabricksTransferStep finden Sie im Notebook https://aka.ms/pl-data-trans. Erstellen Sie einen Azure ML Pipeline-Schritt, der Daten zwischen Speicheroptionen überträgt. |
DatabricksStep |
Erstellt einen Azure ML-Pipelineschritt, um ein DataBricks-Notebook, ein Python-Skript oder eine JAR-Datei als Knoten hinzuzufügen. Ein Beispiel für die Verwendung von DatabricksStep finden Sie im Notebook https://aka.ms/pl-databricks. Erstellen Sie einen Azure ML Pipeline-Schritt, um ein DataBricks-Notebook, Python-Skript oder JAR als Knoten hinzuzufügen. Ein Beispiel für die Verwendung von DatabricksStep finden Sie im Notebook https://aka.ms/pl-databricks. :p aram python_script_name:[Erforderlich] Der Name eines Python-Skripts relativ zu Geben Sie genau eines von Wenn Sie ein DataReference-Objekt als Eingabe mit data_reference_name=input1 und ein PipelineData-Objekt als Ausgabe mit name=output1 angeben, werden die Eingaben und Ausgaben als Parameter an das Skript übergeben. So sehen sie aus, und Sie müssen die Argumente in Ihrem Skript analysieren, um auf die Pfade jeder Eingabe und Ausgabe zu zugreifen: "-input1", "wasbs://test@storagename.blob.core.windows.net/test", "-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1" Darüber hinaus sind die folgenden Parameter im Skript verfügbar:
Wenn Sie ein Python-Skript von Ihrem lokalen Computer auf Databricks mithilfe der DatabricksStep-Parameter |
EstimatorStep |
VERALTET. Erstellt einen Pipelineschritt, der Estimator für das Training eines Azure ML-Modells ausführt. Erstellen Sie einen Azure ML Pipeline-Schritt, um das Estimator for Machine Learning-Modelltraining auszuführen. VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run ML training in pipelines with CommandStep (Ausführen von ML-Trainings in Pipelines mit CommandStep). |
HyperDriveStep |
Erstellt einen Azure ML-Pipelineschritt zum Ausführen der Hyperparameteroptimierung für Trainings von Machine Learning-Modellen. Ein Beispiel für die Verwendung von HyperDriveStep finden Sie im Notebook https://aka.ms/pl-hyperdrive. Erstellen Sie einen Azure ML Pipeline-Schritt, um hyperparametertunning für das Machine Learning-Modelltraining auszuführen. |
HyperDriveStepRun |
Verwalten, Überprüfen des Status und Abrufen von Ausführungsdetails für einen HyperDriveStep-Pipelineschritt. HyperDriveStepRun bietet die Funktionalität von HyperDriveRun mit zusätzlicher Unterstützung von StepRun. Die HyperDriveStepRun-Klasse ermöglicht das Verwalten, Überprüfen des Status und Abrufen von Ausführungsdetails für die HyperDrive-Ausführung und jede der generierten untergeordneten Ausführungen. Mit der StepRun-Klasse können Sie dies tun, nachdem die übergeordnete Pipeline ausgeführt wurde und die Pipeline die Schrittläufe übermittelt hat. Initialisieren Sie hyperDriveStepRun. HyperDriveStepRun bietet die Funktionalität von HyperDriveRun mit zusätzlicher Unterstützung von StepRun. Mit der HyperDriveRun-Klasse können Sie die Ausführungsdetails für die HyperDrive-Ausführung und jede der generierten untergeordneten Ausführungen verwalten, überprüfen status und abrufen. Mit der StepRun-Klasse können Sie dies tun, nachdem die übergeordnete Pipeline ausgeführt wurde und die Pipeline die Schrittläufe übermittelt hat. |
KustoStep |
KustoStep ermöglicht die Ausführung von Kusto-Abfragen auf einem Kusto-Zielcluster in Azure ML Pipelines. Initialisieren Sie KustoStep. |
ModuleStep |
Erstellt einen Azure Machine Learning-Pipelineschritt zum Ausführen einer bestimmten Version eines Moduls. Module-Objekte definieren wiederverwendbare Berechnungen, z. B. Skripts oder ausführbare Dateien, die in verschiedenen Machine Learning-Szenarios und von verschiedenen Benutzer*innen verwendet werden können. Um eine bestimmte Version eines Moduls in einer Pipeline zu verwenden, erstellen Sie einen ModuleStep. Ein ModuleStep ist ein Schritt in der Pipeline, der eine vorhandene ModuleVersion verwendet. Ein Beispiel für die Verwendung von ModuleStep finden Sie im Notebook https://aka.ms/pl-modulestep. Erstellen Sie einen Azure ML-Pipelineschritt, um eine bestimmte Version eines Moduls auszuführen. |
MpiStep |
Erstellt einen Azure ML-Pipelineschritt zum Ausführen eines MPI-Auftrags. Ein Beispiel für die Verwendung von MpiStep finden Sie im Notebook https://aka.ms/pl-style-trans. Erstellen Sie einen Azure ML-Pipelineschritt, um einen MPI-Auftrag auszuführen. VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter Ausführen des verteilten Trainings in Pipelines mit CommandStep. |
ParallelRunConfig |
Definiert die Konfiguration für ein ParallelRunStep-Objekt. Ein Beispiel für die Verwendung von ParallelRunStep finden Sie im Notebook https://aka.ms/batch-inference-notebooks. Einen Leitfaden zur Problembehandlung finden Sie unter https://aka.ms/prstsg. Weitere Referenzen finden Sie hier. Initialisieren Sie das Config-Objekt. |
ParallelRunStep |
Erstellt einen Azure Machine Learning-Pipelineschritt, um große Datenmengen asynchron und parallel zu verarbeiten. Ein Beispiel für die Verwendung von „ParallelRunStep“ finden Sie im Notebook https://aka.ms/batch-inference-notebooks. Einen Leitfaden zur Problembehandlung finden Sie unter https://aka.ms/prstsg. Weitere Referenzen finden Sie hier. Erstellen Sie einen Azure ML-Pipelineschritt, um große Datenmengen asynchron und parallel zu verarbeiten. Ein Beispiel für die Verwendung von ParallelRunStep finden Sie im Notebooklink https://aka.ms/batch-inference-notebooks. |
PythonScriptStep |
Erstellt einen Azure ML-Pipelineschritt, in dem das Python-Skript ausgeführt wird. Ein Beispiel für die Verwendung von PythonScriptStep finden Sie im Notebook https://aka.ms/pl-get-started. Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Python-Skript ausgeführt wird. |
RScriptStep |
Hinweis Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen. Erstellt einen Azure ML-Pipelineschritt, in dem ein R-Skript ausgeführt wird. Erstellen Sie einen Azure ML-Pipelineschritt, der ein R-Skript ausführt. VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run R scripts in pipelines with CommandStep (Ausführen von R-Skripts in Pipelines mit CommandStep). |
SynapseSparkStep |
Hinweis Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen. Erstellt einen Azure ML Synapse-Schritt zum Übermitteln und Ausführen von Python-Skripts. Erstellen Sie einen Azure ML-Pipelineschritt, der einen Spark-Auftrag im synapse Spark-Pool ausführt. |