Collegare e gestire un pool di Spark Synapse in Azure Machine Learning

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Questo articolo descrive come collegare un pool di Synapse Spark in Azure Machine Learning. È possibile collegare un pool di Synapse Spark in Azure Machine Learning in uno dei modi seguenti:

  • Uso dell'interfaccia utente di Studio di Azure Machine Learning
  • Uso dell'interfaccia della riga di comando di Azure Machine Learning
  • Uso di Python SDK per Azure Machine Learning

Prerequisiti

Collegare un pool di Synapse Spark in Azure Machine Learning

Azure Machine Learning offre differenti modi per collegare e gestire un pool di Synapse Spark.

Per collegare un pool di Synapse Spark con la scheda Calcolo di Studio:

Screenshot che mostra la creazione di un nuovo pool di Spark Synapse.

  1. Nella sezione Gestisci del riquadro sinistro selezionare Calcolo.
  2. Selezionare Calcoli collegato.
  3. Nella schermata Calcoli collegati selezionare Nuovo per visualizzare le opzioni per collegare diversi tipi di calcolo.
  4. Selezionare Pool di Synapse Spark.

Il pannello Collega pool di Synapse Spark viene aperto sul lato destro dello schermo. In questo pannello:

  1. Immettere un nome che si riferisce al pool di Synapse SparK collegato all'interno della risorsa Azure Machine Learning.

  2. Selezionare una sottoscrizione di Azure nel menu a discesa.

  3. Selezionare un'area di lavoro Synapse nel menu a discesa.

  4. Selezionare un pool di Spark nel menu a discesa.

  5. Attivare o disattivare l'opzione Assegna un'identità gestita per abilitarla.

  6. Selezionare un tipo di identità gestita da usare con questo pool di Synapse Spark collegato.

  7. Selezionare Aggiornaper completare il processo di collegamento del pool di Synapse Spark.

Aggiungere assegnazioni di ruolo in Azure Synapse Analytics

Per assicurarsi che il pool di Synapse Spark collegato funzioni correttamente, assegnargli il ruolo di amministratore dall'interfaccia utente di Studio di Azure Synapse Analytics. Questi passaggi illustrano come eseguire questa operazione:

  1. Aprire l'area di lavoro di Synapse nel portale di Azure.

  2. Nel riquadro sinistro selezionare Panoramica.

    Screenshot che mostra Open Synapse Studio.

  3. Selezionare Aprire Synapse Studio.

  4. In studio di Azure Synapse Analytics selezionare Gestisci nel riquadro sulla sinistra.

  5. Selezionare Controllo di accesso nella sezione Sicurezza del riquadro a sinistra, il secondo a partire da sinistra.

  6. Selezionare Aggiungi.

  7. Il pannello Aggiungi assegnazione di ruolo verrà aperto sul lato destro della schermata. In questo pannello:

    1. Selezionare Elemento dell'area di lavoro per Ambito.

    2. Nel menu a discesa Tipo di elemento selezionare Pool di Apache Spark.

    3. Nel menu a discesa Elemento selezionare il pool di Apache Spark.

    4. Nel menu a discesa Ruolo selezionare Amministratore di Synapse.

    5. Nella casella di ricerca Seleziona utente iniziare a digitare il nome dell'area di lavoro di Azure Machine Learning. Viene visualizzato un elenco di pool di Synapse Spark collegati. Selezionare il pool di Synapse Spark desiderato nell'elenco.

    6. Selezionare Applica.

      Screenshot che mostra Aggiungi assegnazione di ruolo.

Aggiornare il pool di Synapse Spark

È possibile gestire il pool di Synapse Spark collegato dall'interfaccia utente di studio di Azure Machine Learning. La funzionalità di gestione del pool di Spark include gli aggiornamenti delle identità gestite associate per un pool di Synapse Spark collegato. Durante l'aggiornamento di un pool di Synapse Spark è possibile assegnare un'identità assegnata dal sistema o dall'utente. È necessario creare un'identità gestita assegnata dall'utente nel portale di Azure, prima di assegnarla a un pool di Synapse Spark.

Per aggiornare l'identità gestita per il pool di Synapse Spark collegato:

Screenshot che mostra l'aggiornamento dell'identità gestita del pool di Spark Synapse.

  1. Aprire la pagina Dettagli per il pool di Synapse Spark inStudio di Azure Machine Learning.

  2. Trovare l'icona di modifica, posta sul lato destro della sezione Identità gestita.

  3. Per assegnare un'identità gestita per la prima volta, impostare Assegna un'identità gestita per abilitarla.

  4. Per assegnare un'identità gestita assegnata dal sistema:

    1. Selezionare Assegnata dal sistema come tipo di identità.
    2. Selezionare Aggiorna.
  5. Per assegnare un'identità gestita assegnata dall'utente:

    1. Selezionare Assegnata dall'utente come tipo di identità.
    2. Selezionare una sottoscrizione di Azure nel menu a discesa.
    3. Digitare le prime lettere del nome dell'identità gestita assegnata dall'utente nella casella che mostra il testo Cerca per nome. Viene visualizzato un elenco con nomi di identità gestite assegnate dall'utente corrispondenti. Selezionare l'identità gestita assegnata dall'utente desiderata nell'elenco. È possibile selezionare diverse identità gestite assegnate dall'utente e assegnarle al pool di Synapse Spark collegato.
    4. Selezionare Aggiorna.

Scollegare il pool di Synapse Spark

Per cancellare un'area di lavoro potrebbe essere necessario scollegare un pool di Synapse Spark collegato.


L'interfaccia utente di Studio di Azure Machine Learning consente anche di scollegare un pool di Synapse Spark collegato. A tale scopo, effettuare i passaggi seguenti:

  1. Aprire la pagina Dettagli per il pool di Synapse Spark in Studio di Azure Machine Learning.

  2. Selezionare Scollegaper scollegare il pool di Synapse Spark collegato.

Calcolo Spark serverless in Azure Machine Learning

Alcuni scenari utente possono richiedere l'accesso a una risorsa calcolo Spark serverless durante un invio di processo di Azure Machine Learning, senza bisogno di collegare un pool di Spark. Inoltre, l'integrazione di Azure Synapse Analytics con Azure Machine Learning offre un'esperienza di calcolo Spark serverless. In questo modo è possibile accedere a un ambiente di calcolo Spark in un processo, senza bisogno di collegare prima il calcolo a un'area di lavoro. Altre informazioni sull'esperienza di calcolo Spark serverless.

Passaggi successivi