Aggiornare Archiviazione BLOB di Azure con le funzionalità di Azure Data Lake Storage

Questo articolo illustra come abilitare uno spazio dei nomi gerarchico e sbloccare funzionalità come la sicurezza a livello di file e directory e operazioni più veloci. Queste funzionalità vengono ampiamente usate dai carichi di lavoro di analisi dei Big Data e, nel complesso, vengono denominate Azure Data Lake Storage.

Per altre informazioni su queste funzionalità e per la valutazione dell'impatto di questo aggiornamento su carichi di lavoro, applicazioni, costi, integrazioni di servizi, strumenti, funzionalità e documentazione, vedere Aggiornamento di Azure Blob Storage con le funzionalità di Azure Data Lake Storage.

Importante

gli aggiornamenti sono unidirezionali. Non è possibile ripristinare l'account dopo aver eseguito l'aggiornamento. È consigliabile convalidare l'aggiornamento in un ambiente non di produzione.

Preparare l'aggiornamento

Per preparare l'aggiornamento dell'account di archiviazione a Data Lake Storage:

Esaminare il supporto per le funzionalità

L'account di archiviazione potrebbe essere configurato per l'uso di funzionalità non ancora supportate negli account abilitati per Data Lake Storage. Se l'account usa tali funzionalità, l'aggiornamento non supererà la fase di convalida. Esaminare l'articolo Supporto per la funzionalità di Archiviazione BLOB negli account di Archiviazione di Azure per identificare le funzionalità non supportate. Se si usano tali funzionalità nell'account, disabilitarle prima di iniziare l'aggiornamento.

Le funzionalità seguenti sono supportate per gli account di Data Lake Storage, ma non dal processo di aggiornamento:

  • Snapshot BLOB
  • Ambiti di crittografia
  • Archiviazione non modificabile
  • Rilevamento dell'ora dell'ultimo accesso per la gestione del ciclo di vita
  • Eliminazione temporanea per i BLOB
  • Eliminazione temporanea per i contenitori

Se l'account di archiviazione dispone di tali funzionalità abilitate, è necessario disabilitarle prima di eseguire l'aggiornamento. Se si desidera riprendere a usare le funzionalità dopo il completamento dell'aggiornamento, riabilitarle.

In alcuni casi, prima di effettuare l'aggiornamento, è necessario prevedere un po’ di tempo per le operazioni di pulizia in seguito alla disabilitazione di una funzionalità. Ad esempio, nel caso della funzionalità di eliminazione temporanea del BLOB. È necessario disabilitare l'eliminazione temporanea del BLOB e quindi consentire la scadenza di tutti i BLOB eliminati in modo temporaneo prima di poter aggiornare l'account.

Importante

Non è possibile aggiornare un account di archiviazione in Data Lake Storage che abbia già abilitato la funzionalità del feed di modifiche. La semplice disabilitazione del feed di modifiche non consente di eseguire un aggiornamento. È invece necessario creare un account con la funzionalità dello spazio dei nomi gerarchico abilitata e trasferire i dati in tale account.

Rimuovere BLOB di pagine dall'account di archiviazione

Non è possibile aggiornare un account di archiviazione che contiene BLOB di pagine. Assicurarsi di rimuovere i BLOB di pagine dall'account di archiviazione prima di eseguire l'aggiornamento.

Verificare che i segmenti di ogni percorso BLOB siano denominati

Il processo di migrazione crea una directory per ogni segmento di percorso di un BLOB. Le directory di Data Lake Storage devono essere denominate, pertanto, affinché la migrazione vada a buon fine, ogni segmento di percorso in una directory virtuale deve avere un nome. Lo stesso requisito è valido per i segmenti che vengono denominati solo con un carattere di spazio. Se i segmenti di percorso non hanno un nome (// ) o vengono denominati solo con un carattere di spazio (_), prima di procedere con la migrazione è necessario copiare tali BLOB in un nuovo percorso che sia compatibile con questi requisiti di denominazione.

Impedire l'attività di scrittura nell'account di archiviazione

Se durante l’aggiornamento un'applicazione scrive nell'account di archiviazione, tale operazione potrebbe avere esito negativo. Per evitare tale attività di scrittura:

  1. Disattivare tutte le applicazioni o i servizi che potrebbero eseguire operazioni di scrittura.

  2. Rilasciare o interrompere i lease esistenti nei contenitori e nei BLOB dell'account di archiviazione.

Al termine dell'aggiornamento, interrompere i lease creati per riprendere consentendo l'accesso in scrittura ai contenitori e ai BLOB.

Avviso

L'interruzione di un lease attivo senza disabilitare correttamente le applicazioni o le macchine virtuali che stanno accedendo a tali risorse potrebbe comportare risultati imprevisti. Assicurarsi di disattivare tutte le attività di scrittura correnti prima di interrompere i lease in corso.

Eseguire l'aggiornamento.

  1. Accedere al portale di Azure per iniziare.

  2. Individuare l'account di archiviazione e visualizzare la sezione della panoramica dell'account.

  3. Selezionare Migrazione di Data Lake Gen2.

    Viene visualizzata la pagina di configurazione Eseguire l'aggiornamento a un Account di archiviazione con le funzionalità di Azure Data Lake Gen2.

    Pagina Configurazione

  4. Espandere la sezione Passaggio 1: Verificare le modifiche all'account prima dell'aggiornamento e fare clic su Verifica e accetta le modifiche.

  5. Nella pagina Verificare le modifiche dell'account, selezionare la casella di controllo e quindi fare clic suAccetta le modifiche.

  6. Espandere la sezione Passaggio 2: Convalidare l'account prima dell'aggiornamento e quindi fare clic su Avvia convalida.

    Se la convalida ha esito negativo, viene visualizzato un errore nella pagina. In alcuni casi, viene visualizzato il collegamento Visualizza errori. Se viene visualizzato tale collegamento, selezionarlo.

    Collegamento Visualizza errori

    Quindi, dal menu di scelta rapida del file error.json, selezionare Scarica.

    Pagina JSON di errore

    Aprire il file scaricato per determinare il motivo per cui l'account non ha superato il passaggio di convalida. Il codice JSON seguente indica che nell'account è abilitata una funzionalità incompatibile. In questo caso, si disabilita la funzionalità e quindi si avvia di nuovo il processo di convalida.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Dopo aver convalidato l’account, espandere la sezione Passaggio 3: Aggiornare l'account, quindi fare clic su Avvia aggiornamento.

    Importante

    Le operazioni di scrittura vengono disabilitate durante l'aggiornamento dell'account. Le operazioni di lettura non vengono disabilitate, ma è consigliabile sospenderle perché potrebbero destabilizzare il processo di aggiornamento.

    Al termine della migrazione, viene visualizzato un messaggio simile al seguente.

    Pagina di migrazione completata

Arrestare l'aggiornamento

È possibile arrestare la migrazione prima del completamento.

Per arrestare l'aggiornamento prima del completamento, selezionare Annulla aggiornamento mentre tale processo è in corso.

Annulla aggiornamento

Eseguire la migrazione di dati, carichi di lavoro e applicazioni

  1. Configurare i servizi nei carichi di lavoro in modo che siano indirizzati all'endpoint del servizio BLOB o a quello di Data Lake Storage.

    Endpoint dell’account

  2. Assicurarsi di modificare i carichi di lavoro Hadoop che usano i driver BLOB del servizio di archiviazione di Azure di Windows o WASB per usare il driver Azure Blob File System (ABFS). A differenza del driver WASB che effettua richieste all'endpoint del servizio BLOB, il driver ABFS effettuerà richieste all'endpoint di Data Lake Storage dell'account.

  3. Testare le applicazioni personalizzate per assicurarsi che funzionino come previsto con l'account aggiornato.

    L'accesso multi-protocollo in Data Lake Storage consente alla maggior parte delle applicazioni di continuare a usare le API BLOB senza modifiche. Se si riscontrano problemi o si vogliono usare le API per lavorare con operazioni di directory ed elenchi di controllo di accesso, è possibile spostare parte del codice per usare le API di Data Lake Storage. Vedere le guide per .NET, Java, Python, Node.js e REST.

  4. Testare gli script personalizzati per assicurarsi che funzionino come previsto con l'account aggiornato.

    Come nel caso delle API BLOB, è probabile che molti degli script funzionino senza che sia necessario modificarli. Tuttavia, se necessario, è possibile aggiornare i file di script per usare i cmdlet di PowerShell di Data Lake Storage e i comandi dell'interfaccia della riga di comando di Azure.

Vedi anche

Introduzione all’archiviazione di Azure Data Lake