Come creare un progetto di classificazione personalizzata del testo

Questo articolo descrive come configurare i requisiti per iniziare con classificazione personalizzata del testo e creare un progetto.

Prerequisiti

Prima di iniziare a usare la classificazione personalizzata del testo, è necessario:

Creare una risorsa del servizio Lingua

Prima di iniziare a utilizzare la classificazione personalizzata del testo, è necessaria una risorsa di Lingua di Azure AI. È preferibile creare una risorsa Lingua e connettervi un account di archiviazione nel portale di Azure. La creazione di una risorsa nel portale di Azure consente di creare contemporaneamente un account di archiviazione di Azure con tutte le autorizzazioni necessarie preconfigurate. È anche possibile leggere altre informazioni nell'articolo per apprendere come usare una risorsa preesistente e configurarla per l'uso con la classificazione personalizzata del testo.

Sarà necessario anche un account di archiviazione di Azure in cui verranno caricati i documenti .txt che verranno usati per il training di un modello per classificare il testo.

Nota

  • Per creare una risorsa linguistica, è necessario avere un ruolo di proprietario assegnato nel gruppo di risorse.
  • Se si connetterà un account di archiviazione preesistente, è necessario assegnarvi un ruolo di proprietario.

Creare una risorsa Lingua e connettere un account di archiviazione

Nota

Non è consigliabile spostare l'account di archiviazione in un gruppo di risorse o una sottoscrizione diversa dopo che è collegato alla risorsa Lingua.

Creare una nuova risorsa dal portale di Azure

  1. Accedere al portale di Azure per creare una nuova risorsa di Lingua di Azure AI.

  2. Nella finestra visualizzata, selezionare Classificazione personalizzata del testo e Riconoscimento entità denominata personalizzata dalle funzionalità personalizzate. Selezionare Continua per creare la risorsa nella parte inferiore dello schermo.

    Screenshot che mostra l'opzione di selezione per Classificazione personalizzata del testo e Riconoscimento entità denominata personalizzata nel portale di Azure.

  3. Creare una risorsa linguistica con i dettagli seguenti.

    Nome Valore obbligatorio
    Abbonamento La sottoscrizione di Azure.
    Gruppo di risorse Un gruppo di risorse di Azure che conterrà la risorsa. È possibile usarne uno esistente o crearne uno nuovo.
    Area Una delle aree supportate. Ad esempio: “Stati Uniti occidentali 2”.
    Nome Un nome per la risorsa.
    Piano tariffario Uno dei piani tariffari supportati. Per provare il servizio, è possibile usare il livello gratuito (F0).

    Se viene visualizzato un messaggio che indica che “l'account di accesso non è un proprietario del gruppo di risorse dell'account di archiviazione selezionato”, è necessario assegnare all'account un ruolo di proprietario nel gruppo di risorse per poter creare una risorsa linguistica. Per assistenza contattare il proprietario della sottoscrizione di Azure.

    È possibile determinare il proprietario della sottoscrizione di Azure eseguendo una ricerca nel gruppo di risorse e seguendo il collegamento alla sottoscrizione associata. Quindi:

    1. Selezionare la scheda Controllo di accesso (IAM)
    2. Selezionare Assegnazioni di ruolo
    3. Filtrare in base a Ruolo:Proprietario.
  4. Nella sezione Classificazione personalizzata del testo e Riconoscimento entità denominata personalizzata, selezionare un account di archiviazione esistente o scegliere Nuovo account di archiviazione. Questi valori consentono di iniziare senza usare necessariamente i valori dell'account di archiviazione che verranno usati in ambienti di produzione. Per evitare la latenza durante la creazione del progetto, connettersi agli account di archiviazione nella stessa area della risorsa linguistica.

    Valore dell'account di archiviazione Valore consigliato
    Nome account di archiviazione Qualsiasi nome
    Storage account type LRS Standard
  5. Accertarsi che sia selezionata l’opzione Avviso intelligenza artificiale responsabile. Selezionare Rivedi e crea nella parte inferiore della pagina.

Nota

  • Il processo di connessione di un account di archiviazione alla risorsa Lingua è irreversibile e non è possibile la disconnessione in un secondo momento.
  • È possibile connettere la risorsa Lingua a un solo account di archiviazione.

Uso di una risorsa Lingua preesistente

Requisito Descrizione
Aree Accertarsi che il provisioning della risorsa esistente sia eseguito in una delle aree supportate. Se non si dispone di una risorsa, sarà necessario crearne una nuova in un'area supportata.
Piano tariffario Il piano tariffario per la risorsa.
Identità gestita Accertarsi che l'impostazione dell'identità gestita della risorsa sia abilitata. In caso contrario, leggere la sezione successiva.

Per usare la classificazione personalizzata del testo, è necessario creare un account di archiviazione di Azure se ancora non ne esiste uno.

Abilitare la gestione dell’identità per la risorsa

La risorsa Lingua deve avere la gestione delle identità per abilitarla usando il portale di Azure:

  1. Accedere alla risorsa Lingua
  2. Nel menu a sinistra, nella sezione Gestione risorse, selezionare Identità
  3. Nella scheda Assegnata dal sistema, accertarsi che lo Stato sia impostato su Attivo

Abilitare la funzionalità di classificazione personalizzata del testo

Abilitare la funzione Classificazione personalizzata del testo / Riconoscimento di entità denominate personalizzato dal portale di Azure.

  1. Accedere alla risorsa Lingua nel portale di Azure
  2. Nel menu a sinistra, nella sezione Gestione risorse, selezionare Funzionalità
  3. Abilitare la funzione Classificazione personalizzata del testo / Riconoscimento di entità denominate personalizzato
  4. Collegare un account di archiviazione
  5. Selezionare Applica.

Importante

  • Accertarsi che alla risorsa Lingua sia stato assegnato il ruolo di collaboratore ai dati dei BLOB di archiviazione nell'account di archiviazione che viene collegato.

Impostare ruoli per la risorsa di Lingua di Azure AI e l'account di archiviazione

Usare la procedura seguente per impostare i ruoli richiesti per la risorsa Lingua e l'account di archiviazione.

Immagine animata che mostra come impostare i ruoli nel portale di Azure.

Ruoli per la risorsa Lingua di Azure AI

  1. Accedere all’account di archiviazione o alla risorsa Lingua nel portale di Azure.

  2. Selezionare Controllo di accesso (IAM) nel menu di spostamento a sinistra.

  3. Selezionare Aggiungi per aggiungere assegnazioni di ruolo e scegliere il ruolo appropriato per l'account.

    È necessario disporre del ruolo di proprietario o collaboratore sulla risorsa Lingua.

  4. In Assegna accesso a, selezionare Utente, gruppo o entità servizio

  5. Scegliere Seleziona membri

  6. Selezionare il proprio nome utente. È possibile cercare nomi utente nel campo Seleziona. Ripetere questa operazione per tutti i ruoli.

  7. Ripetere questa procedura per tutti gli account utente che devono accedere a questa risorsa.

Ruoli per l’account di archiviazione

  1. Accedere alla pagina dell’account di archiviazione nel portale di Azure.
  2. Selezionare Controllo di accesso (IAM) nel menu di spostamento a sinistra.
  3. Selezionare Aggiungi per aggiungere assegnazioni di ruolo e scegliere il ruolo di collaboratore ai dati del BLOB di archiviazione nell'account di archiviazione.
  4. In Assegna accesso a, selezionare Identità gestita.
  5. Scegliere Seleziona membri
  6. Selezionare la propria sottoscrizione e la Lingua come identità gestita. È possibile cercare nomi utente nel campo Seleziona.

Importante

Se si dispone di una rete virtuale o di un endpoint privato, selezionare Consenti ai servizi di Azure nell'elenco dei servizi attendibili di accedere a questo account di archiviazione nel portale di Azure.

Abilitare CORS per l'account di archiviazione

Consentire i metodi (GET, PUT, DELETE) quando si abilita la condivisione di risorse tra origini (CORS). Impostare il campo delle origini consentite su https://language.cognitive.azure.com. Consentire tutte le intestazioni aggiungendo * ai valori di intestazione consentiti e impostare la validità massima su 500.

Screenshot che mostra come usare CORS per gli account di archiviazione.

Creare un progetto di classificazione personalizzata del testo

Dopo aver configurato la risorsa e il contenitore di archiviazione, creare un nuovo progetto di classificazione personalizzata del testo. Un progetto è un'area di lavoro per la generazione di modelli di Machine Learning personalizzati in base ai propri dati. Il progetto è accessibile solo all'utente e ad altri utenti che hanno accesso alla risorsa di Azure in uso. Se sono stati etichettati dati, è possibile importarli per iniziare.

  1. Accedere a Language Studio. Verrà visualizzata una finestra che consente di selezionare la sottoscrizione e la risorsa linguistica. Selezionare la risorsa linguistica.

  2. Nella sezione Classifica testo di Language Studio, selezionare Classificazione personalizzata del testo.

    Screenshot che mostra la posizione di Classificazione personalizzata del testo nella pagina di destinazione di Language Studio.

  3. Selezionare Crea nuovo progetto dal menu in alto nella pagina dei progetti. La creazione di un progetto consentirà di etichettare i dati, eseguire il training, valutare, migliorare e distribuire i modelli.

    Screenshot della pagina di creazione del progetto di Classificazione personalizzata del testo.

  4. Dopo aver fatto clic su Crea nuovo progetto, verrà visualizzata una finestra che consente di connettere il proprio account di archiviazione. Se è già stato connesso un account di archiviazione, verrà visualizzato l'account di archiviazione connesso. In caso contrario, scegliere l'account di archiviazione dall'elenco a discesa visualizzato e selezionare Connetti account di archiviazione. Verranno impostati i ruoli necessari per l'account di archiviazione. Questo passaggio potrebbe restituire un errore se all’utente non è assegnato il ruolo di proprietario nell'account di archiviazione.

    Nota

    • Questo passaggio deve essere eseguito una sola volta per ogni nuova risorsa linguistica usata.
    • Questo processo è irreversibile, per cui se si connette un account di archiviazione a una risorsa linguistica, non sarà possibile disconnetterlo in un secondo momento.
    • È possibile connettere una risorsa linguistica a un solo account di archiviazione.

    Screenshot della schermata di connessione di archiviazione per i progetti di classificazione personalizzati.

  5. Selezionare il tipo di progetto. È possibile creare un progetto di classificazione multietichetta in cui ogni documento può appartenere a una o più classi o a un progetto di classificazione con etichetta singola in cui ogni documento può appartenere a una sola classe. Il tipo selezionato non potrà essere modificato successivamente. Altre informazioni sui tipi di progetto

    Screenshot dei tipi di progetto di classificazione personalizzati disponibili.

  6. Immettere le informazioni sul progetto, inclusi un nome, una descrizione e la lingua dei documenti nel progetto. Se si usa il set di dati di esempio, selezionare Inglese. Non sarà possibile modificare il nome del progetto in un secondo momento. Selezionare Avanti.

    Suggerimento

    Il set di dati non deve essere tutto nella stessa lingua. È possibile avere più documenti, ognuno con diverse lingue supportate. Se il set di dati contiene documenti in lingue diverse o se si prevede testo in lingue diverse durante il runtime, selezionare l’opzione Abilita set di dati multilingue quando si immettono le informazioni di base per il progetto. Questa opzione può essere abilitata in un secondo momento dalla pagina Impostazioni progetto.

  7. Selezionare il contenitore in cui è stato caricato il set di dati.

    Nota

    Se i dati sono già stati etichettati, accertarsi che rispettino il formato supportato e selezionare Sì, i documenti sono già etichettati e il file di etichette JSON è formattato, quindi selezionare il file di etichette dal menu a discesa seguente.

    Se si usa uno dei set di dati di esempio, usare il file JSON webOfScience_labelsFile o movieLabels incluso. Quindi seleziona Avanti.

  8. Esaminare i dati immessi e selezionare Crea progetto.

Importare un progetto di classificazione personalizzata del testo

Se i dati sono già etichettati, è possibile usarli per iniziare a usare il servizio. Accertarsi che i dati etichettati seguano i formati di dati accettati.

  1. Accedere a Language Studio. Verrà visualizzata una finestra che consente di selezionare la sottoscrizione e la risorsa linguistica. Selezionare la risorsa linguistica.

  2. Nella sezione Classifica testo di Language Studio, selezionare Classificazione personalizzata del testo.

    Screenshot che mostra la posizione di Classificazione personalizzata del testo nella pagina di destinazione di Language Studio.

  3. Selezionare Crea nuovo progetto dal menu in alto nella pagina dei progetti. La creazione di un progetto consentirà di etichettare i dati, eseguire il training, valutare, migliorare e distribuire i modelli.

    Screenshot della pagina di creazione del progetto.

  4. Dopo aver fatto clic su Crea nuovo progetto, verrà visualizzata una schermata per consentire la connessione dell'account di archiviazione. Se non si riesce a trovare l'account di archiviazione, creare una risorsa usando la procedura consigliata. Se è già stato connesso un account di archiviazione alla risorsa Lingua, verrà visualizzato l'account di archiviazione connesso.

    Nota

    • Questo passaggio deve essere eseguito una sola volta per ogni nuova risorsa linguistica usata.
    • Questo processo è irreversibile, per cui se si connette un account di archiviazione a una risorsa linguistica, non sarà possibile disconnetterlo in un secondo momento.
    • È possibile connettere una risorsa linguistica a un solo account di archiviazione.

    Screenshot della schermata di connessione di archiviazione per i progetti di classificazione personalizzati.

  5. Selezionare il tipo di progetto. È possibile creare un progetto di classificazione multietichetta in cui ogni documento può appartenere a una o più classi o a un progetto di classificazione con etichetta singola in cui ogni documento può appartenere a una sola classe. Il tipo selezionato non potrà essere modificato successivamente.

    Screenshot dei tipi di progetto di classificazione personalizzati disponibili.

  6. Immettere le informazioni sul progetto, inclusi un nome, una descrizione e la lingua dei documenti nel progetto. Non sarà possibile modificare il nome del progetto in un secondo momento. Selezionare Avanti.

    Suggerimento

    Il set di dati non deve essere tutto nella stessa lingua. È possibile avere più documenti, ognuno con diverse lingue supportate. Se il set di dati contiene documenti in lingue diverse o se si prevede testo in lingue diverse durante il runtime, selezionare l’opzione Abilita set di dati multilingue quando si immettono le informazioni di base per il progetto. Questa opzione può essere abilitata in un secondo momento dalla pagina Impostazioni progetto.

  7. Selezionare il contenitore in cui è stato caricato il set di dati.

  8. Selezionare Sì, i documenti sono già etichettati e il file di etichette JSON è formattato e selezionare il file di etichette dal menu a discesa seguente per importare il file di etichette JSON. Accertarsi che segua il formato supportato.

  9. Selezionare Avanti.

  10. Esaminare i dati immessi e selezionare Crea progetto.

Ottenere i dettagli del progetto

  1. Accedere alla pagina delle impostazioni del progetto in Language Studio.

  2. È possibile visualizzare i dettagli del progetto.

  3. In questa pagina è possibile aggiornare la descrizione del progetto e abilitare/disabilitare il set di dati multilingue nelle impostazioni del progetto.

  4. È anche possibile visualizzare il contenitore e l'account di archiviazione connessi alla risorsa Lingua.

  5. In questa pagina è anche possibile recuperare la chiave primaria della risorsa.

    Screenshot della pagina delle impostazioni del progetto.

Eliminare un progetto

Quando il progetto non è più necessario, è possibile eliminarlo usando Language Studio. Selezionare Classificazione personalizzata del testo nella parte superiore della schermata e quindi selezionare il progetto da eliminare. Per eliminare il progetto, selezionare Elimina dal menu in alto.

Passaggi successivi

  • È necessario avere un'idea dello schema del progetto che verrà usato per l’etichettatura dei dati.

  • Dopo aver creato il progetto, è possibile iniziare l'etichettatura dei dati che indicherà al modello di classificazione del testo come interpretare il testo e usarlo per il training e la valutazione.