Använda Azure Mašinsko učenje-etikettering i Language Studio

Etikettering av data är en viktig del i att förbereda datamängden. Med hjälp av etiketteringsupplevelsen i Azure Mašinsko učenje kan du få enklare samarbete, mer flexibilitet och möjlighet att outsourca etiketteringsuppgifter till externa etiketteringsleverantörer från Azure Market Place. Du kan använda Azure Mašinsko učenje-etikettering för:

Förutsättningar

Innan du kan ansluta ditt etikettprojekt till Azure Mašinsko učenje behöver du:

  • Ett Language Studio-projekt som har skapats med ett konfigurerat Azure Blob Storage-konto.
  • Textdata som har laddats upp till ditt lagringskonto.
  • Åtminstone:
    • En entitetsetikett för anpassad namngiven entitetsigenkänning, eller
    • Två klassetiketter för anpassade textklassificeringsprojekt.
  • En Azure Mašinsko učenje-arbetsyta som har anslutits till samma Azure Blob Storage-konto som ditt Language Studio-konto använder.

Begränsningar

  • Att ansluta ditt etikettprojekt till Azure Mašinsko učenje är en en-till-en-anslutning. Om du kopplar från projektet kan du inte ansluta projektet tillbaka till samma Azure-Mašinsko učenje projekt
  • Du kan inte märka i Language Studio och Azure Mašinsko učenje samtidigt. Etikettupplevelsen är aktiverad i en studio i taget.
  • Test- och träningsfilerna i etiketteringsmiljön som du byter bort från ignoreras när du tränar din modell.
  • Endast Azure Mašinsko učenje JSONL-filformat kan importeras till Language Studio.
  • Projekt med flerspråkigt alternativ aktiverat kan inte anslutas till Azure Mašinsko učenje och inte alla språk stöds.
    • Språkstöd tillhandahålls av klassen Azure Mašinsko učenje TextDNNLanguages.
  • Den Azure-Mašinsko učenje arbetsyta som du ansluter till måste tilldelas till samma Azure Storage-konto som Language Studio är anslutet till. Se till att Azure Mašinsko učenje-arbetsytan har behörigheten storage blob data reader på lagringskontot. Arbetsytan måste ha länkats till lagringskontot under skapandeprocessen i Azure-portalen.
  • Att växla mellan de två etiketteringsfunktionerna är inte omedelbart. Det kan ta tid att slutföra åtgärden.

Importera dina Azure Mašinsko učenje-etiketter till Language Studio

Language Studio stöder JSONL-filformatet som används av Azure Mašinsko učenje. Om du har etiketterat data på Azure Mašinsko učenje kan du importera dina uppdaterade etiketter i ett nytt anpassat projekt för att använda funktionerna i båda studiorna.

  1. Börja med att skapa ett nytt projekt för anpassad textklassificering eller anpassad namngiven entitetsigenkänning.

    1. På skärmen Skapa ett projekt som visas följer du anvisningarna för att ansluta ditt lagringskonto och anger grundläggande information om projektet. Se till att Den Azure-resurs som du använder inte har något annat lagringskonto redan anslutet.

    2. I avsnittet Välj container väljer du alternativet som anger att du redan har en korrekt formaterad fil. Välj sedan din senaste Azure Mašinsko učenje-etikettfil.

      En skärmbild som visar valet för en etikettfil i Language Studio.

Ansluta till Azure Mašinsko učenje

Innan du ansluter till Azure Mašinsko učenje behöver du ett Azure Mašinsko učenje-konto med en prisplan som kan tillgodose projektets beräkningsbehov. Se avsnittet förutsättningar för att se till att du har slutfört alla krav för att börja ansluta Ditt Language Studio-projekt till Azure Mašinsko učenje.

  1. Använd Azure-portalen för att navigera till Azure Blob Storage-kontot som är anslutet till din språkresurs.

  2. Kontrollera att rollen Storage Blob Data Contributor har tilldelats till din AML-arbetsyta i rolltilldelningarna för ditt Azure Blob Storage-konto.

  3. Gå till projektet i Language Studio. På den vänstra navigeringsmenyn i projektet väljer du Dataetiketter.

  4. Välj Använd Azure Mašinsko učenje för att märka i beskrivningen av dataetiketter eller under fönstret Aktivitet.

    En skärmbild som visar platsen för länken för Azure Mašinsko učenje.

  5. Välj Anslut till Azure Mašinsko učenje för att starta anslutningsprocessen.

    En skärmbild som visar knappen Azure Mašinsko učenje-anslutning i Language Studio.

  6. I fönstret som visas följer du anvisningarna. Välj den Azure-Mašinsko učenje arbetsyta som du skapade tidigare under samma Azure-prenumeration. Ange ett namn för det nya Azure Mašinsko učenje-projektet som ska skapas för att aktivera etikettering i Azure Mašinsko učenje.

    Dricks

    Kontrollera att arbetsytan är länkad till samma Azure Blob Storage-konto och språkresurs innan du fortsätter. Du kan skapa en ny arbetsyta och länka till ditt lagringskonto med hjälp av Azure-portalen. Kontrollera att lagringskontot är korrekt länkat till arbetsytan.

  7. (Valfritt) Aktivera växlingsknappen för leverantörsetiketter för att använda etiketteringsleverantörsföretag. Innan du väljer leverantörsetikettföretag kontaktar du leverantörens etiketteringsföretag på Azure Marketplace för att slutföra ett kontrakt med dem. Mer information om hur du arbetar med leverantörsföretag finns i Så här outsourcar du dataetiketter.

    Du kan också lämna etiketteringsinstruktioner för de mänskliga etiketterna som hjälper dig i märkningsprocessen. De här anvisningarna kan hjälpa dem att förstå uppgiften genom att lämna tydliga definitioner av etiketterna och inkludera exempel för bättre resultat.

  8. Granska inställningarna för din anslutning till Azure Mašinsko učenje och gör ändringar om det behövs.

    Viktigt!

    Slutförande av anslutningen är permanent. Om du försöker koppla från den upprättade anslutningen när som helst inaktiveras ditt Language Studio-projekt permanent från att ansluta till samma Azure-Mašinsko učenje projekt.

  9. När anslutningen har initierats inaktiveras din möjlighet att märka data i Language Studio i några minuter för att förbereda den nya anslutningen.

Växla till etikettering med Azure Mašinsko učenje från Language Studio

När anslutningen har upprättats kan du växla till Azure Mašinsko učenje via fönstret Aktivitet i Language Studio när som helst.

En skärmbild som visar knappen för att växla till etikettering med hjälp av Azure Mašinsko učenje.

När du växlar inaktiveras din möjlighet att märka data i Language Studio och du kommer att kunna märka data i Azure Mašinsko učenje. Du kan växla tillbaka till etikettering i Language Studio när som helst via Azure Mašinsko učenje.

Information om hur du etiketterar texten finns i Azure Mašinsko učenje hur du etiketterar. Information om hur du hanterar och spårar textetikettprojektet finns i Azure Mašinsko učenje konfigurera och hantera ett textetikettprojekt.

Träna din modell med hjälp av etiketter från Azure Mašinsko učenje

När du byter till etikettering med Hjälp av Azure Mašinsko učenje kan du fortfarande träna, utvärdera och distribuera din modell i Language Studio. Så här tränar du din modell med uppdaterade etiketter från Azure Mašinsko učenje:

  1. Välj Träningsjobb på navigeringsmenyn till vänster på skärmen Språkstudio för projektet.

  2. Välj Importera de senaste etiketterna från Azure Mašinsko učenje i avsnittet Välj etikettursprung på träningssidan. Detta synkroniserar etiketterna från Azure Mašinsko učenje innan du startar träningsjobbet.

    En skärmbild som visar väljaren för att använda etiketter från Azure Mašinsko učenje.

Växla till etikettering med Language Studio från Azure Mašinsko učenje

När du har bytt till etikettering med Azure Mašinsko učenje kan du växla tillbaka till etikettering med Language Studio-projektet när som helst.

Kommentar

  • Endast användare med rätt roller i Azure Mašinsko učenje har möjlighet att byta etikett.
  • När du växlar till att använda Language Studio inaktiveras etikettering på Azure Machine Learning.

Så här växlar du tillbaka till etikettering med Language Studio:

  1. Gå till projektet i Azure Mašinsko učenje och välj Dataetiketter på den vänstra navigeringsmenyn.

  2. Välj fliken Language Studio och välj Växla till Language Studio.

    En skärmbild som visar väljaren för att använda etiketter från Language Studio.

  3. Processen tar några minuter att slutföra och din möjlighet att märka i Azure Mašinsko učenje inaktiveras tills den växlas tillbaka från Language Studio.

Koppla från Azure Mašinsko učenje

Att koppla från ditt projekt från Azure Mašinsko učenje är en permanent, oåterkallelig process och kan inte ångras. Du kommer inte längre att kunna komma åt dina etiketter i Azure Mašinsko učenje och du kommer inte att kunna återansluta Azure Mašinsko učenje-projektet till något Language Studio-projekt i framtiden. Så här kopplar du från Azure Mašinsko učenje:

  1. Se till att alla uppdaterade etiketter som du vill underhålla synkroniseras med Azure Mašinsko učenje genom att växla tillbaka etikettupplevelsen till Language Studio.
  2. Välj Projektinställningar på navigeringsmenyn till vänster i Language Studio.
  3. Välj knappen Koppla från Azure Mašinsko učenje i avsnittet Hantera Azure Mašinsko učenje-anslutningar.

Nästa steg

Läs mer om att märka dina data för anpassad textklassificering och anpassad namngiven entitetsigenkänning.