Ta med dina R-arbetsbelastningar

GÄLLER FÖR:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (aktuell)

Det finns ingen Azure Mašinsko učenje SDK för R. I stället använder du antingen CLI eller ett Python-kontrollskript för att köra dina R-skript.

Den här artikeln beskriver de viktigaste scenarierna för R som stöds i Azure Mašinsko učenje och kända begränsningar.

Typiskt R-arbetsflöde

Ett vanligt arbetsflöde för att använda R med Azure Mašinsko učenje:

  • Utveckla R-skript interaktivt med Hjälp av Jupyter Notebooks på en beräkningsinstans. (Du kan även lägga till Posit eller RStudio i en beräkningsinstans, men du kan för närvarande inte komma åt datatillgångar på arbetsytan från dessa program på beräkningsinstansen. Så för tillfället utförs interaktivt arbete bäst i en Jupyter-anteckningsbok.)

    • Läsa tabelldata från en registrerad datatillgång eller ett datalager
    • Installera ytterligare R-bibliotek
    • Spara artefakter i arbetsytans fillagring
  • Anpassa skriptet så att det körs som ett produktionsjobb i Azure Mašinsko učenje

    • Ta bort all kod som kan kräva användarinteraktion
    • Lägg till indataparametrar för kommandoraden i skriptet efter behov
    • Inkludera och hämta skriptet azureml_utils.R i samma arbetskatalog för R-skriptet som ska köras
    • Använd crate för att paketera modellen
    • Inkludera R/MLflow-funktionerna i skriptet för att logga artefakter, modeller, parametrar och/eller taggar till jobbet på MLflow
  • Skicka asynkrona R-fjärrjobb (du skickar jobb via CLI eller Python SDK, inte R)

    • Skapa en miljö
    • Loggjobbsartefakter, parametrar, taggar och modeller
  • Registrera din modell med Hjälp av Azure Mašinsko učenje Studio

  • Distribuera registrerade R-modeller till hanterade onlineslutpunkter

    • Använda de distribuerade slutpunkterna för slutsatsdragning/bedömning i realtid

Kända begränsningar

 

Begränsning Gör detta i stället
Det finns ingen R-kontrollplans-SDK. Använd Azure CLI- eller Python-kontrollskriptet för att skicka jobb.
RStudio som körs som ett anpassat program (till exempel Posit eller RStudio) i en container på beräkningsinstansen kan inte komma åt arbetsytetillgångar eller MLflow. Använd Jupyter Notebooks med R-kerneln på beräkningsinstansen.
Interaktiv frågekörning av arbetsytans MLflow-register från R stöds inte.
Kapslade MLflow-körningar i R stöds inte.
Parallella jobbsteg stöds inte. Kör ett skript parallellt n med olika indataparametrar. Men du måste metaprogram för att generera n YAML- eller CLI-anrop för att göra det.
Programmatisk modell som registrerar/registrerar från ett jobb som körs med R stöds inte.
Nollkodsdistribution (dvs. automatisk distribution) av en R MLflow-modell stöds för närvarande inte. Skapa en anpassad container med plumber för distribution.
Bedömning av en R-modell med batchslutpunkter stöds inte.
Azure Mašinsko učenje onlinedistribution yml kan bara använda avbildnings-URI:er direkt från registret för miljöspecifikationen, inte fördefinierade miljöer från samma Dockerfile. Följ stegen i Distribuera en registrerad R-modell till en onlineslutpunkt (realtid) för rätt sätt att distribuera.

Nästa steg

Läs mer om R i Azure Mašinsko učenje: