Datainsamling från modeller i produktion

GÄLLER FÖR:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (aktuell)

I den här artikeln lär du dig mer om datainsamling från modeller som distribueras till Azure Mašinsko učenje onlineslutpunkter.

Azure Mašinsko učenje Data collector tillhandahåller realtidsloggning av indata och utdata från modeller som distribueras till hanterade onlineslutpunkter eller Kubernetes onlineslutpunkter. Azure Mašinsko učenje lagrar loggade slutsatsdragningsdata i Azure Blob Storage. Dessa data kan sedan sömlöst användas för modellövervakning, felsökning eller granskning, vilket ger observerbarhet i prestanda för dina distribuerade modeller.

Datainsamlaren tillhandahåller:

  • Loggning av slutsatsdragningsdata till en central plats (Azure Blob Storage)
  • Stöd för hanterade onlineslutpunkter och Kubernetes-slutpunkter online
  • Definition på distributionsnivå, vilket tillåter maximala ändringar i konfigurationen
  • Stöd för både nyttolast och anpassad loggning

Loggningslägen

Datainsamlaren har två loggningslägen: nyttolastloggning och anpassad loggning. Med nyttolastloggning kan du samla in http-begärande- och svarsnyttolastdata från dina distribuerade modeller. Med anpassad loggning ger Azure Mašinsko učenje dig en Python SDK för loggning av Pandas DataFrames direkt från ditt bedömningsskript. Med hjälp av Python SDK för anpassad loggning kan du logga indata och utdata för modellen, förutom data före, under och efter alla datatransformeringar (eller förbearbetning).

Konfiguration av datainsamlare

Datainsamlaren kan konfigureras på distributionsnivå och konfigurationen anges vid distributionstillfället. Du kan konfigurera Azure Blob Storage-målet som tar emot insamlade data. Du kan också konfigurera samplingsfrekvensen (mellan 0 och 100 %) av data som ska samlas in.

Begränsningar

Datainsamlaren har följande begränsningar:

  • Datainsamlaren stöder endast loggning för Azure Mašinsko učenje-slutpunkter online (eller i realtid) (hanterade eller Kubernetes).
  • Datainsamlaren Python SDK stöder endast loggning av tabelldata via Pandas DataFrames.