Referens för algoritm och komponent för Azure Mašinsko učenje designer

GÄLLER FÖR: Python SDK azure-ai-ml v2 (aktuell)

Kommentar

Designer stöder två typer av komponenter, klassiska fördefinierade komponenter och anpassade komponenter. Dessa två typer av komponenter är inte kompatibla.

Klassiska fördefinierade komponenter tillhandahåller fördefinierade komponenter som främst används för databearbetning och traditionella maskininlärningsuppgifter som regression och klassificering. Den här typen av komponent stöds fortfarande, men inga nya komponenter läggs till.

Med anpassade komponenter kan du ange din egen kod som en komponent. Det finns stöd för delning mellan arbetsytor och sömlös redigering i Studio-, CLI- och SDK-gränssnitt.

Den här artikeln gäller för klassiska fördefinierade komponenter.

Det här referensinnehållet innehåller den tekniska bakgrunden för var och en av de klassiska fördefinierade komponenterna som är tillgängliga i Azure Mašinsko učenje designer.

Varje komponent representerar en uppsättning kod som kan köras separat och utföra en maskininlärningsuppgift, med de indata som krävs. En komponent kan innehålla en viss algoritm eller utföra en uppgift som är viktig inom maskininlärning, till exempel saknade värdeersättning eller statistisk analys.

Hjälp med att välja algoritmer finns i

Dricks

I valfri pipeline i designern kan du få information om en specifik komponent. Välj länken Läs mer på komponentkortet när du hovrar på komponenten i komponentlistan eller i komponentens högra fönster.

Komponenter för förberedelse av data

Funktioner beskrivning komponent
Inmatning och utmatning av data Flytta data från molnkällor till din pipeline. Skriv dina resultat eller mellanliggande data till Azure Storage eller SQL Database när du kör en pipeline, eller använd molnlagring för att utbyta data mellan pipelines. Ange data manuellt
Exportera data
Importera data
Data Transformation Åtgärder för data som är unika för maskininlärning, till exempel normalisering eller binning av data, minskning av dimensionalitet och konvertering av data mellan olika filformat. Lägg till kolumner
Lägg till rader
Tillämpa matematisk åtgärd
Tillämpa SQL-transformering
Rensa saknade data
Klipp ut värden
Konvertera till CSV
Konvertera till datauppsättning
Konvertera till indikatorvärden
Redigera metadata
Gruppera data i lagerplatser
Koppla data
Normalisera data
Partition och exempel
Ta bort dubblettrader
SMOTE
Välj kolumntransformering
Välj kolumner i datauppsättning
Split Data (Dela data)
Funktionsurval Välj en delmängd av relevanta, användbara funktioner som ska användas för att skapa en analysmodell. Filtrera baserat funktionsval
Funktionsvikt för permutation
Statistiska funktioner Tillhandahålla en mängd olika statistiska metoder som rör datavetenskap. Sammanfatta data

Maskininlärningsalgoritmer

Funktioner beskrivning komponent
Regression Förutsäga ett värde. Förbättrad regression av beslutsträd
Regression av beslutsskog
Fast Forest Quantile Regression
Linjär regression
Regression för neuralt nätverk
Poisson Regression
Klustring Gruppera data tillsammans. K-Means-klustring
Klassificering Förutsäga en klass. Välj mellan binära algoritmer (två klasser) eller multiklassalgoritmer. Flerklasssförstärkning av beslutsträd
Beslutsskog för flera grupper
Logistisk regression för flera grupper
Neuralt nätverk med flera grupper
En jämfört med alla multiklasser
One vs. One Multiclass
Genomsnittlig perceptron med två klasser
Two-Class Boosted Decision Tree (Tvåklassigt förbättrat beslutsträd)
Beslutsskog med två klasser
Logistisk regression i två klasser
Neuralt nätverk med två klasser
Två klassstödvektordator

Komponenter för att skapa och utvärdera modeller

Funktioner beskrivning komponent
Modellträning Kör data via algoritmen. Träna klustringsmodell
Train Model (Träningsmodell)
Träna Pytorch-modell
Justera modellhyperparametrar
Bedömning och utvärdering av modell Mät noggrannheten för den tränade modellen. Tillämpa transformering
Tilldela data till kluster
Kors verifiera modell
Utvärdera modell
Poängbildmodell
Poängmodell
Python-språk Skriv kod och bädda in den i en komponent för att integrera Python med din pipeline. Skapa Python-modell
Köra Python-skript
R-språk Skriv kod och bädda in den i en komponent för att integrera R med din pipeline. Köra R-skript
Textanalys Tillhandahålla specialiserade beräkningsverktyg för att arbeta med både strukturerad och ostrukturerad text. Konvertera Word till vektor
Extrahera N Gram-funktioner från text
Funktionshashing
Förbearbeta text
Latent Dirichlet-allokering
Poäng vowpal wabbit modell
Träna Vowpal Wabbit-modell
Visuellt innehåll Förbearbetning av bilddata och komponenter relaterade till bildigenkänning. Tillämpa bildomvandling
Konvertera till avbildningskatalog
Init-bildomvandling
Dela avbildningskatalog
DenseNet
ResNet
Rekommendation Skapa rekommendationsmodeller. Utvärdera rekommenderare
Poängsätta SVD-rekommenderare
Poäng bred och djuprekommendator
Träna SVD-rekommendationer
Träna bred och djuprekommendator
Avvikelseidentifiering Skapa modeller för avvikelseidentifiering. PCA-baserad avvikelseidentifiering
Träna modell för avvikelseidentifiering

Webbtjänst

Lär dig mer om webbtjänstkomponenterna, som är nödvändiga för realtidsinferens i Azure Mašinsko učenje designer.

Felmeddelanden

Lär dig mer om de felmeddelanden och undantagskoder som du kan stöta på med hjälp av komponenter i Azure Mašinsko učenje designer.

Komponentmiljö

Alla inbyggda komponenter i designern körs i en fast miljö som tillhandahålls av Microsoft.

Tidigare baserades miljön på Python 3.6, men nu har den uppgraderats till Python 3.8. Uppgraderingen är transparent eftersom komponenterna körs automatiskt i Python 3.8-miljön och kräver ingen åtgärd från användaren. Miljöuppdateringen kan påverka komponentutdata och distribuera realtidsslutpunkt från en slutsatsdragning i realtid. Mer information finns i följande avsnitt.

Komponenternas utdata skiljer sig från tidigare resultat

När Python-versionen har uppgraderats från 3.6 till 3.8 kan beroendena för inbyggda komponenter också uppgraderas i enlighet med detta. Därför kanske vissa komponenters utdata skiljer sig från tidigare resultat.

Om du använder komponenten Kör Python-skript och tidigare har installerat paket som är kopplade till Python 3.6 kan du stöta på fel som:

  • "Det gick inte att hitta en version som uppfyller kravet."
  • "Ingen matchande distribution hittades." Sedan måste du ange den paketversion som är anpassad till Python 3.8 och köra pipelinen igen.

Distribuera realtidsslutpunkt från problem med slutsatsdragningspipeline i realtid

Om du distribuerar realtidsslutpunkten direkt från en tidigare slutförd pipeline för slutsatsdragning i realtid kan det uppstå fel.

Rekommendation: Klona slutsatsdragningspipelinen och skicka den igen och distribuera sedan till realtidsslutpunkten.

Nästa steg