Referens för algoritm och komponent för Azure Mašinsko učenje designer
GÄLLER FÖR: Python SDK azure-ai-ml v2 (aktuell)
Kommentar
Designer stöder två typer av komponenter, klassiska fördefinierade komponenter och anpassade komponenter. Dessa två typer av komponenter är inte kompatibla.
Klassiska fördefinierade komponenter tillhandahåller fördefinierade komponenter som främst används för databearbetning och traditionella maskininlärningsuppgifter som regression och klassificering. Den här typen av komponent stöds fortfarande, men inga nya komponenter läggs till.
Med anpassade komponenter kan du ange din egen kod som en komponent. Det finns stöd för delning mellan arbetsytor och sömlös redigering i Studio-, CLI- och SDK-gränssnitt.
Den här artikeln gäller för klassiska fördefinierade komponenter.
Det här referensinnehållet innehåller den tekniska bakgrunden för var och en av de klassiska fördefinierade komponenterna som är tillgängliga i Azure Mašinsko učenje designer.
Varje komponent representerar en uppsättning kod som kan köras separat och utföra en maskininlärningsuppgift, med de indata som krävs. En komponent kan innehålla en viss algoritm eller utföra en uppgift som är viktig inom maskininlärning, till exempel saknade värdeersättning eller statistisk analys.
Hjälp med att välja algoritmer finns i
Dricks
I valfri pipeline i designern kan du få information om en specifik komponent. Välj länken Läs mer på komponentkortet när du hovrar på komponenten i komponentlistan eller i komponentens högra fönster.
Komponenter för förberedelse av data
Funktioner | beskrivning | komponent |
---|---|---|
Inmatning och utmatning av data | Flytta data från molnkällor till din pipeline. Skriv dina resultat eller mellanliggande data till Azure Storage eller SQL Database när du kör en pipeline, eller använd molnlagring för att utbyta data mellan pipelines. | Ange data manuellt Exportera data Importera data |
Data Transformation | Åtgärder för data som är unika för maskininlärning, till exempel normalisering eller binning av data, minskning av dimensionalitet och konvertering av data mellan olika filformat. | Lägg till kolumner Lägg till rader Tillämpa matematisk åtgärd Tillämpa SQL-transformering Rensa saknade data Klipp ut värden Konvertera till CSV Konvertera till datauppsättning Konvertera till indikatorvärden Redigera metadata Gruppera data i lagerplatser Koppla data Normalisera data Partition och exempel Ta bort dubblettrader SMOTE Välj kolumntransformering Välj kolumner i datauppsättning Split Data (Dela data) |
Funktionsurval | Välj en delmängd av relevanta, användbara funktioner som ska användas för att skapa en analysmodell. | Filtrera baserat funktionsval Funktionsvikt för permutation |
Statistiska funktioner | Tillhandahålla en mängd olika statistiska metoder som rör datavetenskap. | Sammanfatta data |
Maskininlärningsalgoritmer
Funktioner | beskrivning | komponent |
---|---|---|
Regression | Förutsäga ett värde. | Förbättrad regression av beslutsträd Regression av beslutsskog Fast Forest Quantile Regression Linjär regression Regression för neuralt nätverk Poisson Regression |
Klustring | Gruppera data tillsammans. | K-Means-klustring |
Klassificering | Förutsäga en klass. Välj mellan binära algoritmer (två klasser) eller multiklassalgoritmer. | Flerklasssförstärkning av beslutsträd Beslutsskog för flera grupper Logistisk regression för flera grupper Neuralt nätverk med flera grupper En jämfört med alla multiklasser One vs. One Multiclass Genomsnittlig perceptron med två klasser Two-Class Boosted Decision Tree (Tvåklassigt förbättrat beslutsträd) Beslutsskog med två klasser Logistisk regression i två klasser Neuralt nätverk med två klasser Två klassstödvektordator |
Komponenter för att skapa och utvärdera modeller
Webbtjänst
Lär dig mer om webbtjänstkomponenterna, som är nödvändiga för realtidsinferens i Azure Mašinsko učenje designer.
Felmeddelanden
Lär dig mer om de felmeddelanden och undantagskoder som du kan stöta på med hjälp av komponenter i Azure Mašinsko učenje designer.
Komponentmiljö
Alla inbyggda komponenter i designern körs i en fast miljö som tillhandahålls av Microsoft.
Tidigare baserades miljön på Python 3.6, men nu har den uppgraderats till Python 3.8. Uppgraderingen är transparent eftersom komponenterna körs automatiskt i Python 3.8-miljön och kräver ingen åtgärd från användaren. Miljöuppdateringen kan påverka komponentutdata och distribuera realtidsslutpunkt från en slutsatsdragning i realtid. Mer information finns i följande avsnitt.
Komponenternas utdata skiljer sig från tidigare resultat
När Python-versionen har uppgraderats från 3.6 till 3.8 kan beroendena för inbyggda komponenter också uppgraderas i enlighet med detta. Därför kanske vissa komponenters utdata skiljer sig från tidigare resultat.
Om du använder komponenten Kör Python-skript och tidigare har installerat paket som är kopplade till Python 3.6 kan du stöta på fel som:
- "Det gick inte att hitta en version som uppfyller kravet."
- "Ingen matchande distribution hittades." Sedan måste du ange den paketversion som är anpassad till Python 3.8 och köra pipelinen igen.
Distribuera realtidsslutpunkt från problem med slutsatsdragningspipeline i realtid
Om du distribuerar realtidsslutpunkten direkt från en tidigare slutförd pipeline för slutsatsdragning i realtid kan det uppstå fel.
Rekommendation: Klona slutsatsdragningspipelinen och skicka den igen och distribuera sedan till realtidsslutpunkten.