Distribuera modeller som serverlösa API:er
I den här artikeln får du lära dig hur du distribuerar en modell från modellkatalogen som ett serverlöst API med betala per användning-tokenbaserad fakturering.
Viktigt!
Modeller som är i förhandsversion markeras som förhandsversioner på sina modellkort i modellkatalogen.
Vissa modeller i modellkatalogen kan distribueras som ett serverlöst API med betala per användning-fakturering. Den här typen av distribution ger ett sätt att använda modeller som ett API utan att vara värd för dem i din prenumeration, samtidigt som den företagssäkerhet och efterlevnad som organisationer behöver bevaras. Det här distributionsalternativet kräver inte kvot från din prenumeration.
Den här artikeln använder en Meta Llama-modelldistribution som illustration. Du kan dock använda samma steg för att distribuera någon av modellerna i modellkatalogen som är tillgängliga för serverlös API-distribution.
Förutsättningar
En Azure-prenumeration med en giltig betalningsmetod. Kostnadsfria azure-prenumerationer eller utvärderingsprenumerationer fungerar inte. Om du inte har en Azure-prenumeration skapar du ett betalt Azure-konto för att börja.
Rollbaserade åtkomstkontroller i Azure (Azure RBAC) används för att bevilja åtkomst till åtgärder i Azure AI Studio. Om du vill utföra stegen i den här artikeln måste ditt användarkonto tilldelas rollen Azure AI Developer i resursgruppen. Mer information om behörigheter finns i Rollbaserad åtkomstkontroll i Azure AI Studio.
Du måste installera följande programvara för att arbeta med Azure AI Studio:
Du kan använda valfri kompatibel webbläsare för att navigera i Azure AI Studio.
Hitta modell- och modell-ID:t i modellkatalogen
Logga in på Azure AI Studio.
För modeller som erbjuds via Azure Marketplace kontrollerar du att ditt konto har rollbehörigheten Azure AI Developer för resursgruppen eller att du uppfyller de behörigheter som krävs för att prenumerera på modellerbjudanden.
Modeller som erbjuds av icke-Microsoft-leverantörer (till exempel Llama- och Mistral-modeller) debiteras via Azure Marketplace. För sådana modeller måste du prenumerera projektet på det specifika modellerbjudandet. Modeller som erbjuds av Microsoft (till exempel Phi-3-modeller) har inte det här kravet eftersom faktureringen görs på ett annat sätt. Mer information om fakturering för serverlös distribution av modeller i modellkatalogen finns i Fakturering för serverlösa API:er.
Välj Modellkatalog i det vänstra sidofältet och leta reda på modellkortet för den modell som du vill distribuera. I den här artikeln väljer du en Meta-Llama-3-8B-Instruct-modell .
Om du distribuerar modellen med Hjälp av Azure CLI, Python eller ARM kopierar du modell-ID:t.
Viktigt!
Inkludera inte versionen när du kopierar modell-ID :t. Serverlösa API-slutpunkter distribuerar alltid modellens senaste tillgängliga version. För modell-ID
azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3
:t kopierar duazureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct
till exempel .
I nästa avsnitt beskrivs stegen för att prenumerera projektet på ett modellerbjudande. Du kan hoppa över det här avsnittet och gå till Distribuera modellen till en serverlös API-slutpunkt om du distribuerar en Microsoft-modell.
Prenumerera ditt projekt på modellerbjudandet
Serverlösa API-slutpunkter kan distribuera både Microsoft- och icke-Microsoft-modeller som erbjuds. För Microsoft-modeller (till exempel Phi-3-modeller) behöver du inte skapa en Azure Marketplace-prenumeration och du kan distribuera dem till serverlösa API-slutpunkter direkt för att använda deras förutsägelser. För modeller som inte kommer från Microsoft måste du skapa prenumerationen först. Om det är första gången du distribuerar modellen i projektet måste du prenumerera på ditt projekt för det specifika modellerbjudandet från Azure Marketplace. Varje projekt har en egen prenumeration på det specifika Azure Marketplace-erbjudandet för modellen, vilket gör att du kan styra och övervaka utgifter.
Dricks
Hoppa över det här steget om du distribuerar modeller från Phi-3-serien med modeller. Distribuera modellen direkt till en serverlös API-slutpunkt.
Kommentar
Modeller som erbjuds via Azure Marketplace är tillgängliga för distribution till serverlösa API-slutpunkter i specifika regioner. Kontrollera modell- och regionstillgängligheten för serverlösa API-distributioner för att kontrollera vilka modeller och regioner som är tillgängliga. Om den du behöver inte visas kan du distribuera till en arbetsyta i en region som stöds och sedan använda serverlösa API-slutpunkter från en annan arbetsyta.
Skapa modellens Marketplace-prenumeration. När du skapar en prenumeration godkänner du de villkor som är associerade med modellerbjudandet.
På sidan Information för modellen väljer du Distribuera. Fönstret Distributionsalternativ öppnas, vilket ger dig möjlighet att välja mellan serverlös API-distribution och distribution med hjälp av en hanterad beräkning.
Kommentar
För modeller som endast kan distribueras via serverlös API-distribution öppnas guiden för serverlös API-distribution direkt efter att du har valt Distribuera från modellens informationssida.
Välj Serverlöst API med Azure AI Content Safety (förhandsversion) för att öppna guiden för serverlös API-distribution.
Välj det projekt där du vill distribuera dina modeller. Om du vill använda det serverlösa API-modelldistributionserbjudandet måste projektet tillhöra en av de regioner som stöds för serverlös distribution för den specifika modellen.
Om du ser anteckningen Du har redan en Azure Marketplace-prenumeration för det här projektet behöver du inte skapa prenumerationen eftersom du redan har en. Du kan fortsätta att distribuera modellen till en serverlös API-slutpunkt.
I distributionsguiden väljer du länken till Azure Marketplace-villkor för att lära dig mer om användningsvillkoren. Du kan också välja fliken Priser och villkor för att lära dig mer om priser för den valda modellen.
Välj Prenumerera och Distribuera.
När du prenumererar på projektet för det specifika Azure Marketplace-erbjudandet behöver efterföljande distributioner av samma erbjudande i samma projekt inte prenumerera igen.
När som helst kan du se de modellerbjudanden som ditt projekt för närvarande prenumererar på:
Gå till Azure-portalen.
Gå till den resursgrupp där projektet tillhör.
I filtret Typ väljer du SaaS.
Du ser alla erbjudanden som du prenumererar på.
Välj valfri resurs för att se informationen.
Distribuera modellen till en serverlös API-slutpunkt
När du har skapat en prenumeration för en icke-Microsoft-modell kan du distribuera den associerade modellen till en serverlös API-slutpunkt. För Microsoft-modeller (till exempel Phi-3-modeller) behöver du inte skapa en prenumeration.
Den serverlösa API-slutpunkten är ett sätt att använda modeller som ett API utan att vara värd för dem i din prenumeration, samtidigt som företagets säkerhets- och efterlevnadsorganisationer behöver det. Det här distributionsalternativet kräver inte kvot från din prenumeration.
I det här avsnittet skapar du en slutpunkt med namnet meta-llama3-8b-qwerty.
Skapa den serverlösa slutpunkten
Så här distribuerar du en Microsoft-modell som inte kräver att du prenumererar på ett modellerbjudande:
- Välj Distribuera och välj sedan Serverlöst API med Azure AI Content Safety (förhandsversion) för att öppna distributionsguiden.
- Välj det projekt där du vill distribuera din modell. Observera att inte alla regioner stöds.
Om du precis har prenumererat på modellerbjudandet i föregående avsnitt kan du också fortsätta att välja Distribuera för en modellprenumeration som kräver en modellprenumeration. Du kan också välja Fortsätt att distribuera (om distributionsguiden hade anteckningen Du har redan en Azure Marketplace-prenumeration för det här projektet).
Ge distributionen ett namn. Det här namnet blir en del av URL:en för distributions-API:et. Den här URL:en måste vara unik i varje Azure-region.
Dricks
Alternativet Innehållsfilter (förhandsversion) är aktiverat som standard. Lämna standardinställningen för tjänsten för att identifiera skadligt innehåll som hat, självskadebeteende, sexuellt och våldsamt innehåll. Mer information om innehållsfiltrering (förhandsversion) finns i Innehållsfiltrering i Azure AI Studio.
Välj distribuera. Vänta tills distributionen är klar och du omdirigeras till sidan Distributioner.
När som helst kan du se slutpunkterna som distribueras till projektet:
Gå till ditt projekt.
Välj avsnittet Distributioner
Serverlösa API-slutpunkter visas.
Den skapade slutpunkten använder nyckelautentisering för auktorisering. Använd följande steg för att hämta de nycklar som är associerade med en viss slutpunkt.
Du kan gå tillbaka till sidan Distributioner, välja distributionen och notera slutpunktens mål-URI och nyckel. Använd dem för att anropa distributionen och generera förutsägelser.
Nu är slutpunkten redo att användas.
Om du behöver använda den här distributionen från ett annat projekt eller en annan hubb, eller om du planerar att använda promptflöde för att skapa intelligenta program, måste du skapa en anslutning till den serverlösa API-distributionen. Information om hur du konfigurerar en befintlig serverlös API-slutpunkt för ett nytt projekt eller en ny hubb finns i Använda distribuerade serverlösa API-slutpunkter från ett annat projekt eller från promptflödet.
Dricks
Om du använder promptflöde i samma projekt eller hubb där distributionen distribuerades måste du fortfarande skapa anslutningen.
Använda den serverlösa API-slutpunkten
Modeller som distribueras i Azure Machine Learning och Azure AI Studio i serverlösa API-slutpunkter stöder Azure AI Model Inference API som exponerar en gemensam uppsättning funktioner för grundläggande modeller och som kan användas av utvecklare för att använda förutsägelser från en mängd olika modeller på ett enhetligt och konsekvent sätt.
Läs mer om funktionerna i det här API:et och hur du kan använda det när du skapar program.
Nätverksisolering
Slutpunkter för modeller som distribueras som Serverlösa API:er följer flaggan för offentlig nätverksåtkomst (PNA) för AI Studio Hub som har projektet där distributionen finns. Om du vill skydda din MaaS-slutpunkt inaktiverar du PNA-flaggan på din AI Studio Hub. Du kan skydda inkommande kommunikation från en klient till slutpunkten med hjälp av en privat slutpunkt för hubben.
Så här anger du PNA-flaggan för Azure AI Studio-hubben:
- Gå till Azure-portalen.
- Sök efter den resursgrupp som hubben tillhör och välj Azure AI-hubben från de resurser som anges för den här resursgruppen.
- På hubböversiktssidan på den vänstra menyn väljer du Inställningar>Nätverk.
- Under fliken Offentlig åtkomst kan du konfigurera inställningar för åtkomstflaggan för offentligt nätverk.
- Spara dina ändringar. Det kan ta upp till fem minuter att sprida ändringarna.
Ta bort slutpunkter och prenumerationer
Du kan ta bort modellprenumerationer och slutpunkter. Om du tar bort en modellprenumeration blir alla associerade slutpunkter inte felfria och oanvändbara.
Så här tar du bort en serverlös API-slutpunkt:
Gå till Azure AI Studio.
Gå till Distributioner av komponenter>.
Öppna den distribution som du vill ta bort.
Välj Ta bort.
Så här tar du bort den associerade modellprenumerationen:
Gå till Azure Portal
Gå till den resursgrupp där projektet tillhör.
I filtret Typ väljer du SaaS.
Välj den prenumeration du vill ta bort.
Välj Ta bort.
Kostnads- och kvotöverväganden för modeller som distribueras som serverlösa API-slutpunkter
Kvot hanteras per distribution. Varje distribution har en hastighetsgräns på 200 000 token per minut och 1 000 API-begäranden per minut. För närvarande begränsar vi dock en distribution per modell per projekt. Kontakta Microsoft Azure Support om de aktuella hastighetsgränserna inte räcker för dina scenarier.
Kostnad för Microsoft-modeller
Du hittar prisinformationen på fliken Priser och villkor i distributionsguiden när du distribuerar Microsoft-modeller (till exempel Phi-3-modeller) som serverlösa API-slutpunkter.
Kostnad för modeller som inte kommer från Microsoft
Icke-Microsoft-modeller som distribueras som serverlösa API-slutpunkter erbjuds via Azure Marketplace och integreras med Azure AI Studio för användning. Du hittar prissättningen för Azure Marketplace när du distribuerar eller finjusterar dessa modeller.
Varje gång ett projekt prenumererar på ett visst erbjudande från Azure Marketplace skapas en ny resurs för att spåra de kostnader som är kopplade till förbrukningen. Samma resurs används för att spåra kostnader som är kopplade till slutsatsdragning och finjustering. Flera mätare är dock tillgängliga för att spåra varje scenario oberoende av varandra.
Mer information om hur du spårar kostnader finns i Övervaka kostnader för modeller som erbjuds via Azure Marketplace.
Behörigheter som krävs för att prenumerera på modellerbjudanden
Rollbaserade åtkomstkontroller i Azure (Azure RBAC) används för att bevilja åtkomst till åtgärder i Azure AI Studio. Om du vill utföra stegen i den här artikeln måste ditt användarkonto tilldelas rollen Ägare, Deltagare eller Azure AI Developer för Azure-prenumerationen. Alternativt kan ditt konto tilldelas en anpassad roll som har följande behörigheter:
I Azure-prenumerationen – för att prenumerera på arbetsytan till Azure Marketplace-erbjudandet, en gång för varje arbetsyta, per erbjudande:
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
I resursgruppen – för att skapa och använda SaaS-resursen:
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
På arbetsytan – för att distribuera slutpunkter (dataexpertrollen i Azure Machine Learning innehåller redan dessa behörigheter):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Mer information om behörigheter finns i Rollbaserad åtkomstkontroll i Azure AI Studio.