Lär dig hur du genererar inbäddningar med Azure OpenAI
En inbäddning är ett särskilt format för datarepresentation som enkelt kan användas av maskininlärningsmodeller och algoritmer. Inbäddningen är en informationstät representation av den semantiska innebörden av ett stycke text. Varje inbäddning är en vektor med flyttalsnummer, så att avståndet mellan två inbäddningar i vektorutrymmet korreleras med semantisk likhet mellan två indata i det ursprungliga formatet. Om två texter till exempel är liknande bör deras vektorrepresentationer också vara liknande. Inbäddning av energivektorlikhetssökning i Azure Databases, till exempel Azure Cosmos DB for MongoDB vCore , Azure SQL Database eller Azure Database for PostgreSQL – flexibel server.
Så här hämtar du inbäddningar
För att hämta en inbäddningsvektor för en textdel skickar vi en begäran till slutpunkten för inbäddningsdata enligt följande kodfragment:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Bästa praxis
Kontrollera att indata inte överskrider den maximala längden
- Den maximala längden på indatatexten för våra senaste inbäddningsmodeller är 8 192 tokens. Du bör kontrollera att dina indata inte överskrider den här gränsen innan du gör en begäran.
- Om du skickar en matris med indata i en enda inbäddningsbegäran är den maximala matrisstorleken 2048.
Begränsningar och risker
Våra inbäddningsmodeller kan vara otillförlitliga eller utgöra sociala risker i vissa fall och kan orsaka skada i avsaknad av åtgärder. Läs vårt ansvarsfulla AI-innehåll för mer information om hur du hanterar deras användning på ett ansvarsfullt sätt.
Nästa steg
- Läs mer om hur du använder Azure OpenAI och inbäddningar för att utföra dokumentsökning med vår självstudie om inbäddningar.
- Läs mer om de underliggande modeller som driver Azure OpenAI.
- Lagra dina inbäddningar och utför vektorsökning (likhet) med hjälp av ditt val av tjänst: