Azure OpenAI-vektoriserare
Azure OpenAI-vektoriseraren ansluter till en distribuerad inbäddningsmodell på din Azure OpenAI-resurs för att generera inbäddningar vid frågetillfället. Dina data bearbetas i geo-området där din modell distribueras.
Vectorizers används vid frågetillfället, men anges i indexdefinitioner och refereras till i vektorfält via en vektorprofil. Azure OpenAI-vektoriseraren anropas AzureOpenAIVectorizer
i API:et.
Använd REST API:et 2024-07-01 eller ett Azure SDK-paket som har uppdaterats för att tillhandahålla funktionen.
Konfigurera en vektoriserare i ett sökindexinnehåller användningsinstruktioner.
Kommentar
Den här vektoriseraren är bunden till Azure OpenAI och debiteras till det befintliga betala per användning-priset för Azure OpenAI.
Förutsättningar
Azure OpenAI-tjänsten måste ha en associerad anpassad underdomän. Om tjänsten skapades via Azure Portal genereras den här underdomänen automatiskt som en del av tjänstkonfigurationen. Se till att tjänsten innehåller en anpassad underdomän innan du använder den med Azure AI Search-integreringen.
Azure OpenAI-tjänstresurser (med åtkomst till inbäddningsmodeller) som skapades i AI Studio stöds inte. Endast De Azure OpenAI-tjänstresurser som skapats i Azure Portal är kompatibla med integreringen av Azure OpenAI-inbäddningsfärdighet.
Vectorizer-parametrar
Parametrar är skiftlägeskänsliga.
Parameternamn | beskrivning |
---|---|
resourceUri |
URI:n för modellprovidern, i det här fallet en Azure OpenAI-resurs. Den här parametern stöder endast URL:er med domänen openai.azure.com , till exempel https://<resourcename>.openai.azure.com . Om Azure OpenAI-slutpunkten har en URL med domänen cognitiveservices.azure.com , till exempel https://<resourcename>.cognitiveservices.azure.com , måste en anpassad underdomän med openai.azure.com skapas först för Azure OpenAI-resursen och i stället användas https://<resourcename>.openai.azure.com . |
apiKey |
Den hemliga nyckel som används för att komma åt modellen. Om du anger en nyckel lämnar du authIdentity tom. Om du anger både apiKey och authIdentity apiKey används den för anslutningen. |
deploymentId |
Namnet på den distribuerade Inbäddningsmodellen för Azure OpenAI. Modellen ska vara en inbäddningsmodell, till exempel textinbäddning-ada-002. Se Listan över Azure OpenAI-modeller för modeller som stöds. |
authIdentity |
En användarhanterad identitet som används av söktjänsten för att ansluta till Azure OpenAI. Du kan använda antingen en system- eller användarhanterad identitet. Lämna och authIdentity tom om du vill använda en systemhanterad identitetapiKey . Den systemhanterade identiteten används automatiskt. En hanterad identitet måste ha Behörighet för Cognitive Services OpenAI-användare att skicka text till Azure OpenAI. |
modelName |
(Krävs i API-version 2024-05-01-Preview och senare). Namnet på inbäddningsmodellen för Azure OpenAI som distribueras på angiven resourceUri och deploymentId . Värden som stöds för närvarande är text-embedding-ada-002 , text-embedding-3-large och text-embedding-3-small |
Frågetyper för vektorer som stöds
Azure OpenAI-vektoriseraren stöder text
endast vektorfrågor.
Förväntade fältdimensioner
De förväntade fältdimensionerna för ett fält som konfigurerats med en Azure OpenAI-vektoriserare beror på vilken modelName
som är konfigurerad.
modelName |
Minsta mått | Maximala dimensioner |
---|---|---|
text-embedding-ada-002 | 1536 | 1536 |
text-embedding-3-large | 1 | 3072 |
text-embedding-3-small | 1 | 1536 |
Exempeldefinition
"vectorizers": [
{
"name": "my-openai-vectorizer",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://my-fake-azure-openai-resource.openai.azure.com",
"apiKey": "0000000000000000000000000000000000000",
"deploymentId": "my-ada-002-deployment",
"authIdentity": null,
"modelName": "text-embedding-ada-002",
},
}
]