Ukládání odpovědí do mezipaměti na požadavky rozhraní API Azure OpenAI
PLATÍ PRO: Všechny úrovně služby API Management
Zásady azure-openai-semantic-cache-store
ukládají odpovědi na rozhraní API pro dokončování chatu Azure OpenAI a požadavky rozhraní API pro dokončování do nakonfigurované externí mezipaměti. Ukládání odpovědí do mezipaměti snižuje požadavky na šířku pásma a zpracování uložené na back-endovém rozhraní Api OpenAI a snižuje latenci vnímanou příjemci rozhraní API.
Poznámka:
- Tato zásada musí mít odpovídající odpovědi Get Cached na zásady požadavků rozhraní API Azure OpenAI.
- Požadavky a kroky pro povolení sémantické mezipaměti najdete v tématu Povolení sémantické mezipaměti pro rozhraní API Azure OpenAI ve službě Azure API Management.
- V současné době je tato zásada ve verzi Preview.
Poznámka:
Nastavte prvky zásad a podřízené prvky v pořadí uvedeném v prohlášení o zásadách. Přečtěte si další informace o tom, jak nastavit nebo upravit zásady služby API Management.
Podporované modely služby Azure OpenAI
Zásady se používají s rozhraními API přidanými do služby API Management ze služby Azure OpenAI s následujícími typy:
Typ rozhraní API | Podporované modely |
---|---|
Dokončení chatu | gpt-3.5 gpt-4 |
Dokončení | gpt-3.5-turbo-instruct |
Vkládání | text-embedding-3-large text-embedding-3-small text-embedding-ada-002 |
Další informace najdete v tématu Modely Azure OpenAI Service.
Prohlášení o zásadách
<azure-openai-semantic-cache-store duration="seconds"/>
Atributy
Atribut | Popis | Požaduje se | Výchozí |
---|---|---|---|
doba trvání | Doba trvání položek uložených v mezipaměti zadaná v sekundách. Výrazy zásad jsou povolené. | Yes | – |
Využití
- Oddíly zásad: odchozí
- Obory zásad: globální, produkt, rozhraní API, operace
- Brány: v2
Poznámky k využití
- Tuto zásadu je možné v oddílu zásad použít jenom jednou.
- Pokud vyhledávání mezipaměti selže, volání rozhraní API, které používá operaci související s mezipamětí, nevyvolá chybu a operace mezipaměti se úspěšně dokončí.
Příklady
Příklad s odpovídajícími zásadami vyhledávání azure-openai-sémantic-cache-lookup
<policies>
<inbound>
<base />
<azure-openai-semantic-cache-lookup
score-threshold="0.05"
embeddings-backend-id ="azure-openai-backend"
embeddings-backend-auth ="system-assigned" >
<vary-by>@(context.Subscription.Id)</vary-by>
</azure-openai-semantic-cache-lookup>
</inbound>
<outbound>
<azure-openai-semantic-cache-store duration="60" />
<base />
</outbound>
</policies>
Související zásady
Související obsah
Další informace o práci se zásadami najdete v tématech:
- Kurz: Transformace a ochrana rozhraní API
- Referenční informace o zásadách pro úplný seznam prohlášení o zásadách a jejich nastavení
- Výrazy zásad
- Nastavení nebo úprava zásad
- Opakované použití konfigurací zásad
- Úložiště fragmentů zásad
- Vytváření zásad pomocí Microsoft Copilotu v Azure