Azure OpenAI API isteklerine yönelik yanıtları önbelleğe alma

UYGULANANLAR: Tüm API Management katmanları

İlke, azure-openai-semantic-cache-store Azure OpenAI Sohbet Tamamlama API'sine ve Tamamlama API'sinin isteklerine verilen yanıtları yapılandırılmış bir dış önbelleğe önbelleğe alır. Yanıt önbelleğe alma, arka uç Azure OpenAI API'sine uygulanan bant genişliğini ve işleme gereksinimlerini azaltır ve API tüketicileri tarafından algılanan gecikme süresini azaltır.

Not

  • Bu ilkenin, Azure OpenAI API isteklerine karşılık gelen Önbelleğe alınmış yanıtları al ilkesi olmalıdır.
  • Semantik önbelleğe almayı etkinleştirme önkoşulları ve adımları için bkz . Azure API Management'ta Azure OpenAI API'leri için anlamsal önbelleğe almayı etkinleştirme.
  • Şu anda bu ilke önizleme aşamasındadır.

Not

İlkenin öğelerini ve alt öğelerini ilke bildiriminde sağlanan sırayla ayarlayın. API Management ilkelerini ayarlama veya düzenleme hakkında daha fazla bilgi edinin.

Desteklenen Azure OpenAI Hizmeti modelleri

İlke, Aşağıdaki türlerdeki Azure OpenAI Hizmeti'nden API Management'a eklenen API'lerle birlikte kullanılır:

API türü Desteklenen modeller
Sohbet tamamlama gpt-3.5

gpt-4
Tamamlama gpt-3.5-turbo-instruct
Eklemeler metin ekleme-3-büyük

metin ekleme-3-küçük

metin ekleme-ada-002

Daha fazla bilgi için Azure OpenAI Service modelleri konusuna bakın.

İlke bildirimi

<azure-openai-semantic-cache-store duration="seconds"/>

Özellikler

Öznitelik Açıklama Zorunlu Varsayılan
süre Saniye cinsinden belirtilen önbelleğe alınan girdilerin yaşam süresi. İlke ifadelerine izin verilir. Yes Yok

Kullanım

Kullanım notları

  • Bu ilke, ilke bölümünde yalnızca bir kez kullanılabilir.
  • Önbellek araması başarısız olursa, önbellekle ilgili işlemi kullanan API çağrısı hata vermez ve önbellek işlemi başarıyla tamamlanır.

Örnekler

İlgili azure-openai-semantic-cache-lookup ilkesine sahip örnek

<policies>
    <inbound>
        <base />
        <azure-openai-semantic-cache-lookup
            score-threshold="0.05"
            embeddings-backend-id ="azure-openai-backend"
            embeddings-backend-auth ="system-assigned" >
            <vary-by>@(context.Subscription.Id)</vary-by>
        </azure-openai-semantic-cache-lookup>
    </inbound>
    <outbound>
        <azure-openai-semantic-cache-store duration="60" />
        <base />
    </outbound>
</policies>

İlkelerle çalışma hakkında daha fazla bilgi için bkz: