Azure OpenAI Ekleme becerisi
Azure OpenAI Ekleme becerisi, dizin oluşturma sırasında eklemeler oluşturmak için Azure OpenAI kaynağınızda dağıtılan bir ekleme modeline bağlanır. Verileriniz, modelinizin dağıtıldığı Coğrafi bölgede işlenir.
Önkoşullar
Azure OpenAI Hizmetinizin ilişkili bir özel alt etki alanı olmalıdır. Hizmet Azure portalı aracılığıyla oluşturulduysa, bu alt etki alanı hizmet kurulumunuzun bir parçası olarak otomatik olarak oluşturulur. Hizmetinizi Azure AI Search tümleştirmesiyle kullanmadan önce özel bir alt etki alanı içerdiğinden emin olun.
AI Studio'da oluşturulan Azure OpenAI Hizmeti kaynakları (ekleme modellerine erişimi olan) desteklenmez. Yalnızca Azure portalında oluşturulan Azure OpenAI Hizmeti kaynakları, Azure OpenAI Ekleme beceri tümleştirmesiyle uyumludur.
Azure portalındaki Verileri içeri aktarma ve vektörleştirme sihirbazı, içeriği vektörleştirmek için Azure OpenAI Ekleme becerisini kullanır. Sihirbazı çalıştırabilir ve oluşturulan beceri kümesini gözden geçirerek sihirbazın modelleri ekleme becerisini nasıl derlediğini görebilirsiniz.
Not
Bu beceri Azure OpenAI'ye bağlıdır ve mevcut Azure OpenAI kullandıkça öde fiyatından ücretlendirilir.
@odata.type
Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill
Veri sınırları
Metin girişinin en büyük boyutu 8.000 belirteç olmalıdır. Giriş izin verilen maksimum değeri aşarsa model geçersiz bir istek hatası oluşturur. Daha fazla bilgi için Azure OpenAI belgelerindeki belirteç anahtarı kavramına bakın. Veri öbekleme gerekiyorsa Metin Bölme becerisini kullanmayı göz önünde bulundurun.
Beceri parametreleri
Parametreler büyük/küçük harfe duyarlıdır.
Girişler | Açıklama |
---|---|
resourceUri |
Model sağlayıcısının URI'sini ( bu örnekte, bir Azure OpenAI kaynağı). Bu parametre yalnızca gibi https://<resourcename>.openai.azure.com etki alanına openai.azure.com sahip URL'leri destekler. Azure OpenAI uç noktasının etki alanına cognitiveservices.azure.com sahip bir URL'si varsa, https://<resourcename>.cognitiveservices.azure.com önce Azure OpenAI kaynağı için ile openai.azure.com özel bir alt etki alanı oluşturulup bunun yerine kullanılmalıdırhttps://<resourcename>.openai.azure.com . |
apiKey |
Modele erişmek için kullanılan gizli anahtar. Bir anahtar sağlarsanız boş bırakın authIdentity . hem ve authIdentity hem de apiKey değerini ayarlarsanız, apiKey bağlantıda kullanılır. |
deploymentId |
Dağıtılan Azure OpenAI ekleme modelinin adı. Model, text-embedding-ada-002 gibi bir ekleme modeli olmalıdır. Desteklenen modeller için Bkz. Azure OpenAI modelleri listesi. |
authIdentity |
Arama hizmeti tarafından Azure OpenAI'ye bağlanmak için kullanılan kullanıcı tarafından yönetilen kimlik. Sistem veya kullanıcı tarafından yönetilen kimlik kullanabilirsiniz. Sistem tarafından yönetilip yönetilmemiş bir kimlik kullanmak için, bırakın ve authIdentity boş bırakınapiKey . Sistem tarafından yönetilen kimlik otomatik olarak kullanılır. Yönetilen kimlik, Azure OpenAI'ye metin göndermek için Bilişsel Hizmetler OpenAI Kullanıcı izinlerine sahip olmalıdır. |
modelName |
Beceri kümesiniz 2024-05-01-preview veya 2024-07-01 REST API kullanılarak oluşturulduysa bu özellik gereklidir. Bu özelliği aracılığıyla belirtilen resourceUri ve aracılığıyla tanımlanan sağlayıcıda dağıtılan azure OpenAI ekleme modelinin dağıtım adı olarak deploymentId ayarlayın. Şu anda desteklenen değerler , text-embedding-3-large ve text-embedding-3-small şeklindedirtext-embedding-ada-002 . |
dimensions |
(İsteğe bağlı, 2024-05-01-preview REST API'sinde kullanıma sunulmuştur). Model, ekleme boyutlarını azaltmayı destekliyorsa oluşturmak istediğiniz ekleme boyutlarının boyutları. Desteklenen aralıklar aşağıda listelenmiştir. Belirtilmezse her model için varsayılan boyut üst sınırına sahiptir. 2023-10-01-preview kullanılarak oluşturulan beceri kümeleri için boyutlar 1536'da sabitlenir. |
Desteklenen boyutlar: modelName
Azure OpenAI Ekleme becerisi için desteklenen boyutlar, yapılandırılan boyuta modelName
bağlıdır.
modelName |
Minimum boyutlar | Maksimum boyutlar |
---|---|---|
metin ekleme-ada-002 | 1536 | 1536 |
metin ekleme-3-büyük | 1 | 3072 |
metin ekleme-3-küçük | 1 | 1536 |
Beceri girişleri
Giriş | Açıklama |
---|---|
text |
Vektörleştirilecek giriş metni. Veri öbekleme kullanıyorsanız, kaynak olabilir /document/pages/* . |
Beceri çıkışları
Çıktı | Açıklama |
---|---|
embedding |
Giriş metni için vektörleştirilmiş ekleme. |
Örnek tanım
Aşağıdaki alanlara sahip bir kaydı göz önünde bulundurun:
{
"content": "Microsoft released Windows 10."
}
Ardından beceri tanımınız şöyle görünebilir:
{
"@odata.type": "#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill",
"description": "Connects a deployed embedding model.",
"resourceUri": "https://my-demo-openai-eastus.openai.azure.com/",
"deploymentId": "my-text-embedding-ada-002-model",
"modelName": "text-embedding-ada-002",
"dimensions": 1536,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "embedding"
}
]
}
Örnek çıktı
Verilen giriş metni için vektörleştirilmiş bir ekleme çıkışı oluşturulur.
{
"embedding": [
0.018990106880664825,
-0.0073809814639389515,
....
0.021276434883475304,
]
}
Çıkış bellekte bulunur. Bu çıkışı arama dizinindeki bir alana göndermek için, vektörleştirilmiş ekleme çıkışını (bir dizi) bir vektör alanıyla eşleyen bir outputFieldMapping tanımlamanız gerekir. Beceri çıkışının belgenin ekleme düğümünde yer aldığını ve content_vector arama dizinindeki alan olduğunu varsayarsak, dizin oluşturucuda outputFieldMapping aşağıdaki gibi görünmelidir:
"outputFieldMappings": [
{
"sourceFieldName": "/document/embedding/*",
"targetFieldName": "content_vector"
}
]
En iyi yöntemler
Bu beceriyi kullanırken göz önünde bulundurmanız gereken en iyi uygulamalardan bazıları şunlardır:
Azure OpenAI TPM (Dakika başına belirteçler) sınırına ulaştıysanız, uygun şekilde ele alabilmeniz için kota sınırları önerisini göz önünde bulundurun. Azure OpenAI örnek performansınız hakkında daha fazla bilgi için Azure OpenAI izleme belgelerine bakın.
Bu beceri için kullandığınız Azure OpenAI ekleme modeli dağıtımı, sorgu vektörleştiricisi de dahil olmak üzere diğer kullanım örnekleri için kullanılan dağıtımdan ideal olarak ayrı olmalıdır. Bu, her dağıtımın kendi kullanım örneğine göre uyarlanmasında yardımcı olur ve iyileştirilmiş performansa yol açar ve dizin oluşturucudan gelen trafiği ve dizin ekleme çağrılarını kolayca tanımlar.
Azure OpenAI örneğiniz aynı bölgede veya en azından yapay zeka Arama hizmeti barındırıldığı bölgeye coğrafi olarak yakın olmalıdır. Bu, gecikme süresini azaltır ve hizmetler arasındaki veri aktarımının hızını artırır.
Kotalar ve sınırlar belgelerinde yayımlandığı şekilde varsayılan Azure OpenAI TPM (Dakika başına belirteç) sınırından daha büyük bir sınırınız varsa Azure AI Search ekibiyle bir destek olayı açın; böylece bu durum uygun şekilde ayarlanabilir. Bu, daha yüksek sınırlarınız varsa dizin oluşturma işleminizin belgelenen varsayılan TPM sınırı tarafından gereksiz yere yavaşlamamasını sağlar.
Bu beceriyi kullanan örnekler ve çalışan kod örnekleri için aşağıdaki bağlantılara bakın:
Hatalar ve uyarılar
Koşul | Sonuç |
---|---|
Null veya geçersiz URI | Hata |
Null veya geçersiz deploymentID | Hata |
Metin boş | Uyarı |
Metin 8.000 belirteçten büyük | Hata |