Naučte se generovat vkládání pomocí Azure OpenAI.

Vkládání je speciální formát reprezentace dat, který lze snadno využít modely a algoritmy strojového učení. Vkládání je informace hustá reprezentace sémantického významu části textu. Každé vložení je vektor čísel s plovoucí desetinou čárkou, aby vzdálenost mezi dvěma vkládáními ve vektorovém prostoru odpovídala sémantické podobnosti mezi dvěma vstupy v původním formátu. Pokud jsou například dva texty podobné, měly by být jejich vektorové reprezentace také podobné. Vkládání hledání vektorů výkonu ve službě Azure Database, jako je Azure Cosmos DB pro virtuální jádro MongoDB, Azure SQL Database nebo Azure Database for PostgreSQL – flexibilní server.

Jak získat vkládání

Abychom získali vektor vložení pro část textu, vytvoříme požadavek na koncový bod embeddings, jak je znázorněno v následujících fragmentech kódu:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Osvědčené postupy

Ověření, že vstupy nepřekračují maximální délku

  • Maximální délka vstupního textu pro naše nejnovější modely vkládání je 8192 tokenů. Před vytvořením požadavku byste měli ověřit, že vaše vstupy tento limit nepřekračují.
  • Pokud odesíláte pole vstupů v jednom požadavku na vložení, maximální velikost pole je 2048.

Omezení a rizika

Naše modely vkládání můžou být v určitých případech nespolehlivé nebo představují sociální rizika a mohou způsobit škodu při absenci zmírnění rizik. Další informace o tom, jak přistoupit k zodpovědnému používání, najdete v našem obsahu zodpovědné umělé inteligence.

Další kroky