Riferimento: Incorporamenti | Studio AI della piattaforma Azure
Importante
Gli elementi contrassegnati (anteprima) in questo articolo sono attualmente disponibili in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero presentare funzionalità limitate. Per altre informazioni, vedere le Condizioni supplementari per l'uso delle anteprime di Microsoft Azure.
Crea un vettore di incorporamento che rappresenta il testo di input.
POST /embeddings?api-version=2024-04-01-preview
Parametri dell'URI
Nome | Tra | Richiesto | Type | Descrizione |
---|---|---|---|---|
api-version |
query | Vero | string | Versione dell'API nel formato "AAAA-MM-GG" o "AAAA-MM-GG-preview". |
Intestazione richiesta
Nome | Obbligatorio | Type | Descrizione |
---|---|---|---|
parametri aggiuntivi | string | Il comportamento dell'API quando vengono indicati parametri extra nel payload. L'utilizzo di pass-through consente all'API di passare il parametro al modello sottostante. Usare questo valore quando si desidera passare i parametri che è noto che il modello sottostante possa supportare. L'utilizzo di ignore fa in modo che l'API elimini qualsiasi parametro non supportato. Usare questo valore quando è necessario usare lo stesso payload in modelli diversi, ma uno dei parametri extra può restituire un errore per un modello, se non supportato. L'utilizzo di error fa in modo che l'API rifiuti qualsiasi parametro extra nel payload. Possono essere indicati solo i parametri specificati in questa API. In caso contrario, verrà restituito un errore 400. |
|
azureml-model-deployment | string | Nome della distribuzione a cui si desidera instradare la richiesta. Supportato per gli endpoint che supportano più distribuzioni. |
Corpo della richiesta
Nome | Obbligatorio | Type | Descrizione |
---|---|---|---|
modello | string | Nome del modello. Questo parametro viene ignorato se l'endpoint viene usato per un solo modello. | |
input | Vero | string[] | Testo di input da incorporare, codificato come stringa o array di token. Per incorporare più input in una singola richiesta, passare un array di stringhe o una matrice di array di token. |
dimensioni | integer | Numero di dimensioni che devono essere presenti negli incorporamenti di output risultanti. Restituisce un errore 422 se il modello non supporta il valore o il parametro. | |
encoding_format | EmbeddingEncodingFormat | Formato in cui restituire gli incorporamenti. Può essere base64, float, int8, uint8, binary o ubinary. Restituisce un errore 422 se il modello non supporta il valore o il parametro. | |
input_type | EmbeddingInputType | Il tipo dell'input. Deve essere text , query o document . Restituisce un errore 422 se il modello non supporta il valore o il parametro. |
Risposte
Nome | Tipo | Descrizione |
---|---|---|
200 OK | CreateEmbeddingResponse | Ok |
401 - Non autorizzato | UnauthorizedError | Token di accesso mancante o non valido Intestazioni x-ms-error-code: string |
404 Not Found | NotFoundError | Modalità non supportata dal modello. Controllare la documentazione del modello per verificare quali route sono disponibili. Intestazioni x-ms-error-code: string |
422 - Entità non elaborabile | UnprocessableContentError | La richiesta contiene contenuto non elaborabile Intestazioni x-ms-error-code: string |
429 Troppe richieste | TooManyRequestsError | È stato raggiunto il limite di frequenza assegnato e la richiesta deve essere gestita. Intestazioni x-ms-error-code: string |
Altri codici di stato | ContentFilterError | Richiesta non valida Intestazioni x-ms-error-code: string |
Sicurezza
Autorizzazione
Token con Bearer: prefix
, ad esempio Bearer abcde12345
Tipo: apiKey In: header
AADToken
Autenticazione OAuth2 di Azure Active Directory
Tipo: oauth2 Flusso: application URL token: https://login.microsoftonline.com/common/oauth2/v2.0/token
Esempi
Crea un vettore di incorporamento che rappresenta il testo di input
Richiesta di esempio
POST /embeddings?api-version=2024-04-01-preview
{
"input": [
"This is a very good text"
],
"input_type": "text",
"encoding_format": "float",
"dimensions": 1024
}
Risposta di esempio
Codice di stato: 200
{
"data": [
{
"index": 0,
"object": "embedding",
"embedding": [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
]
}
],
"object": "list",
"model": "BERT",
"usage": {
"prompt_tokens": 15,
"total_tokens": 15
}
}
Definizioni
Nome | Descrizione |
---|---|
ContentFilterError | La chiamata API ha esito negativo quando la richiesta attiva un filtro di contenuto come configurato. Modificare il prompt e riprovare. |
CreateEmbeddingRequest | Richiesta di creazione di incorporamenti. |
CreateEmbeddingResponse | Risposta da una richiesta di incorporamento. |
Detail | Dettagli degli errori. |
Incorporamento | Rappresenta l'oggetto di incorporamento generato. |
EmbeddingEncodingFormat | Formato in cui restituire gli incorporamenti. Può essere base64, float, int8, uint8, binary o ubinary. Restituisce un errore 422 se il modello non supporta il valore o il parametro. |
EmbeddingInputType | Il tipo dell'input. Deve essere text , query o document . Restituisce un errore 422 se il modello non supporta il valore o il parametro. |
EmbeddingObject | Tipo di oggetto, che è sempre "embedding". |
ListObject | Tipo di oggetto, che è sempre "list". |
NotFoundError | Il percorso non è valido per il modello distribuito. |
TooManyRequestsError | È stato raggiunto il limite di frequenza assegnato e le richieste devono essere gestite. |
UnauthorizedError | Autenticazione mancante o non valida. |
UnprocessableContentError | La richiesta presenta contenuti non elaborabili. L'errore viene restituito quando il payload indicato è valido in base a questa specifica. Tuttavia, alcune istruzioni indicate nel payload non sono supportate dal modello sottostante. Usare la sezione details per comprendere il parametro all'origine dell'errore. |
Utilizzo | Informazioni sull'utilizzo relative alla richiesta. |
ContentFilterError
La chiamata API ha esito negativo quando la richiesta attiva un filtro di contenuto come configurato. Modificare il prompt e riprovare.
Nome | Tipo | Descrizione |
---|---|---|
codice | string | Codice errore. |
Errore | string | Descrizione dell'errore. |
messaggio | string | Messaggio di errore. |
param | string | Il parametro che ha attivato il filtro contenuto. |
stato | integer | Codice di stato HTTP. |
CreateEmbeddingRequest
Richiesta di creazione di incorporamenti.
Nome | Obbligatorio | Type | Descrizione |
---|---|---|---|
input | Vero | string[] | Testo di input da incorporare, codificato come stringa o array di token. Per incorporare più input in una singola richiesta, passare un array di stringhe o una matrice di array di token. |
dimensioni | integer | Numero di dimensioni che devono essere presenti negli incorporamenti di output risultanti. Restituisce un errore 422 se il modello non supporta il valore o il parametro. | |
encoding_format | EmbeddingEncodingFormat | Formato in cui restituire gli incorporamenti. Può essere base64, float, int8, uint8, binary o ubinary. Restituisce un errore 422 se il modello non supporta il valore o il parametro. | |
input_type | EmbeddingInputType | Il tipo dell'input. Deve essere text , query o document . Restituisce un errore 422 se il modello non supporta il valore o il parametro. |
CreateEmbeddingResponse
Risposta da una richiesta di incorporamento.
Nome | Tipo | Descrizione |
---|---|---|
data | Embedding[] | Elenco degli incorporamenti generati dal modello. |
modello | string | Nome del modello usato per generare l'incorporamento. |
oggetto | ListObject | Tipo di oggetto, che è sempre "list". |
attivamente | Utilizzo | Informazioni sull'utilizzo relative alla richiesta. |
Dettagli
Dettagli dell'errore UnprocessableContentError.
Nome | Tipo | Descrizione |
---|---|---|
loc | string[] | Parametro che causa il problema |
value | string | Valore passato al parametro che causa problemi. |
Incorporamento
Rappresenta l'oggetto di incorporamento generato.
Nome | Tipo | Descrizione |
---|---|---|
embedding | [] | Il vettore di incorporamento. La lunghezza del vettore dipende dal modello usato, mentre il tipo dipende dall'elemento encoding_format usato. |
index | integer | Indice dell'incorporamento nell'elenco di incorporamenti. |
oggetto | EmbeddingObject | Tipo di oggetto, che è sempre "embedding". |
EmbeddingEncodingFormat
Formato in cui restituire gli incorporamenti. Può essere base64, float, int8, uint8, binary o ubinary. Restituisce un errore 422 se il modello non supporta il valore o il parametro.
Nome | Tipo | Descrizione |
---|---|---|
base64 | string | |
binary | string | |
float | string | |
int8 | string | |
ubinary | string | |
uint8 | string |
EmbeddingInputType
Il tipo dell'input. Deve essere text
, query
o document
. Restituisce un errore 422 se il modello non supporta il valore o il parametro.
Nome | Tipo | Descrizione |
---|---|---|
document | string | Indica che l'input rappresenta un documento memorizzato in un database vettoriale. |
query | string | Indica che l'input rappresenta query di ricerca per trovare i documenti più pertinenti nel database vettoriale. |
Testo | string | Indica che l'input è un input di testo generale. |
EmbeddingObject
Nome | Tipo | Descrizione |
---|---|---|
embedding | string |
ListObject
Il tipo di oggetto, che è sempre "elenco".
Nome | Tipo | Descrizione |
---|---|---|
list | string |
NotFoundError
Nome | Tipo | Descrizione |
---|---|---|
Errore | string | Descrizione dell'errore. |
messaggio | string | Messaggio di errore. |
stato | integer | Codice di stato HTTP. |
TooManyRequestsError
Nome | Tipo | Descrizione |
---|---|---|
Errore | string | Descrizione dell'errore. |
messaggio | string | Messaggio di errore. |
stato | integer | Codice di stato HTTP. |
UnauthorizedError
Nome | Tipo | Descrizione |
---|---|---|
Errore | string | Descrizione dell'errore. |
messaggio | string | Messaggio di errore. |
stato | integer | Codice di stato HTTP. |
UnprocessableContentError
La richiesta presenta contenuti non elaborabili. L'errore viene restituito quando il payload indicato è valido in base a questa specifica. Tuttavia, alcune istruzioni indicate nel payload non sono supportate dal modello sottostante. Usare la sezione details
per comprendere il parametro all'origine dell'errore.
Nome | Tipo | Descrizione |
---|---|---|
codice | string | Codice errore. |
detail | Detail | |
Errore | string | Descrizione dell'errore. |
messaggio | string | Messaggio di errore. |
stato | integer | Codice di stato HTTP. |
Utilizzo
Informazioni sull'utilizzo relative alla richiesta.
Nome | Tipo | Descrizione |
---|---|---|
prompt_tokens | integer | Numero di token usati dalla richiesta. |
total_tokens | integer | Numero totale di token usati dalla richiesta. |