Associazione di input di incorporamento di Azure OpenAI per Funzioni di Azure
Importante
L'estensione OpenAI di Azure per Funzioni di Azure è attualmente in anteprima.
L'associazione di input di incorporamento OpenAI di Azure consente di generare incorporamenti per gli input. L'associazione può generare incorporamenti da file o input di testo non elaborati.
Per informazioni sull'installazione e la configurazione dell'estensione OpenAI di Azure, vedere Estensioni OpenAI di Azure per Funzioni di Azure. Per altre informazioni sugli incorporamenti nel servizio Azure OpenAI, vedere Informazioni sugli incorporamenti nel servizio Azure OpenAI.
Nota
I riferimenti e gli esempi vengono forniti solo per il modello Node.js v4.
Nota
I riferimenti e gli esempi vengono forniti solo per il modello Python v2.
Nota
Anche se sono supportati entrambi i modelli di processo C#, vengono forniti solo esempi di modelli di lavoro isolati.
Esempio
In questo esempio viene illustrato come generare incorporamenti per una stringa di testo non elaborata.
[Function(nameof(GenerateEmbeddings_Http_RequestAsync))]
public async Task GenerateEmbeddings_Http_RequestAsync(
[HttpTrigger(AuthorizationLevel.Function, "post", Route = "embeddings")] HttpRequestData req,
[EmbeddingsInput("{RawText}", InputType.RawText, Model = "%EMBEDDING_MODEL_DEPLOYMENT_NAME%")] EmbeddingsContext embeddings)
{
using StreamReader reader = new(req.Body);
string request = await reader.ReadToEndAsync();
EmbeddingsRequest? requestBody = JsonSerializer.Deserialize<EmbeddingsRequest>(request);
this.logger.LogInformation(
"Received {count} embedding(s) for input text containing {length} characters.",
embeddings.Count,
requestBody?.RawText?.Length);
// TODO: Store the embeddings into a database or other storage.
}
In questo esempio viene illustrato come recuperare gli incorporamenti archiviati in un file specificato accessibile alla funzione.
[Function(nameof(GetEmbeddings_Http_FilePath))]
public async Task GetEmbeddings_Http_FilePath(
[HttpTrigger(AuthorizationLevel.Function, "post", Route = "embeddings-from-file")] HttpRequestData req,
[EmbeddingsInput("{FilePath}", InputType.FilePath, MaxChunkLength = 512, Model = "%EMBEDDING_MODEL_DEPLOYMENT_NAME%")] EmbeddingsContext embeddings)
{
using StreamReader reader = new(req.Body);
string request = await reader.ReadToEndAsync();
EmbeddingsRequest? requestBody = JsonSerializer.Deserialize<EmbeddingsRequest>(request);
this.logger.LogInformation(
"Received {count} embedding(s) for input file '{path}'.",
embeddings.Count,
requestBody?.FilePath);
// TODO: Store the embeddings into a database or other storage.
}
In questo esempio viene illustrato come generare incorporamenti per una stringa di testo non elaborata.
@FunctionName("GenerateEmbeddingsHttpRequest")
public HttpResponseMessage generateEmbeddingsHttpRequest(
@HttpTrigger(
name = "req",
methods = {HttpMethod.POST},
authLevel = AuthorizationLevel.ANONYMOUS,
route = "embeddings")
HttpRequestMessage<EmbeddingsRequest> request,
@EmbeddingsInput(name = "Embeddings", input = "{RawText}", inputType = InputType.RawText, model = "%EMBEDDING_MODEL_DEPLOYMENT_NAME%") String embeddingsContext,
final ExecutionContext context) {
if (request.getBody() == null)
{
throw new IllegalArgumentException("Invalid request body. Make sure that you pass in {\"rawText\": value } as the request body.");
}
JSONObject embeddingsContextJsonObject = new JSONObject(embeddingsContext);
context.getLogger().info(String.format("Received %d embedding(s) for input text containing %s characters.",
embeddingsContextJsonObject.getJSONObject("response")
.getJSONArray("data")
.getJSONObject(0)
.getJSONArray("embedding").length(),
request.getBody().getRawText().length()));
// TODO: Store the embeddings into a database or other storage.
return request.createResponseBuilder(HttpStatus.ACCEPTED)
.header("Content-Type", "application/json")
.build();
}
In questo esempio viene illustrato come recuperare gli incorporamenti archiviati in un file specificato accessibile alla funzione.
@FunctionName("GenerateEmbeddingsHttpFilePath")
public HttpResponseMessage generateEmbeddingsHttpFilePath(
@HttpTrigger(
name = "req",
methods = {HttpMethod.POST},
authLevel = AuthorizationLevel.ANONYMOUS,
route = "embeddings-from-file")
HttpRequestMessage<EmbeddingsRequest> request,
@EmbeddingsInput(name = "Embeddings", input = "{FilePath}", inputType = InputType.FilePath, maxChunkLength = 512, model = "%EMBEDDING_MODEL_DEPLOYMENT_NAME%") String embeddingsContext,
final ExecutionContext context) {
if (request.getBody() == null)
{
throw new IllegalArgumentException("Invalid request body. Make sure that you pass in {\"rawText\": value } as the request body.");
}
JSONObject embeddingsContextJsonObject = new JSONObject(embeddingsContext);
context.getLogger().info(String.format("Received %d embedding(s) for input file %s.",
embeddingsContextJsonObject.getJSONObject("response")
.getJSONArray("data")
.getJSONObject(0)
.getJSONArray("embedding").length(),
request.getBody().getFilePath()));
// TODO: Store the embeddings into a database or other storage.
return request.createResponseBuilder(HttpStatus.ACCEPTED)
.header("Content-Type", "application/json")
.build();
}
Gli esempi non sono ancora disponibili.
In questo esempio viene illustrato come generare incorporamenti per una stringa di testo non elaborata.
const embeddingsHttpInput = input.generic({
input: '{RawText}',
inputType: 'RawText',
type: 'embeddings',
model: '%EMBEDDING_MODEL_DEPLOYMENT_NAME%'
})
app.http('generateEmbeddings', {
methods: ['POST'],
route: 'embeddings',
authLevel: 'function',
extraInputs: [embeddingsHttpInput],
handler: async (request, context) => {
let requestBody: EmbeddingsHttpRequest = await request.json();
let response: any = context.extraInputs.get(embeddingsHttpInput);
context.log(
`Received ${response.count} embedding(s) for input text containing ${requestBody.RawText.length} characters.`
);
// TODO: Store the embeddings into a database or other storage.
return {status: 202}
}
});
In questo esempio viene illustrato come recuperare gli incorporamenti archiviati in un file specificato accessibile alla funzione.
const embeddingsFilePathInput = input.generic({
input: '{FilePath}',
inputType: 'FilePath',
type: 'embeddings',
maxChunkLength: 512,
model: '%EMBEDDING_MODEL_DEPLOYMENT_NAME%'
})
app.http('getEmbeddingsFilePath', {
methods: ['POST'],
route: 'embeddings-from-file',
authLevel: 'function',
extraInputs: [embeddingsFilePathInput],
handler: async (request, context) => {
let requestBody: EmbeddingsFilePath = await request.json();
let response: any = context.extraInputs.get(embeddingsFilePathInput);
context.log(
`Received ${response.count} embedding(s) for input file ${requestBody.FilePath}.`
);
// TODO: Store the embeddings into a database or other storage.
return {status: 202}
}
In questo esempio viene illustrato come generare incorporamenti per una stringa di testo non elaborata.
Ecco il file function.json per la generazione degli incorporamenti:
{
"bindings": [
{
"authLevel": "function",
"type": "httpTrigger",
"direction": "in",
"name": "Request",
"route": "embeddings",
"methods": [
"post"
]
},
{
"type": "http",
"direction": "out",
"name": "Response"
},
{
"name": "Embeddings",
"type": "embeddings",
"direction": "in",
"inputType": "RawText",
"input": "{RawText}",
"model": "%EMBEDDING_MODEL_DEPLOYMENT_NAME%"
}
]
}
Per altre informazioni sulle proprietà dei file function.json, vedere la sezione configurazione.
using namespace System.Net
param($Request, $TriggerMetadata, $Embeddings)
$input = $Request.Body.RawText
Write-Host "Received $($Embeddings.Count) embedding(s) for input text containing $($input.Length) characters."
Push-OutputBinding -Name Response -Value ([HttpResponseContext]@{
StatusCode = [HttpStatusCode]::Accepted
})
In questo esempio viene illustrato come generare incorporamenti per una stringa di testo non elaborata.
@app.function_name("GenerateEmbeddingsHttpRequest")
@app.route(route="embeddings", methods=["POST"])
@app.embeddings_input(arg_name="embeddings", input="{rawText}", input_type="rawText", model="%EMBEDDING_MODEL_DEPLOYMENT_NAME%")
def generate_embeddings_http_request(req: func.HttpRequest, embeddings: str) -> func.HttpResponse:
user_message = req.get_json()
embeddings_json = json.loads(embeddings)
embeddings_request = {
"raw_text": user_message.get("RawText"),
"file_path": user_message.get("FilePath")
}
logging.info(f'Received {embeddings_json.get("count")} embedding(s) for input text '
f'containing {len(embeddings_request.get("raw_text"))} characters.')
# TODO: Store the embeddings into a database or other storage.
return func.HttpResponse(status_code=200)
Attributi
Applicare l'attributo EmbeddingsInput
per definire un'associazione di input di incorporamento, che supporta questi parametri:
Parametro | Descrizione |
---|---|
Input | Stringa di input per cui generare incorporamenti. |
Modello | Facoltativo. ID del modello da usare, che per impostazione predefinita è text-embedding-ada-002 . Non è consigliabile modificare il modello per un database esistente. Per altre informazioni, vedere Utilizzo. |
MaxChunkLength | Facoltativo. Numero massimo di caratteri utilizzati per la suddivisione in blocchi dell'input. Per altre informazioni, vedere Utilizzo. |
MaxOverlap | Facoltativo. Ottiene o imposta il numero massimo di caratteri da sovrapporre tra blocchi. |
InputType | Facoltativo. Ottiene il tipo dell'input. |
Annotazioni
L'annotazione EmbeddingsInput
consente di definire un'associazione di input di incorporamento, che supporta questi parametri:
Elemento | Descrizione |
---|---|
name | Ottiene o imposta il nome del binding di input. |
input | Stringa di input per cui generare incorporamenti. |
model | Facoltativo. ID del modello da usare, che per impostazione predefinita è text-embedding-ada-002 . Non è consigliabile modificare il modello per un database esistente. Per altre informazioni, vedere Utilizzo. |
maxChunkLength | Facoltativo. Numero massimo di caratteri utilizzati per la suddivisione in blocchi dell'input. Per altre informazioni, vedere Utilizzo. |
maxOverlap | Facoltativo. Ottiene o imposta il numero massimo di caratteri da sovrapporre tra blocchi. |
inputType | Facoltativo. Ottiene il tipo dell'input. |
Elementi Decorator
Durante l'anteprima, definire l'associazione di input come associazione generic_input_binding
di tipo embeddings
, che supporta questi parametri: embeddings
decorator supporta questi parametri:
Parametro | Descrizione |
---|---|
arg_name | Nome della variabile che rappresenta il parametro di associazione. |
input | Stringa di input per cui generare incorporamenti. |
model | Facoltativo. ID del modello da usare, che per impostazione predefinita è text-embedding-ada-002 . Non è consigliabile modificare il modello per un database esistente. Per altre informazioni, vedere Utilizzo. |
maxChunkLength | Facoltativo. Numero massimo di caratteri utilizzati per la suddivisione in blocchi dell'input. Per altre informazioni, vedere Utilizzo. |
max_overlap | Facoltativo. Ottiene o imposta il numero massimo di caratteri da sovrapporre tra blocchi. |
input_type | Ottiene il tipo dell'input. |
Impostazione
L'associazione supporta queste proprietà di configurazione impostate nel file function.json.
Proprietà | Descrizione |
---|---|
type | Deve essere EmbeddingsInput . |
direction | Deve essere in . |
name | Nome dell'associazione di input. |
input | Stringa di input per cui generare incorporamenti. |
model | Facoltativo. ID del modello da usare, che per impostazione predefinita è text-embedding-ada-002 . Non è consigliabile modificare il modello per un database esistente. Per altre informazioni, vedere Utilizzo. |
maxChunkLength | Facoltativo. Numero massimo di caratteri utilizzati per la suddivisione in blocchi dell'input. Per altre informazioni, vedere Utilizzo. |
maxOverlap | Facoltativo. Ottiene o imposta il numero massimo di caratteri da sovrapporre tra blocchi. |
inputType | Facoltativo. Ottiene il tipo dell'input. |
Impostazione
Il binding supporta queste proprietà, definite nel codice:
Proprietà | Descrizione |
---|---|
input | Stringa di input per cui generare incorporamenti. |
model | Facoltativo. ID del modello da usare, che per impostazione predefinita è text-embedding-ada-002 . Non è consigliabile modificare il modello per un database esistente. Per altre informazioni, vedere Utilizzo. |
maxChunkLength | Facoltativo. Numero massimo di caratteri utilizzati per la suddivisione in blocchi dell'input. Per altre informazioni, vedere Utilizzo. |
maxOverlap | Facoltativo. Ottiene o imposta il numero massimo di caratteri da sovrapporre tra blocchi. |
inputType | Facoltativo. Ottiene il tipo dell'input. |
Per esempi completi, vedere la sezione di esempio.
Utilizzo
La modifica degli incorporamenti predefiniti model
modifica la modalità di archiviazione degli incorporamenti nel database vettoriale. La modifica del modello predefinito può causare l'avvio errato delle ricerche quando non corrispondono al resto dei dati inseriti in precedenza nel database vettoriale. Il modello predefinito per gli incorporamenti è text-embedding-ada-002
.
Quando si calcola la lunghezza massima dei caratteri per i blocchi di input, tenere presente che il numero massimo di token di input consentiti per i modelli di incorporamento di input di seconda generazione come text-embedding-ada-002
è 8191
. Un singolo token è di circa quattro caratteri di lunghezza (in inglese), che si traduce in circa 32.000 caratteri di input che possono essere inseriti in un singolo blocco.