Informazioni su come usare i modelli DALL-E
I modelli DALL-E di OpenAI generano immagini in base alle richieste di testo fornite dall'utente. Questa guida illustra come usare i modelli DALL-E e configurare le relative opzioni tramite chiamate API REST.
Prerequisiti
- Una sottoscrizione di Azure. Crearne una gratuitamente.
- Una risorsa OpenAI di Azure creata nell'area
SwedenCentral
. - È quindi necessario distribuire un modello
dalle3
con la risorsa di Azure. Per altre informazioni, vedere Creare una risorsa e distribuire un modello con Azure OpenAI.
Chiamare le API di generazione di immagini
Il comando seguente illustra il modo più semplice per usare DALL-E con il codice. Se è la prima volta che si usano questi modelli a livello di codice, è consigliabile iniziare con la guida introduttiva per DALL-E.
Inviare una richiesta POST a:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
dove:
<your_resource_name>
è il nome della risorsa OpenAI di Azure.<your_deployment_name>
è il nome della distribuzione del modello DALL-E 3.<api_version>
è la versione dell'API che si vuole usare. Ad esempio:2024-02-01
.
Intestazioni obbligatorie:
Content-Type
:application/json
api-key
:<your_API_key>
Corpo:
Di seguito è riportato il corpo di una richiesta di esempio. È possibile specificare una serie di opzioni, definite nelle sezioni successive.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Output
L'output di una chiamata API di generazione di immagini ha un aspetto simile all'esempio seguente. Il campo url
contiene un URL in cui è possibile scaricare l'immagine generata. L'URL rimane attivo per 24 ore.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Rifiuto delle chiamate API
Le richieste e le immagini vengono filtrate in base ai criteri di contenuto, restituendo un errore quando viene contrassegnata una richiesta o un'immagine.
Se la richiesta viene contrassegnata, il valore error.code
nel messaggio viene impostato su contentFilter
. Ecco un esempio:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
È anche possibile che l'immagine generata sia filtrata. In questo caso, il messaggio di errore è impostato su Generated image was filtered as a result of our safety system.
. Ecco un esempio:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Scrittura di richieste di immagini
Le richieste di immagini devono descrivere il contenuto che si vuole visualizzare nell'immagine, nonché lo stile visivo dell'immagine.
Quando si scrivono richieste, tenere in considerazione il fatto che le API di generazione di immagini sono dotate di un filtro di moderazione del contenuto. Se il servizio riconosce la richiesta come contenuto dannoso, non genera un'immagine. Per altre informazioni, vedere Filtro del contenuto.
Suggerimento
Per un'analisi approfondita del modo in cui è possibile modificare le richieste di testo per generare diversi tipi di immagini, vedere la guida di progettazione dei prompt delle immagini.
Specificare le opzioni dell'API
I parametri del corpo dell'API seguenti sono disponibili per la generazione di immagini DALL-E.
Dimensione
Specificare le dimensioni delle immagini generate. Deve essere una delle opzioni 1024x1024
, 1792x1024
o 1024x1792
per i modelli DALL-E 3. Le immagini quadrate sono più veloci da generare.
Style
DALL-E 3 introduce due opzioni di stile: natural
e vivid
. Lo stile natural
è più simile allo stile predefinito di DALL-E 2, mentre lo stile vivid
genera immagini più iperrealistiche e cinematografiche.
Lo stile natural
è utile nei casi in cui DALL-E 3 complica eccessivamente o confonde un soggetto che deve essere più semplice, tenue o realistico.
Il valore predefinito è vivid
.
Qualità
Sono disponibili due opzioni per la qualità dell'immagine: hd
e standard
. hd
crea immagini con dettagli più definiti e maggiore coerenza nell'immagine. Le immagini standard
possono essere generate più velocemente.
Il valore predefinito è standard
.
Numero
Con DALL-E 3 non è possibile generare più immagini in una singola chiamata API: il parametro n deve essere impostato su 1
. Se è necessario generare più immagini contemporaneamente, effettuare richieste parallele.
Formato della risposta
Formato in cui vengono restituite le immagini generate. Deve essere uno dei url
(un URL che punta all'immagine) o b64_json
(il codice in base 64 byte in formato JSON). Il valore predefinito è url
.