Informazioni su come usare i modelli DALL-E

I modelli DALL-E di OpenAI generano immagini in base alle richieste di testo fornite dall'utente. Questa guida illustra come usare i modelli DALL-E e configurare le relative opzioni tramite chiamate API REST.

Prerequisiti

Chiamare le API di generazione di immagini

Il comando seguente illustra il modo più semplice per usare DALL-E con il codice. Se è la prima volta che si usano questi modelli a livello di codice, è consigliabile iniziare con la guida introduttiva per DALL-E.

Inviare una richiesta POST a:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

dove:

  • <your_resource_name> è il nome della risorsa OpenAI di Azure.
  • <your_deployment_name> è il nome della distribuzione del modello DALL-E 3.
  • <api_version> è la versione dell'API che si vuole usare. Ad esempio: 2024-02-01.

Intestazioni obbligatorie:

  • Content-Type: application/json
  • api-key: <your_API_key>

Corpo:

Di seguito è riportato il corpo di una richiesta di esempio. È possibile specificare una serie di opzioni, definite nelle sezioni successive.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Output

L'output di una chiamata API di generazione di immagini ha un aspetto simile all'esempio seguente. Il campo url contiene un URL in cui è possibile scaricare l'immagine generata. L'URL rimane attivo per 24 ore.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rifiuto delle chiamate API

Le richieste e le immagini vengono filtrate in base ai criteri di contenuto, restituendo un errore quando viene contrassegnata una richiesta o un'immagine.

Se la richiesta viene contrassegnata, il valore error.code nel messaggio viene impostato su contentFilter. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

È anche possibile che l'immagine generata sia filtrata. In questo caso, il messaggio di errore è impostato su Generated image was filtered as a result of our safety system.. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Scrittura di richieste di immagini

Le richieste di immagini devono descrivere il contenuto che si vuole visualizzare nell'immagine, nonché lo stile visivo dell'immagine.

Quando si scrivono richieste, tenere in considerazione il fatto che le API di generazione di immagini sono dotate di un filtro di moderazione del contenuto. Se il servizio riconosce la richiesta come contenuto dannoso, non genera un'immagine. Per altre informazioni, vedere Filtro del contenuto.

Suggerimento

Per un'analisi approfondita del modo in cui è possibile modificare le richieste di testo per generare diversi tipi di immagini, vedere la guida di progettazione dei prompt delle immagini.

Specificare le opzioni dell'API

I parametri del corpo dell'API seguenti sono disponibili per la generazione di immagini DALL-E.

Dimensione

Specificare le dimensioni delle immagini generate. Deve essere una delle opzioni 1024x1024, 1792x1024 o 1024x1792 per i modelli DALL-E 3. Le immagini quadrate sono più veloci da generare.

Style

DALL-E 3 introduce due opzioni di stile: natural e vivid. Lo stile natural è più simile allo stile predefinito di DALL-E 2, mentre lo stile vivid genera immagini più iperrealistiche e cinematografiche.

Lo stile natural è utile nei casi in cui DALL-E 3 complica eccessivamente o confonde un soggetto che deve essere più semplice, tenue o realistico.

Il valore predefinito è vivid.

Qualità

Sono disponibili due opzioni per la qualità dell'immagine: hd e standard. hd crea immagini con dettagli più definiti e maggiore coerenza nell'immagine. Le immagini standard possono essere generate più velocemente.

Il valore predefinito è standard.

Numero

Con DALL-E 3 non è possibile generare più immagini in una singola chiamata API: il parametro n deve essere impostato su 1. Se è necessario generare più immagini contemporaneamente, effettuare richieste parallele.

Formato della risposta

Formato in cui vengono restituite le immagini generate. Deve essere uno dei url (un URL che punta all'immagine) o b64_json (il codice in base 64 byte in formato JSON). Il valore predefinito è url.

Passaggi successivi