DALL-E モデルを使用する方法
OpenAI の DALL-E モデルは、ユーザーが指定したテキスト プロンプトに基づいて画像を生成します。 このガイドでは、DALL-E モデルの使用方法と、REST API 呼び出しを使ってそのオプションを構成する方法について説明します。
前提条件
- Azure サブスクリプション。 無料で作成できます。
- "スウェーデン中部" リージョンに作成された Azure OpenAI リソース。 詳細については、「Azure OpenAI Service リソースの作成とデプロイ」を参照してください。
- Azure OpenAI リソースを使用して dall-e-3 モデルをデプロイする。
画像生成 API を呼び出す
次のコマンドは、コードで DALL-E を使う最も基本的な方法を示しています。 これらのモデルをプログラムで初めて使う場合は、DALL-E のクイックスタートから始めることをお勧めします。
POST 要求を次の宛先に送信します。
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
次のプレースホルダーを置き換えます。
<your_resource_name>
は、Azure OpenAI リソースの名前です。<your_deployment_name>
は、DALL-E 3 モデル デプロイの名前です。<api_version>
は、使う API のバージョンです。 たとえば、2024-02-01
のようにします。
必須のヘッダー:
Content-Type
:application/json
api-key
:<your_API_key>
本文は次のようになります。
要求本文の例を次に示します。 いくつかのオプションを指定します。これらについては、後のセクションで定義します。
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
出力
成功した画像生成 API 呼び出しからの出力は次の例のようになります。 url
フィールドには、生成画像をダウンロードできる URL が含まれています。 URL は 24 時間アクティブなままです。
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API 呼び出しの拒否
プロンプトと画像は、コンテンツ ポリシーに基づいてフィルター処理され、プロンプトまたは画像にフラグが設定されるとエラーが返されます。
プロンプトにフラグが設定されている場合、メッセージの error.code
値は contentFilter
に設定されます。 次に例を示します。
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
生成画像自体がフィルター処理される可能性もあります。 この場合、エラー メッセージは、"生成された画像は安全システムによりフィルター処理されました" に設定されます。 次に例を示します。
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
画像プロンプトの書き込み
画像プロンプトでは、画像に表示するコンテンツと、画像の視覚的なスタイルを記述する必要があります。
プロンプトを記述するときは、画像生成 API には、コンテンツ モデレーション フィルターが付属していることを考慮します。 サービスがプロンプトを有害なコンテンツとして認識した場合、画像は生成されません。 詳細については、「コンテンツ フィルター」を参照してください。
ヒント
テキスト プロンプトを調整してさまざまな種類の画像を生成する方法については、イメージ プロンプト エンジニアリング ガイドを参照してください。
API オプションを指定する
DALL-E 画像の生成には、次の API 本文パラメーターを使えます。
サイズ
生成される画像のサイズを指定します。 DALL-E 3 モデルの 1024x1024
、1792x1024
、または 1024x1792
のいずれかである必要があります。 正方形の画像は生成が速くなります。
スタイル
DALL-E 3 には、natural
と vivid
の 2 つのスタイル オプションが導入されています。 natural スタイルは DALL-E 2 の既定のスタイルに似ていますが、vivid スタイルでは、よりリアルで映画のような画像が生成されます。
natural スタイルは、よりシンプルで、落ち着いた、またはリアルであることを意図した主題が、DALL-E 3 で誇張または混同される場合に役立ちます。
既定値は vivid
です。
Quality
画質には、hd
と standard
の 2 つのオプションがあります。 hd オプションの場合、よりきめ細かく、全体の一貫性が高い画像が作成されます。 standard の画像は、より高速に生成できます。
既定値は standard
です。
番号
DALL-E 3 では、1 つの API 呼び出しで複数の画像を生成することはできません。n
パラメーターを 1 に設定する必要があります。 一度に複数の画像を生成する必要がある場合は、並列要求を実行します。
応答形式
生成された画像が返される形式です。 url
(画像を指す URL) または b64_json
(JSON 形式の Base 64 バイト コード) のいずれかである必要があります。 既定値は、url
です。