Skip to main content
POST
/
v1
/
images
/
generations
curl --request POST \ --url https://api.deerapi.com/v1/images/generations \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "gpt-image-2", "prompt": "A cute baby sea otter" } '
{
  "created": 1776841965,
  "usage": {
    "prompt_tokens": 0,
    "completion_tokens": 0,
    "total_tokens": 224,
    "prompt_tokens_details": {
      "cached_tokens_details": {}
    },
    "completion_tokens_details": {},
    "input_tokens": 16,
    "output_tokens": 208,
    "input_tokens_details": {
      "text_tokens": 16,
      "cached_tokens_details": {}
    },
    "claude_cache_creation_5_m_tokens": 0,
    "claude_cache_creation_1_h_tokens": 0
  },
  "data": [
    {
      "b64_json": "<base64-image-data>"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://apidoc.deerapi.com/llms.txt

Use this file to discover all available pages before exploring further.

概述

images/generations 是 OpenAI 的图像生成接口,通过文本提示词创建高质量的图像内容。

官方参考

核心特性

  • 文本到图像生成:根据自然语言描述生成图像
  • 多种尺寸支持:支持不同分辨率的图像输出
  • 灵活的输出格式:支持 URL 返回,也支持在 b64_json 中返回编码后的图片数据
  • 批量生成:一次请求可生成多张图像
  • 风格控制:通过提示词精确控制图像风格和细节
如果你要先最小调通,优先使用 API 参考里的已验证 request example,再逐步增加质量、风格或批量参数。

重要说明与常见问题

⚠️ 内容政策
生成的图像内容必须遵守 OpenAI 的使用政策,不得生成违规、暴力、色情或侵犯版权的内容。
⚠️ 返回格式
使用 dall-e-2dall-e-3 时,可以根据模型能力请求 urlb64_json。URL 仅在图像生成后有效 60 分钟。GPT 图像模型不使用 response_format;如需指定图片编码格式,请使用 output_format
⚠️ 参数变化较快
当你需要判断 backgroundoutput_compression、流式输出等模型专属参数是否仍然适用时,优先以 OpenAI image generation guide 为准。
注意 “qwen-image” 模型时不需要传参数 “n”,仅能输出一张

Authorizations

Authorization
string
header
required

Bearer token authentication. Use your DeerAPI key.

Body

application/json
model
string
default:dall-e-3
required

图像生成使用的模型。支持 dall-e-2dall-e-3、GPT 图像模型(gpt-image-2gpt-image-1gpt-image-1-minigpt-image-1.5)以及其他图像模型(如 qwen-image)。查看 DeerAPI 支持的完整模型列表

prompt
string
default:A cute baby sea otter
required

描述所需图像的文字提示词。不同模型的最大长度限制:

  • dall-e-2:最多 1000 个字符
  • dall-e-3:最多 4000 个字符
  • gpt-image-1 系列:支持较长的描述

提示词越详细,生成的图像质量越高。

n
integer

生成的图像数量。dall-e-2 支持 1–10 张;dall-e-3gpt-image-1 系列目前仅支持 1 张。

size
string

生成图像的尺寸,不同模型支持的尺寸如下:

  • dall-e-2256x256512x5121024x1024
  • dall-e-31024x10241792x1024(宽屏)、1024x1792(竖屏)
  • gpt-image-1 系列:1024x10241536x10241024x1536auto
quality
string

图像生成的质量等级。具体取值会随模型变化;最新的模型专属取值请参考 OpenAI image generation guide。

style
enum<string>

图像风格(仅 dall-e-3 支持)。vivid(鲜艳超现实风格,默认)或 natural(自然、写实风格)。

Available options:
vivid,
natural
response_format
enum<string>

响应中图像的返回格式。url(返回可访问的图片 URL,60 分钟内有效)或 b64_json(返回 base64 编码的图片数据)。该参数适用于 dall-e-2dall-e-3,不适用于 GPT 图像模型。

Available options:
url,
b64_json
output_format
string

GPT 图像模型结果的图片编码格式,例如 pngjpegwebp。最新的 GPT 图像输出控制请参考 OpenAI image generation guide。

Example:

"jpeg"

Response

200 - application/json

Successful Response

created
integer
required

图像生成任务完成时的Unix时间戳

data
object[]
required

一个包含所生成图像信息的列表。

usage
object
required