Skip to main content
POST
/
kling
/
v1
/
audio
/
text-to-audio
cURL
curl --request POST \
+  --url https://api.deerapi.com/kling/v1/audio/text-to-audio \
+  --header 'Authorization: Bearer <DEERAPI_KEY>' \
+  --header 'Content-Type: application/json' \
+  --data '{
    "prompt": "雨夜街道上的轮胎擦水声与远处雷鸣。",
    "duration": 5,
    "callback_url": "https://example.com/kling/callback"
  }'
{
  "code": 123,
  "message": "<string>",
  "request_id": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123
  }
}
/kling/v1/audio/text-to-audio 适合根据一句声音描述生成独立音效素材。它更像声音资产生产接口,不适合做旁白、角色配音或口播。
prompt 时优先描述你想听到什么声音,例如环境、动作、节奏和远近感,不要把镜头语言直接当成音效提示词。

快速上手

  • 按当前 schema,首个请求至少准备 promptdurationexternal_task_idcallback_url
  • duration 按当前说明取 3 到 10 秒区间内的值。
  • 第一次先用单一场景跑通,例如雨声、脚步声或金属碰撞,再逐步叠加更复杂的声场。
  • 创建成功后同时保存 task_id 和你自己的 external_task_id,方便回调落库和必要时补查。

容易误解的地方

  • 这页生成的是音效,不是带固定音色的人声;需要可控音色时改看 语音合成
  • 结果是异步返回;即使已经配置回调,业务侧也最好保留任务映射。
  • 这条路由不使用 model_name,不要把视频或图像接口的模型习惯带进来。

相关页面

语音合成

需要固定音色和语种的人声时看这里。

视频生音效

已经有视频片段,想按画面自动补声音时改走这页。

查询任务

需要补查通用 Kling 异步任务状态时可用。

Callback 协议

文生音效更适合在任务完成后直接回调到你的服务端。

Authorizations

Authorization
string
header
required

Bearer token authentication. Use your DeerAPI key.

Body

application/json

当前页面不使用 model_name;核心字段是 prompt 和 duration。

prompt
string
default:Hello
required

文本提示词 ● 内容长度不超过200字符

duration
integer
default:1
required

生成音频的时长 取值范围: ​​3.0秒至10.0秒​​,支持小数点后一位精度

external_task_id
string
default:example
required

自定义任务ID ● 用户自定义任务ID,传入不会覆盖系统生成的任务ID,但支持通过该ID进行任务查询 ● 请注意,单用户下需要保证唯一性

callback_url
string
default:example
required

本次任务结果回调通知地址,如果配置,服务端会在任务状态发生变更时主动通知

Response

200 - application/json

任务已受理,返回 task_id。后续请通过查询接口或 callback 获取最终音频结果。

code
integer
required

错误码;具体定义错误码

message
string
required

错误信息

request_id
string
required

请求ID,系统生成,用于跟踪请求、排查问题

data
object
required