Skip to main content
POST
/
kling
/
v1
/
videos
/
identify-face
cURL
curl --request POST \
+  --url https://api.deerapi.com/kling/v1/videos/identify-face \
+  --header 'Authorization: Bearer <DEERAPI_KEY>' \
+  --header 'Content-Type: application/json' \
+  --data '{
    "video_url": "https://example.com/lipsync-source.mp4"
  }'
{
  "code": 123,
  "message": "<string>",
  "request_id": "<string>",
  "data": {
    "session_id": "<string>",
    "face_data": [
      {
        "face_id": "<string>",
        "face_image": "<string>",
        "start_time": 123,
        "end_time": 123
      }
    ]
  }
}
/kling/v1/videos/identify-face 是对口型工作流的第一步。它先识别视频里有哪些可用人脸,再把 session_id 和可选人脸信息交给下游创建任务。

推荐流程

1

先准备可识别的视频

首轮建议用标准 MP4MOV,并保证主体清晰、镜头不要切得过碎。
2

提交识别请求

这一步的最小输入就是 video_url。先把识别链路跑通,再考虑更复杂的音频和时间线配置。
3

保存中间结果

成功后立刻保存 session_id 以及后续要选的人脸信息。它们是下游创建对口型任务的前置条件。
4

进入创建任务阶段

识别完成后,继续看 【对口型】创建任务
这一步返回的是工作流中间态,不是最终视频结果。不要把识别页当成最终交付接口。

容易踩坑的地方

  • 视频里频繁切镜、长时间侧脸或遮挡严重,导致可用人脸不稳定。
  • 拿到 session_id 后没有保存,后续又重复跑识别。
  • 你要的是从头像图生成说话视频,却误用了对口型流程;那种场景应改看 Kling 数字人创建任务

相关页面

Authorizations

Authorization
string
header
required

Bearer token authentication. Use your DeerAPI key.

Body

application/json

当前页面不使用 model_name;识别完成后重点关注 session_id 是否获取成功。

video_url
string
default:example
required

用于指定视频,并判断视频是否可用于对口型服务 视频文件支持.mp4/.mov,文件大小不超过100MB,视频时长不超过60s且不短于2s,仅支持720p和1080p、长宽的边长均位于512px~2160px之间,上述校验不通过会返回错误码等信息 系统会校验视频内容,如有问题会返回错误码等信息

Response

200 - application/json

识别完成,返回 session_id 与可用人脸区间。后续请把这些结果传给 advanced lip sync 创建接口。

code
integer
required

具体定义见错误码

message
string
required

错误信息

request_id
string
required

系统生成,用于跟踪请求、排查问题

data
object
required