DeerAPI 音频转文本接口文档:通过 POST /v1/audio/transcriptions 将音频转录为输入语言,提供统一的 OpenAI 兼容调用方式。
curl --request POST \
--url https://api.deerapi.com/v1/audio/transcriptions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: multipart/form-data' \
--form file='@example-file' \
--form model=whisper-1{
"text": "<string>"
}audio/transcriptions接口用于将音频转录为输入语言。Bearer token authentication. Use your DeerAPI key.
要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
要使用的模型的 ID。仅whisper-1当前可用。
"whisper-1"
可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。
"eiusmod nulla"
成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。
"json"
采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高温度,直到达到特定阈值。
"0"
输入音频的语言。以ISO-639-1格式提供输入语言将提高准确性和延迟。
Successful Response
curl --request POST \
--url https://api.deerapi.com/v1/audio/transcriptions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: multipart/form-data' \
--form file='@example-file' \
--form model=whisper-1{
"text": "<string>"
}