Skip to main content
POST
/
v1
/
audio
/
transcriptions
音频转文本
curl --request POST \
  --url https://api.deerapi.com/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form file='@example-file' \
  --form model=whisper-1
{
  "text": "<string>"
}
audio/transcriptions接口用于将音频转录为输入语言。
您可以在此处查看官方文档了解更多。

Authorizations

Authorization
string
header
required

Bearer token authentication. Use your DeerAPI key.

Body

multipart/form-data
file
file
default:example
required

要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。

model
string
required

要使用的模型的 ID。仅whisper-1当前可用。

Example:

"whisper-1"

prompt
string

可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。

Example:

"eiusmod nulla"

response_format
string

成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。

Example:

"json"

temperature
string

采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高温度,直到达到特定阈值。

Example:

"0"

language
string

输入音频的语言。以ISO-639-1格式提供输入语言将提高准确性和延迟。

Response

200 - application/json

Successful Response

text
string
required