UniAPI API Doc
首页全部OpenAI平台接口音乐模型图像模型视频模型
首页全部OpenAI平台接口音乐模型图像模型视频模型
  1. Audio
  • Audio
    • 文本生成音频
      POST
    • 音频转文本
      POST
    • 创建转录
      POST
  • Chat
    • 聊天接口
      POST
  • Completions
    • 自动补全
      POST
  • Embeddings
    • 向量接口
      POST
  • Images
    • 图像编辑
      POST
    • 图像生成
      POST
    • 图像变体
      POST
  • Models
    • 获取模型列表
      GET
  • Moderations
    • 审核
      POST
  • Responses
    • response
      POST
  1. Audio

文本生成音频

POST
/v1/audio/speech
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.uniapi.io/v1/audio/speech' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "string",
    "input": "string",
    "instructions": "string",
    "voice": "string",
    "response_format": "mp3",
    "speed": 1
}'

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数application/json
model
必需
输入TTS models: tts-1, tts-1-hd or gpt-4o-mini-tts.
Any of
input
string 
必需
要生成音频的文本。最大长度为4096个字符。
<= 4096 字符
instructions
string 
可选
控制您生成的音频的语音,使用附加指令。不与tts-1或tts-1-hd兼容。
<= 4096 字符
voice
VoiceIdsShared
必需
使用生成音频时的声音。支持的声音有 alloy、ash、ballad、coral、echo、fable、onyx、nova、sage、shimmer 和 verse
Any of
示例值:
ash
response_format
enum<string> 
可选
输入音频的格式。支持的格式有 mp3、opus、aac、flac、wav 和 pcm。
枚举值:
mp3opusaacflacwavpcm
默认值:
mp3
speed
number 
可选
生成的音频速度。从 0.25 到 4.0 选择一个值。1.0 是默认值。
>= 0.25<= 4
默认值:
1
示例

返回响应

🟢200成功
application/octet-stream
OK
Headers
Transfer-Encoding
string 
chunked
可选
Body
string <binary>
可选
修改于 2025-05-18 07:36:21
下一页
音频转文本
Built with