使用 CogTTS 将文本转换为自然语音,支持多种声音、情感控制和语调调整。
要使用的TTS模型
cogtts 要转换为语音的文本
1024生成音频时使用的音色,支持系统音色以及复刻音色两种类型,其中系统音色如下:
tongtong: 彤彤,默认音色
chuichui: 锤锤
xiaochen: 小陈
jam: 动动动物圈jam音色
kazi: 动动动物圈kazi音色
douji: 动动动物圈douji音色
luodo: 动动动物圈luodo音色
tongtong, chuichui, xiaochen, jam, kazi, douji, luodo 是否启用流式输出。
true: 启用流式输出,模型将通过标准Event Stream逐块返回生成的音频内容。false: 关闭流式输出,模型在生成所有内容后一次性返回所有内容。默认值为false。语速,默认1.0,取值范围[0.5, 2]
音量,默认1.0,取值范围(0, 10]
仅流式返回时,决定返回的编码格式。默认返回对应音频文件格式的base64字符串。
base64, hex 音频输出格式,默认返回pcm格式的文件。流式生成音频时,仅支持返回pcm格式的文件
wav, pcm 控制AI生成音频时是否添加水印。
true: 默认启用AI生成的显式水印及隐式数字水印,符合政策要求。false: 关闭所有水印,仅允许已签署免责声明的客户使用,签署路径:个人中心-安全管理-去水印管理true
业务处理成功
The response is of type file.