- Nov 12, 2025
- Parsed from source:Nov 12, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.11】
Release notes
- TTS 2.0音色上新 | 新音色*1,新增有声阅读音色:1个。
- TTS 1.0音色上新 | 新音色*18,新增角色扮演、多情感音色:18个。
- Oct 1, 2025
- Parsed from source:Oct 1, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.10】
TTS 1.0音色上新 | 新音色*1,新增趣味口音音色:1个。
TTS 2.0音色上新 | 新音色*11,新增通用场景、视频配音、角色扮演音色:11个。
- Sep 1, 2025
- Parsed from source:Sep 1, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.09】
Release Notes
- 已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和 语音播客v3 协议接口支持,音频格式支持mp3/wav/ogg_opus。官网接口文档→,搜索 “aigc_metadata”。
- 播客大模型已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),文档已经更新(搜索 aigc_watermark 跳转请点击→)。
- 大模型语音合成2.0版本上新:
- 推出豆包语音合成模型2.0,支持TTS对话式合成新范式(Query-Response),提供更加自然、更丰富情感、更具有表现力的语音合成效果。
- 新上线异步执行长文本任务接口:最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;
- 音色上新 | 新音色*14,新增趣味口音、角色扮演音色:14个;
- TTS(大模型) 已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),已经上线,文档已经更新(搜索 aigc_watermark 跳转请点击→)。
- Aug 1, 2025
- Parsed from source:Aug 1, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.08】
播客大模型-二期迭代功能:
- 输入支持url及文件(txt/pdf/word);
- 输出支持URL 形式返回的解析结果,链接有效期为一小时;
- 语音合成对白文本支持修改,支持客户自定义导入;
- 音色顺序可支持指定或随机;
- 支持输出每轮音频时长,调用方可依此实现时间戳;
说明:通过prompt联网搜索内容生成播客功能已上线,但效果仍有优化空间,当前可以先做体验测试。
音色上新 | 新音色*9,新增客服场景音色:9个;
音色上新 | 新音色*22,新增客服场景音色:14个;新增有声阅读、多语种、通用场景、角色扮演音色:8个;
产品升级 | TTS DMD 版本上线,较默认版本音质有提升,且延时更优。(需注意,此版本在复刻场景中会放大训练prompt的发音人的特质,因此对prompt的要求更高,使用高质量的训练音频,可以获得更优的音质效果)
Original source Report a problem - Jul 1, 2025
- Parsed from source:Jul 1, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.07】
1. 上线语音同传大模型2.0,支持两种模式
- 支持语音到语音S2S(Speech-to-Speech):语音流式输入,对语音理解翻译后,模型自动对说话人声音进行复刻,并按照说话人的音色进行目标语种语音的输出;
- 支持语音到文本S2T(Speech-to-Text):语音流式输入,对语音理解翻译后文本返回。
2. 上线语音播客大模型,对送入的播客主题文本进行分析,流式生成双人播客音频;支持断点续传。
3. 音色上新 | 新音色*1,新增通用场景音色:Vivi;
4. 音色上新 | 新音色*1,新增英语教育场景音色:Tina老师;
Original source Report a problem - Jun 1, 2025
- Parsed from source:Jun 1, 2025
- Detected by Releasebot:Dec 23, 2025
【2025.06】
上线端到端实时语音大模型,可在手机端进行体验
复刻模型,上线DIT版本
流式输出接口支持http接口
支持小语种指定参数
流式接口重采样优化
自学习平台替换词支持正则
自学习平台热词传入和context扩容至5000词
支持通过API接口创建和管理热词表、替换词表
音色上新 | 新音色*2,新增通用场景、客服场景类音色,其中暖阳女声仅支持合成中文,无法合成英文内容。
- Mar 1, 2025
- Parsed from source:Mar 1, 2025
- Detected by Releasebot:Dec 23, 2025
- Dec 1, 2024
- Parsed from source:Dec 1, 2024
- Detected by Releasebot:Dec 23, 2025
- Nov 1, 2024
- Parsed from source:Nov 1, 2024
- Detected by Releasebot:Dec 23, 2025
【2024.11】
产品升级|混音功能上线。
豆包语音合成的超强混音打破了语音合成的音色数量限制,能够精准捕捉不同声音的韵律、音色、表达方式、语气语调等特色,并将不同声音进行自由组合,比如将温柔的女声与雄浑的男声巧妙融合,创造出极具戏剧张力的语音效果,如万花筒通过组合变化出无数的声音图案。
音色上新|新音色*33,新增美式英语、英式英语、澳洲英语音色。
豆包语音合成的超强混音打破了语音合成的音色数量限制,能够精准捕捉不同声音的韵律、音色、表达方式、语气语调等特色,并将不同声音进行自由组合,比如将温柔的女声与雄浑的男声巧妙融合,创造出极具戏剧张力的语音效果,如万花筒通过组合变化出无数的声音图案。
详见https://www.volcengine.com/docs/6561/1257544
Original source Report a problem - Oct 1, 2024
- Parsed from source:Oct 1, 2024
- Detected by Releasebot:Dec 23, 2025