Volcengine Release Notes
Last updated: Feb 13, 2026
- Nov 12, 2025
- Date parsed from source:Nov 12, 2025
- First seen by Releasebot:Feb 13, 2026
【2025.11】
TTS 2.0 推出全新有声阅读音色 为儿童绘本场景带来沉浸式讲读 TTS 1.0 新增18款情感与角色扮演音色 覆盖多种语气与风格 丰富语音表现 新音色已上线 提供更多个性化语音选项
1. TTS 2.0音色上新 | 新音色*1,新增有声阅读音色:1个。
语种 类别 名称 Speaker
- 中文 有声阅读 儿童绘本 zh_female_xueayi_saturn_bigtts
2. TTS 1.0音色上新 | 新音色*18,新增角色扮演、多情感音色:18个。
语种 类别 名称 Speaker
- 中文 角色扮演 寡言小哥 ICL_zh_male_xiaoge_v1_tob
- 中文 角色扮演 清朗温润 ICL_zh_male_renyuwangzi_v1_tob
- 中文 角色扮演 潇洒随性 ICL_zh_male_xiaosha_v1_tob
- 中文 角色扮演 清冷矜贵 ICL_zh_male_liyisheng_v1_tob
- 中文 角色扮演 沉稳优雅 ICL_zh_male_qinglen_v1_tob
- 中文 角色扮演 清逸苏感 ICL_zh_male_chongqingzhanzhan_v1_tob
- 中文 角色扮演 温柔内敛 ICL_zh_male_xingjiwangzi_v1_tob
- 中文 角色扮演 低沉缱绻 ICL_zh_male_sigeshiye_v1_tob
- 中文 角色扮演 蓝银草魂师 ICL_zh_male_lanyingcaohunshi_v1_tob
- 中文 角色扮演 清冷高雅 ICL_zh_female_liumengdie_v1_tob
- 中文 角色扮演 甜美娇俏 ICL_zh_female_linxueying_v1_tob
- 中文 角色扮演 柔骨魂师 ICL_zh_female_rouguhunshi_v1_tob
- 中文 角色扮演 甜美活泼 ICL_zh_female_tianmei_v1_tob
- 中文 角色扮演 成熟温柔 ICL_zh_female_chengshu_v1_tob
- 中文 角色扮演 贴心闺蜜 ICL_zh_female_xnx_v1_tob
- 中文 角色扮演 温柔白月光 ICL_zh_female_yry_v1_tob
- 中文 角色扮演 高冷沉稳 zh_male_bv139_audiobook_ummv3_bigtts
- 中文 多情感 深夜播客 zh_male_shenyeboke_emo_v2_mars_bigtts
- Nov 12, 2025
- Date parsed from source:Nov 12, 2025
- First seen by Releasebot:Dec 23, 2025
【2025.11】
Release notes
- TTS 2.0音色上新 | 新音色*1,新增有声阅读音色:1个。
- TTS 1.0音色上新 | 新音色*18,新增角色扮演、多情感音色:18个。
All of your release notes in one feed
Join Releasebot and get updates from Volcengine and hundreds of other software products.
- Oct 1, 2025
- Date parsed from source:Oct 1, 2025
- First seen by Releasebot:Dec 23, 2025
- Modified by Releasebot:Jan 25, 2026
- Sep 1, 2025
- Date parsed from source:Sep 1, 2025
- First seen by Releasebot:Jan 8, 2026
【2025.09】
已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和语音播客v3 协议接口支持,音频格式支持 mp3/wav/ogg_opus。官网接口文档 → 链接,搜索 “aigc_metadata”。
Original source Report a problem - Sep 1, 2025
- Date parsed from source:Sep 1, 2025
- First seen by Releasebot:Jan 8, 2026
【2025.09】
新上线 异步执行长文本任务接口
最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;
Original source Report a problem - Sep 1, 2025
- Date parsed from source:Sep 1, 2025
- First seen by Releasebot:Dec 25, 2025
- Modified by Releasebot:Feb 10, 2026
【2025.09】
新一轮大模型语音合成与识别升级上线,包含隐式与显式水印、2.0 版本豆包语音合成、异步长文本任务、新增音色与趣味口音、以及大模型录音/流式识别的提升与多语言支持,显著提升自然度、情感表现与处理效率。
已支持隐式 meta 水印写入
已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和 语音播客v3 协议接口支持,音频格式支持mp3/wav/ogg_opus。官网接口文档→ 链接 ,搜索 “aigc_metadata”。
播客大模型已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),文档已经更新(搜索 aigc_watermark 跳转请点击→ 链接 )。
大模型语音合成2.0版本上新
- 推出豆包语音合成模型2.0,支持TTS对话式合成新范式(Query-Response),提供更加自然、更丰富情感、更具有表现力的语音合成效果。
- 新上线异步执行长文本任务接口:最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;
- 音色上新 | 新音色*14,新增趣味口音、角色扮演音色:14个;
- TTS(大模型) 已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),已经上线,文档已经更新(搜索 aigc_watermark 跳转请点击→ 链接 )。
大模型录音文件闲时版上线
- 整体产品效果及功能同大模型录音文件识别标准版,时效性24小时内完成处理,适用于大批量、对时效性要求较低的录音文件识别任务处理,价格相比于标准版更加实惠;(接口文档→ 链接 )
大模型流式语音识别-地址/音乐优化
- 对于地址、歌名语音识别困难的词语,能调用专业的地图/音乐领域推荐词服务辅助识别,提升识别准确率;支持范围:流式输入、二遍流式输入模式、录音文件识别;(接口文档→ 链接 )
大模型录音文件识别(auc)及大模型流式语音识别-流式输入模式(bigmodel_nostream)
- 新上线13语种混合模型,除中英之外,支持的语种包括11种外语:日语、韩语、印尼语、菲律宾语、马来语、泰语、法语、德语、西班牙语、葡萄牙语、沙特阿拉伯语;接口调用时,默认调用中文模型(支持中英及国内主流方言),如需调用外语模型,需要指定语种;(注意:双向流式模式仍然只支持中英文识别)
双向流式优化版支持非流式二遍识别
- 双向流式模式(优化版本)接口地址:wss://openspeech.bytedance.com/api/v3/sauc/bigmodel_async
产品升级 | 新增语速、音量、语种、情绪、性别五种检测
- 仅流式输入(sauc nostream)和大模型录音文件识别标准版(auc)支持
400新版本模型上线,性能提升,ITN效果优化,支持传参选择使用不同模型版本
- 仅流式输入(sauc nostream)和大模型录音文件识别标准版(auc)支持
上线录音文件识别大模型极速版
- 上线录音文件识别大模型极速版,具体API请见 https://www.volcengine.com/docs/6561/1631584
- Sep 1, 2025
- Date parsed from source:Sep 1, 2025
- First seen by Releasebot:Dec 23, 2025
- Modified by Releasebot:Jan 25, 2026
【2025.09】
1. 已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和 语音播客v3 协议接口支持,音频格式支持mp3/wav/ogg_opus。官网接口文档→,搜索 “aigc_metadata”。
2. 播客大模型已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),文档已经更新(搜索 aigc_watermark 跳转请点击→)。
3. 新上线
异步执行长文本任务接口:最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;
4. 音色上新 | 新音色*14,新增趣味口音、角色扮演音色:14个;
5. TTS(大模型) 已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),已经上线,文档已经更新(搜索 aigc_watermark 跳转请点击→)。
Original source Report a problem - Aug 1, 2025
- Date parsed from source:Aug 1, 2025
- First seen by Releasebot:Dec 23, 2025
- Modified by Releasebot:Feb 10, 2026
【2025.08】
播客大模型-二期迭代功能
- 输入支持url及文件(txt/pdf/word);
- 输出支持URL 形式返回的解析结果,链接有效期为一小时;
- 语音合成对白文本支持修改,支持客户自定义导入;
- 音色顺序可支持指定或随机;
- 支持输出每轮音频时长,调用方可依此实现时间戳;
说明:通过prompt联网搜索内容生成播客功能已上线,但效果仍有优化空间,当前可以先做体验测试;
音色上新
- 新音色*9,新增客服场景音色:9个;
- 新音色*22,新增客服场景音色:14个;新增有声阅读、多语种、通用场景、角色扮演音色:8个;
产品升级
- TTS DMD 版本上线,较默认版本音质有提升,且延时更优。(需注意,此版本在复刻场景中会放大训练prompt的发音人的特质,因此对prompt的要求更高,使用高质量的训练音频,可以获得更优的音质效果)
- Jul 1, 2025
- Date parsed from source:Jul 1, 2025
- First seen by Releasebot:Jan 5, 2026
【2025.07】
上线录音文件识别大模型极速版,具体API请见 https://www.volcengine.com/docs/6561/1631584
Original source Report a problem - Jul 1, 2025
- Date parsed from source:Jul 1, 2025
- First seen by Releasebot:Dec 23, 2025
- Modified by Releasebot:Feb 10, 2026
【2025.07】
上线语音同传大模型2.0,覆盖语音到语音与语音到文本,流式输入可复刻说话人声音并输出目标语种音频;同时上线播客大模型实现双人音频流式生成并支持断点续传。新增音色与教育场景色,升级检测维度,推出录音文件识别大模型极速版,帮助用户快速体验。
上线语音同传大模型2.0,支持两种模式
- 支持语音到语音S2S(Speech-to-Speech):语音流式输入,对语音理解翻译后,模型自动对说话人声音进行复刻,并按照说话人的音色进行目标语种语音的输出;
- 支持语音到文本S2T(Speech-to-Text):语音流式输入,对语音理解翻译后文本返回。
体验入口:
- PC版本:https://console.volcengine.com/ark/region:ark+cn-beijing/experience/voice?type=SI
- H5版本:https://www.volcengine.com/product/realtime-voice-model
上线语音播客大模型,对送入的播客主题文本进行分析,流式生成双人播客音频;支持断点续传。
火山控制台开启试用:https://console.volcengine.com/speech/service/10028
音色上新 | 新音色*1,新增通用场景音色:Vivi;
音色上新 | 新音色*1,新增英语教育场景音色:Tina老师;
音色上新 | 新音色*1,新增英语教育场景音色:Tina老师;
产品升级 | 新增语速、音量、语种、情绪、性别五种检测
上线录音文件识别大模型极速版,具体API请见 https://www.volcengine.com/docs/6561/1631584
Original source Report a problem