Volcengine Release Notes

Last updated: Feb 13, 2026

  • Nov 12, 2025
    • Date parsed from source:
      Nov 12, 2025
    • First seen by Releasebot:
      Feb 13, 2026
    Volcengine logo

    Volcengine

    【2025.11】

    TTS 2.0 推出全新有声阅读音色 为儿童绘本场景带来沉浸式讲读 TTS 1.0 新增18款情感与角色扮演音色 覆盖多种语气与风格 丰富语音表现 新音色已上线 提供更多个性化语音选项

    1. TTS 2.0音色上新 | 新音色*1,新增有声阅读音色:1个。

    语种 类别 名称 Speaker

    • 中文 有声阅读 儿童绘本 zh_female_xueayi_saturn_bigtts

    2. TTS 1.0音色上新 | 新音色*18,新增角色扮演、多情感音色:18个。

    语种 类别 名称 Speaker

    • 中文 角色扮演 寡言小哥 ICL_zh_male_xiaoge_v1_tob
    • 中文 角色扮演 清朗温润 ICL_zh_male_renyuwangzi_v1_tob
    • 中文 角色扮演 潇洒随性 ICL_zh_male_xiaosha_v1_tob
    • 中文 角色扮演 清冷矜贵 ICL_zh_male_liyisheng_v1_tob
    • 中文 角色扮演 沉稳优雅 ICL_zh_male_qinglen_v1_tob
    • 中文 角色扮演 清逸苏感 ICL_zh_male_chongqingzhanzhan_v1_tob
    • 中文 角色扮演 温柔内敛 ICL_zh_male_xingjiwangzi_v1_tob
    • 中文 角色扮演 低沉缱绻 ICL_zh_male_sigeshiye_v1_tob
    • 中文 角色扮演 蓝银草魂师 ICL_zh_male_lanyingcaohunshi_v1_tob
    • 中文 角色扮演 清冷高雅 ICL_zh_female_liumengdie_v1_tob
    • 中文 角色扮演 甜美娇俏 ICL_zh_female_linxueying_v1_tob
    • 中文 角色扮演 柔骨魂师 ICL_zh_female_rouguhunshi_v1_tob
    • 中文 角色扮演 甜美活泼 ICL_zh_female_tianmei_v1_tob
    • 中文 角色扮演 成熟温柔 ICL_zh_female_chengshu_v1_tob
    • 中文 角色扮演 贴心闺蜜 ICL_zh_female_xnx_v1_tob
    • 中文 角色扮演 温柔白月光 ICL_zh_female_yry_v1_tob
    • 中文 角色扮演 高冷沉稳 zh_male_bv139_audiobook_ummv3_bigtts
    • 中文 多情感 深夜播客 zh_male_shenyeboke_emo_v2_mars_bigtts
    Original source Report a problem
  • Nov 12, 2025
    • Date parsed from source:
      Nov 12, 2025
    • First seen by Releasebot:
      Dec 23, 2025
    Volcengine logo

    Volcengine

    【2025.11】

    Release notes

    • TTS 2.0音色上新 | 新音色*1,新增有声阅读音色:1个。
    • TTS 1.0音色上新 | 新音色*18,新增角色扮演、多情感音色:18个。
    Original source Report a problem
  • All of your release notes in one feed

    Join Releasebot and get updates from Volcengine and hundreds of other software products.

  • Oct 1, 2025
    • Date parsed from source:
      Oct 1, 2025
    • First seen by Releasebot:
      Dec 23, 2025
    • Modified by Releasebot:
      Jan 25, 2026
    Volcengine logo

    Volcengine

    【2025.10】

    • TTS 1.0音色上新 | 新音色*1,新增趣味口音音色:1个。
    Original source Report a problem
  • Sep 1, 2025
    • Date parsed from source:
      Sep 1, 2025
    • First seen by Releasebot:
      Jan 8, 2026
    Volcengine logo

    Volcengine

    【2025.09】

    已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和语音播客v3 协议接口支持,音频格式支持 mp3/wav/ogg_opus。官网接口文档 → 链接,搜索 “aigc_metadata”。

    Original source Report a problem
  • Sep 1, 2025
    • Date parsed from source:
      Sep 1, 2025
    • First seen by Releasebot:
      Jan 8, 2026
    Volcengine logo

    Volcengine

    【2025.09】

    新上线 异步执行长文本任务接口

    最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;

    Original source Report a problem
  • Sep 1, 2025
    • Date parsed from source:
      Sep 1, 2025
    • First seen by Releasebot:
      Dec 25, 2025
    • Modified by Releasebot:
      Feb 10, 2026
    Volcengine logo

    Volcengine

    【2025.09】

    新一轮大模型语音合成与识别升级上线,包含隐式与显式水印、2.0 版本豆包语音合成、异步长文本任务、新增音色与趣味口音、以及大模型录音/流式识别的提升与多语言支持,显著提升自然度、情感表现与处理效率。

    已支持隐式 meta 水印写入

    已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和 语音播客v3 协议接口支持,音频格式支持mp3/wav/ogg_opus。官网接口文档→ 链接 ,搜索 “aigc_metadata”。

    播客大模型已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),文档已经更新(搜索 aigc_watermark 跳转请点击→ 链接 )。

    大模型语音合成2.0版本上新

    • 推出豆包语音合成模型2.0,支持TTS对话式合成新范式(Query-Response),提供更加自然、更丰富情感、更具有表现力的语音合成效果。
    • 新上线异步执行长文本任务接口:最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;
    • 音色上新 | 新音色*14,新增趣味口音、角色扮演音色:14个;
    • TTS(大模型) 已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),已经上线,文档已经更新(搜索 aigc_watermark 跳转请点击→ 链接 )。

    大模型录音文件闲时版上线

    • 整体产品效果及功能同大模型录音文件识别标准版,时效性24小时内完成处理,适用于大批量、对时效性要求较低的录音文件识别任务处理,价格相比于标准版更加实惠;(接口文档→ 链接 )

    大模型流式语音识别-地址/音乐优化

    • 对于地址、歌名语音识别困难的词语,能调用专业的地图/音乐领域推荐词服务辅助识别,提升识别准确率;支持范围:流式输入、二遍流式输入模式、录音文件识别;(接口文档→ 链接 )

    大模型录音文件识别(auc)及大模型流式语音识别-流式输入模式(bigmodel_nostream)

    • 新上线13语种混合模型,除中英之外,支持的语种包括11种外语:日语、韩语、印尼语、菲律宾语、马来语、泰语、法语、德语、西班牙语、葡萄牙语、沙特阿拉伯语;接口调用时,默认调用中文模型(支持中英及国内主流方言),如需调用外语模型,需要指定语种;(注意:双向流式模式仍然只支持中英文识别)

    双向流式优化版支持非流式二遍识别

    • 双向流式模式(优化版本)接口地址:wss://openspeech.bytedance.com/api/v3/sauc/bigmodel_async

    产品升级 | 新增语速、音量、语种、情绪、性别五种检测

    • 仅流式输入(sauc nostream)和大模型录音文件识别标准版(auc)支持

    400新版本模型上线,性能提升,ITN效果优化,支持传参选择使用不同模型版本

    • 仅流式输入(sauc nostream)和大模型录音文件识别标准版(auc)支持

    上线录音文件识别大模型极速版

    Original source Report a problem
  • Sep 1, 2025
    • Date parsed from source:
      Sep 1, 2025
    • First seen by Releasebot:
      Dec 23, 2025
    • Modified by Releasebot:
      Jan 25, 2026
    Volcengine logo

    Volcengine

    【2025.09】

    1. 已支持隐式 meta 水印写入,当前仅大模型语音合成、声音复刻和 语音播客v3 协议接口支持,音频格式支持mp3/wav/ogg_opus。官网接口文档→,搜索 “aigc_metadata”。

    2. 播客大模型已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),文档已经更新(搜索 aigc_watermark 跳转请点击→)。

    3. 新上线

    异步执行长文本任务接口:最大单次可执行的文本长度为10万字符,合成音频数据在服务端可保存7天。适用于批量进行音频内容生产(如有声小说等),但对时效性要求不高的场景;调用的价格跟大模型语音合成/声音复刻短文本定价保持一致;

    4. 音色上新 | 新音色*14,新增趣味口音、角色扮演音色:14个;

    5. TTS(大模型) 已支持合成结尾加上显式水印(“AI”的摩斯码节奏音频),已经上线,文档已经更新(搜索 aigc_watermark 跳转请点击→)。

    Original source Report a problem
  • Aug 1, 2025
    • Date parsed from source:
      Aug 1, 2025
    • First seen by Releasebot:
      Dec 23, 2025
    • Modified by Releasebot:
      Feb 10, 2026
    Volcengine logo

    Volcengine

    【2025.08】

    播客大模型-二期迭代功能

    • 输入支持url及文件(txt/pdf/word);
    • 输出支持URL 形式返回的解析结果,链接有效期为一小时;
    • 语音合成对白文本支持修改,支持客户自定义导入;
    • 音色顺序可支持指定或随机;
    • 支持输出每轮音频时长,调用方可依此实现时间戳;

    说明:通过prompt联网搜索内容生成播客功能已上线,但效果仍有优化空间,当前可以先做体验测试;

    音色上新

    • 新音色*9,新增客服场景音色:9个;
    • 新音色*22,新增客服场景音色:14个;新增有声阅读、多语种、通用场景、角色扮演音色:8个;

    产品升级

    • TTS DMD 版本上线,较默认版本音质有提升,且延时更优。(需注意,此版本在复刻场景中会放大训练prompt的发音人的特质,因此对prompt的要求更高,使用高质量的训练音频,可以获得更优的音质效果)
    Original source Report a problem
  • Jul 1, 2025
    • Date parsed from source:
      Jul 1, 2025
    • First seen by Releasebot:
      Jan 5, 2026
    Volcengine logo

    Volcengine

    【2025.07】

    上线录音文件识别大模型极速版,具体API请见 https://www.volcengine.com/docs/6561/1631584

    Original source Report a problem
  • Jul 1, 2025
    • Date parsed from source:
      Jul 1, 2025
    • First seen by Releasebot:
      Dec 23, 2025
    • Modified by Releasebot:
      Feb 10, 2026
    Volcengine logo

    Volcengine

    【2025.07】

    上线语音同传大模型2.0,覆盖语音到语音与语音到文本,流式输入可复刻说话人声音并输出目标语种音频;同时上线播客大模型实现双人音频流式生成并支持断点续传。新增音色与教育场景色,升级检测维度,推出录音文件识别大模型极速版,帮助用户快速体验。

    上线语音同传大模型2.0,支持两种模式

    • 支持语音到语音S2S(Speech-to-Speech):语音流式输入,对语音理解翻译后,模型自动对说话人声音进行复刻,并按照说话人的音色进行目标语种语音的输出;
    • 支持语音到文本S2T(Speech-to-Text):语音流式输入,对语音理解翻译后文本返回。

    体验入口:

    上线语音播客大模型,对送入的播客主题文本进行分析,流式生成双人播客音频;支持断点续传。

    火山控制台开启试用:https://console.volcengine.com/speech/service/10028

    音色上新 | 新音色*1,新增通用场景音色:Vivi;

    音色上新 | 新音色*1,新增英语教育场景音色:Tina老师;

    音色上新 | 新音色*1,新增英语教育场景音色:Tina老师;

    产品升级 | 新增语速、音量、语种、情绪、性别五种检测

    上线录音文件识别大模型极速版,具体API请见 https://www.volcengine.com/docs/6561/1631584

    Original source Report a problem

Related vendors