音频合成应用场景

来自泡泡学习笔记

跳到导航跳到搜索

1. 文本-语音合成（TTS）

目前技术发展已经较为成熟，市面上已有较多公司（讯飞、出门问问、思必驰等）推出了商业化产品，主要聚焦的应用场景是AI语音合成。

2. 音色迁移/语音克隆（SVC）

这段时间爆火的“AI孙燕姿”就是音色克隆的代表之一，只需要一定数量的训练集录音，就可将输入的文本或语音转换为目标模型音色。

部分商业化产品目前也在试行推广这一功能。

取自“http://bubblestudy.info/wiki/index.php?title=音频合成应用场景&oldid=1251”