音频合成应用场景

来自泡泡学习笔记
跳到导航 跳到搜索

1. 文本-语音合成(TTS)

目前技术发展已经较为成熟,市面上已有较多公司(讯飞、出门问问、思必驰等)推出了商业化产品,主要聚焦的应用场景是AI语音合成。


2. 音色迁移/语音克隆(SVC)

这段时间爆火的“AI孙燕姿”就是音色克隆的代表之一,只需要一定数量的训练集录音,就可将输入的文本或语音转换为目标模型音色。

部分商业化产品目前也在试行推广这一功能。