音频合成应用场景

来自泡泡学习笔记
BrainBs讨论 | 贡献2023年7月2日 (日) 14:38的版本 (创建页面,内容为“1. 文本-语音合成(TTS) 目前技术发展已经较为成熟,市面上已有较多公司(讯飞、出门问问、思必驰等)推出了商业化产品,主要聚焦的应用场景是AI语音合成。 2. 音色迁移/语音克隆(SVC) 这段时间爆火的“AI孙燕姿”就是音色克隆的代表之一,只需要一定数量的训练集录音,就可将输入的文本或语音转换为目标模型音色。 部分商业化产品目前…”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索

1. 文本-语音合成(TTS)

目前技术发展已经较为成熟,市面上已有较多公司(讯飞、出门问问、思必驰等)推出了商业化产品,主要聚焦的应用场景是AI语音合成。


2. 音色迁移/语音克隆(SVC)

这段时间爆火的“AI孙燕姿”就是音色克隆的代表之一,只需要一定数量的训练集录音,就可将输入的文本或语音转换为目标模型音色。

部分商业化产品目前也在试行推广这一功能。