刚刚放出来的新技术,应该是在AudioLM和Valle-E基础上的进步。有中文人声,但好像不能克隆。它的训练数据肯定是了音乐、音效、人声,所以会有这种效果。
GitHub狂揽7.6k星,冲上热榜第一
使用英伟达NeMo让你的文字会说话,零基础即可实现自然语音生成任务 | 附代码 liming 2021-08-04 13:20:06