声音克隆的工具很多人问我,一直没有看到合适的,直到今天测试了下F5-TTS,觉得效果确实不错,拿来复制自己的声音很方便呀,而且提供的是整合包,大家使用也简单,来给大家分享和演示一下这款工具
本期用到的工具是F5-TTS,由上海交通大学研发,完全免费,此次带来的是整合包,先安装依赖,再运行启动器。使用很简单。
F5-TTS声音克隆(Windows)
软件特点
使用简单,一键启动,克隆简单,导入15秒的音频,即可一键复刻声音
软件启有点慢,时间在30s-3min左右,到时候它会自动跳转浏览器。
支持克隆麦克风录制的声音,也可以上传别人的声音克隆
纯本地运行,免费使用,无广告,无需安装啥东西
使用教程
软件下载后解压,运行下图中的程序,稍等一会会自动打开浏览器工作界面。
会有一个黑色的窗口,我们不要动,缩小就行了。
自动打开浏览器工作界面,我们可以上传一个音频或是自己录音都可以。
顺便再说下这个项目的参数和其他玩法:
1. 合成音频的时候,可以看见有2个类型,F5和E2,两者的区别在于F5训练更快,E2还原度更好。但是我实测下来,感觉F5效果更好,大家可以自己测试下看看。
2. 生成播客功能(Podcast)
就是可以上传2个人的音频,然后输入对话的文本,可以合成语音播客。
3. 多语气音频合成
就是允许你上传不同语气,比如开心、伤心、愤怒等情绪的音频,然后你输入你要合成的文本,在文本的指定位置用花括号指定情绪,然后合成语音,这样合成的语音就带有情绪更逼真了。
这个项目总体来说非常不错,有需求的小伙伴不要错过,上面的一些功能都可以自己去测试体验一下,今天就分享到这里啦~