AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

人工智能
后台-插件-广告管理-内容页头部广告(手机)

最近AI孙燕姿大火,网上出现了很多高清的翻唱歌曲,可以说翻唱效果和原唱一模一样,其实就是so-vits-svc这个工具的产物,它可以将一首歌的音色换成另外一个人的音色,就像这首歌被别人翻唱了一样。大致实现原理就是,使用so-vits-svc这个工具先提取出你的声音的音色训练成模型,然后提取某个歌曲去音效的人声,通过so-vits-svc将原歌曲人声转换成你的人声,再配上音效,这样这首歌就翻唱完成了。下面讲一下本地部署so-vits-svc实现AI孙燕姿翻唱歌曲的具体操作流程。

首先安装so-vits-svc,github项目地址:https://github.com/svc-develop-team/so-vits-svc,大神的话可以根据项目里说明稳定安装。这里我们使用一键安装包,方便快捷,对新手小白上手比较简单,下面教程使用版本01的so-vits-svc一键启动包,压缩包下载到电脑上解压。双击运行【启动webui.bat】,即可启动so-vits-svc操作页面。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

接下来准备高清声音素材,如果能有录音棚一样录制高清音频环境的话最好,如果录制的音频不够高清,可以使用uvr5来提取高清人声,github项目地址:https://github.com/Anjok07/ultimatevocalremovergui,是什么系统就下载什么系统的应用。下载到电脑上之后安装uvr5.

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

安装完成后运行uvr5,选择待处理音频文件,选择输出文件夹,选择只保留人声,其它选项按如图所示选择即可。然后点击【start processing】.这个操作会用到电脑的CPU和显卡,不要一次性处理时长太长的音频,比如时长超过20分钟了,否则会导致显存不足处理失败。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

声音原声处理完成后,音频文件时长一般比较长,我们需要将音频文件切割成5-10秒左右的短音频,方便系统处理提高精确度与效率。我们使用audio slicer切割音频文件,github项目地址:https://github.com/flutydeer/audio-slicer。左侧导入待分割音频文件,选择输出目录,然后点击右下角start开始分割。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

然后在dataset_raw文件夹下新建一个文件夹,然后将刚才切割好的声音片段复制到这个文件夹内。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

然后打开webui页面,点击训练,然后点击识别数据集按钮,就可以识别出刚才创建的文件夹了。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

然后点击【数据预处理】按钮,对声音进行预处理。这个需要一定的时间,这个过程CPU和GPU同时使用,处理完了没有提示错误信息就可以了。然后点击写入配置文件,参数保持默认即可。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

然后接下来就可以开始训练了,点击【从头开始训练】按钮,就可以开始训练模型了,这是一个漫长的过程。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

如果出现memory错误提示,就是显存不足,可以调低batch_size的值,打开app.py,按ctrl+F搜索batch_size,将后面value的值调小,6G显存建议不超过4,值越大训练速度越快,但是对显存要求也越高。可以根据自己的显存大小适当调整,如果你的显存连6G都达不到的话建议不要在自己电脑上训练模型了,可以看我的云端部署教程,在云GPU上训练。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

如果提示你logs\44k\D_0.pth错误,可以将logs\44k文件夹内的D_0.pth和G_0.pth删除,然后再点击开始训练。

训练步数越大越好,建议不要低于2万步,训练完成后点击【训练聚类模型】,这个过程大约几分钟,只占用CPU,不会使用GPU。

然后点击推理-刷新选项,选择模型,配置文件,聚类模型,然后点击加载模型

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

模型加载成功后,上传一个只有人声的音频,其它设置保持默认就可以了,然后点击音频转换。

AI孙燕姿:so-vits-svc4.0歌曲翻唱工具整合包下载及安装部署教程

注意,音频转换对显卡显存要求同样很高。如果显存过低的话很容易报错,尽量缩短音频时长。

输出信息Success就是转换完成了,原来音频里的声音已经转换成了你模型里的声音,可以播放试听转换效果。

这里提醒大家,不要使用他人声音训练,不要使用未授权的数据集训练。有想体验一下的可以去试试吧。

如果自己的电脑配置比较低可以查看另一篇云端部署教程:《AI孙燕姿:so-vits-svc-4.0 AutoDL云端部署训练模型转换歌曲详细教程》

原文:https://dyss.top/620

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。