GPT-SoVITS-WebUI:玩转语音转换和文本转语音,只需几步!

大家好,今天给大家介绍一个超级棒的工具:GPT-SoVITS-WebUI!它能让你轻松实现语音转换和文本转语音,简直是语音爱好者的福音!

https://github.com/RVC-Boss/GPT-SoVITS 为什么GPT-SoVITS-WebUI这么棒呢?

  • 零样本TTS: 只需要你提供5秒的语音样本,它就能瞬间将文字转换成语音!
  • 少量样本TTS: 只要1分钟的训练数据,就能让语音更接近你的风格,更逼真!
  • 跨语言支持: 支持中文、英文、日文等多种语言,无论你想做什么语言的语音转换,它都能帮你搞定!
  • 强大工具集: 内置语音伴奏分离、自动训练集分割、中文ASR和文本标注等工具,即使是新手也能轻松创建训练数据集和GPT/SoVITS模型!

想体验一下吗?

点击这里观看演示视频

上手指南:

  1. 安装:
    • 中国用户可以点击链接使用AutoDL Cloud Docker在线体验全部功能。
    • 其他用户,根据你的系统(Windows、Linux、macOS)选择合适的安装方法,详细步骤请参考官方文档:简体中文 英文
  2. 下载预训练模型:
    • GPT-SoVITS Models下载预训练模型,并将其放置在GPT_SoVITS/pretrained_models文件夹中。
    • 对于UVR5(语音/伴奏分离和回声消除),从UVR5 Weights下载模型,并将其放置在tools/uvr5/uvr5_weights文件夹中。
    • 对于中文ASR,从Damo ASR ModelDamo VAD ModelDamo Punc Model下载模型,并将其放置在tools/asr/models文件夹中。
    • 对于英文或日文ASR,从Faster Whisper Large V3下载模型,并将其放置在tools/asr/models文件夹中。
  3. 准备数据集:
    • TTS标注文件格式为.list,格式示例:[插入示例]
  4. 开始使用:
    • 运行GPT-SoVITS-WebUI,即可开始使用!

未来展望:

  • 支持更多语言
  • 提供更详细的用户指南
  • 推出更多功能,例如语音速率控制、情绪控制等

期待与大家一起探索语音转换的无限可能!