MoeTTSv1.1.1免费版
MoeTTS是仓库发布的非常优秀的Tacotron2/HifiGAN模型+编译的GUI版本。大多数角色的语音合成效果都非常好,稍后会发布到MoeTTS项目页面。 MoeTTS是一个非常优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库。...
- 版本:v1.0.0
- 平台:WinAll
- 类型:媒体软件
- 发布:2025-02-08
- 大小:960.0M
- 星级:
MoeTTS是仓库发布的非常优秀的Tacotron2/HifiGAN模型+编译的GUI版本。大多数角色的语音合成效果都非常好,稍后会发布到MoeTTS项目页面。
MoeTTS是一个非常优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库。大部分角色的语音合成效果非常好,后续会发布到MoeTTS项目页面。
基本介绍
MoeTTS是一个Tacotron2/HifiGAN模型+编译的GUI版本发布仓库。训练时间为3天,约900 Epoch。 13人大模型还在训练中,稍后会发布到MoeTTS项目页面。视频背后的模型是400 Epoch。经过5天的训练,大部分字符的语音合成都很好,但少数数据较少的字符则不太好。
指示
模型目录格式
单个模型可以放置在任何地方。如果模型有配置文件,请将其重命名为config.json,并将其放在与TTS模型同一目录下。 (例如hifigan、vits型号,它们都带有配置文件)
对于VITS型号,请将config.json中的cleaners更改为custom_cleaners
文本输入格式
文本一般是输入音素(日语应该在这里输入罗马发音),但是这取决于模型训练者如何输入数据。例如,我的ATRI模型(Tacotron2版本)输入罗马化时不带空格,标点符号仅支持逗号和句点。
定制清洁剂和符号
您可以在moetts.exe 的同一目录中找到custom 文件夹,该文件夹存储了两个模型的文本模块。
自定义cleaner:找到cleaners.py,修改custom_cleaners函数(软件默认只会去除symbol中不存在的字符,不会对文本进行进一步处理)
自定义符号:找到symbols.py,将里面的符号改为自己需要的符号。
注意:不同的模型可能会使用不同的清洁剂和符号进行训练。如有必要请进行修改,以保证模型能够正常使用。
如何使用图形用户界面
塔科特隆2
选择你的模型路径和输出目录,最后输入要合成的文本,点击Synthesize Speech,稍等片刻,软件就会将音频输出到输出目录/outpus.wav
防范措施:
第一次综合需要加载模型,耗时较长。如果再次合成同一个模型,则不会再次加载,直接合成。
如果切换模型,将重新加载再次合成。
如果修改了清洁剂和符号,则重新启动软件后才会生效。
该软件为64位版本,不支持32位系统。
VITS 的特别说明
VITS-Single 和VITS-Multi 分别是单角色模型和多角色模型。
VITS-Multi中的原始角色ID为待合成语音的角色ID,需要填写数字。目标角色ID为待迁移语音迁移功能的目标角色ID。
要迁移的音频需要22050、16 位和单声道的采样率。
相关下载
更多
游戏攻略
更多
- 《人间诡视》游戏攻略全结局分享 04.15
- 《洛克王国:世界》PVP精灵选择推荐 04.15
- 《原神》琉鳞石全收集位置图文介绍 04.15
- 《无期迷途》黎莎洛培养建议 04.15
- 《艾塔纪元》终末原罪技能介绍 04.15
- 《原神》瓦雷莎雷火队搭配推荐 04.15