文本预处理
[laugh] 代表笑声;[uv_break]代表停顿。
整合包有bug,会直接读取,没法用。
整合包用文言一心或其他AI先预处理,在停顿处加上逗号可以适当放缓语速。
个人筛选
目前最好的音色:预存4
文本语气:93563941;93473344。不过好像差距不大
最好的办法是生成3个,然后剪辑
AU经验
干音处理:
- 单声道变立体音
- 收藏夹:自带的-3分贝
- 肥波插件音量调整:动态→C9
- 肥波插件人声处理:第一个→C2
拉伸音高换挡器的比率:1/速率
10%以内拉伸不用换挡
多频段压缩器增益低音-男声

多频段压缩器增益低音-女声

ckpt模型:第一个(自带模型)
pth模型:test2