ChatTTS个人笔记

文本预处理

[laugh] 代表笑声;**[uv_break**]代表停顿。

整合包有bug,会直接读取,没法用。

整合包用文言一心或其他AI先预处理,在停顿处加上逗号可以适当放缓语速。

个人筛选

目前最好的音色:预存4

文本语气:93563941;93473344。不过好像差距不大

最好的办法是生成3个,然后剪辑

AU经验

干音处理:

  1. 单声道变立体音
  2. 收藏夹:自带的-3分贝
  3. 肥波插件音量调整:动态→C9
  4. 肥波插件人声处理:第一个→C2

拉伸音高换挡器的比率:1/速率

10%以内拉伸不用换挡