Загрузка видео...
Не удалось загрузить видео
兄弟们 炸裂了 这个语音专文本TTS模型 应该是目前对中文支持最好的了 ChatTTS:专门为对话场景设计的文本到语音TTS模型 该模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。 专为对话任务优化,能够支持多种说话人语音,中英文混合等。 模型还能够预测和控制细粒度的韵律特征,如笑声、停顿和插话等,还能进行更细粒度的调整,如语速、音调和情感等。 GitHub: 详细介绍:
296,557 просмотров • 2 лет назад •via X (Twitter)
Комментарии: 10

小互2 лет назад
测试演示:

Adam Carter2 лет назад
分享下使用教程 1. 到 克隆项目 2. 按照以下方式输入代码 3. 运行(运行时看到缺什么组件就装什么组件) 注意: 1. 尽量不使用特殊的标点符号,甚至引号都会影响生成结果。 2. 多音字还是有点问题 3. 一次生成感觉不好可以多生成几次

JoeDean2 лет назад
太炸裂了,刚在这里体验了一下,

知识分享官2 лет назад
3070ti能否一战

Justin2 лет назад
有 API 就好了,这个东西个人本地使用还有点门槛,显卡并非人人有啊😂

Eric Z2 лет назад
能保持同一个人的语调吗

Jiu Peak2 лет назад
网站有错位

阿外2 лет назад
语气、节奏、情绪等副语言效果都太赞了,这已经堪比4o voice语音模型的拟人化效果了,还开源👍

Tales2 лет назад
不需要再找听力材料,直接根据需要,强度生成恰好的即可,N+1学习。

HelloLeo2 лет назад
牛逼的开源项目,未来电话另一头是什么人应该更难区分了
