Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

我一直有一个小需求,是用我的 AI 音色把文字内容做成播客。 可就是这么一个小小的需求,各种方法用了一圈,都特别麻烦。 要么就得自己训练模型... 要么就是2B服务,后台难用的一批... 要么就是只能微信使用,还收费99一个声音... 试完发现就只有 Fish Audio 可以满足我的需求。 - 简单,录音十秒就能克隆自己的声音,还支持上传录音文件克隆朋友的声音 - 易用,打开网页就可以直接合成声音,不用下载APP,不用打开小程序,非常方便 - 免费,其他平台克隆一个声音收100,非常离谱,Fish Audio 克隆声音不要钱,生成500字以内也不要钱,一般内容几百字对个人来说完全够用(更多字数订阅10美金/月也不贵说实话) Fish 不仅能克隆自己的声音,还提供了一个声音共享社区,里面有各种用户上传的上万种有趣声音可以体验,坤坤,赛马娘,孙笑川,高启强...打开你的想象空间... 另外附上这条推的音频版,全部使用 Fish Audio 克隆和生成,使用剪映美化声音、增加背景音防止被其他人克隆,可以试听一下。 Fish Audio 的网址,记得收藏,以后你一定会用到

61,579 görüntüleme • 1 yıl önce •via X (Twitter)

10 Yorum

orange.ai profil fotoğrafı
orange.ai1 yıl önce

克隆声音的tips: - 说话时要快一些,要无脑说自己熟悉的话,说什么不重要,重要的是不要念稿子,播客的话可以参考声动早咖啡的那种速度 - 说话的时候情绪很重要,这代语音大模型都会学习你的情绪,如果要兴奋就不要疲倦,要喜悦就不要伤感 - 演绎你的声音,每个人都是潜在的声优,可以演绎可以模仿

布吉岛岛主 profil fotoğrafı
布吉岛岛主1 yıl önce

老哥,去下载一个CosyVoice,装自己电脑上,一分钱不要,克隆语音想弄多长弄多长,效果还特好。

orange.ai profil fotoğrafı
orange.ai1 yıl önce

你说的是这个吗。。。还需要 conda??

柴郡🔔|Crypto+AI Plus profil fotoğrafı
柴郡🔔|Crypto+AI Plus1 yıl önce

效果还是不错的。

AZ profil fotoğrafı
AZ1 yıl önce

怎么做到把外语访谈类播客,转文本翻译为中文后,再用不同音色还原回来,成为一个完整的中文访谈?

orange.ai profil fotoğrafı
orange.ai1 yıl önce

@AZ02890 剪映有这个功能

木木 profil fotoğrafı
木木1 yıl önce

感觉不如gsv呢

orange.ai profil fotoğrafı
orange.ai1 yıl önce

gsv 是什么

Dugu profil fotoğrafı
Dugu1 yıl önce

豆包不是可以克隆自己的声音吗,而且好用的一批

orange.ai profil fotoğrafı
orange.ai1 yıl önce

豆包能扔几百字进去朗读出来一个mp3文件吗。。。

Benzer Videolar

holy shit,刷到一个开源语音生成项目,中英文语音效果真的吊炸,有点行业掀桌子的意思🚀 ElevenLabs 个人版每月 $5 到 $99 ,商业版更是开到 $1320一个月,现在这个完全开源、免费本地运行的模型 VoxCPM2,在部分语音相似度基准上表现我想用惊人来形容🤩 根据公开的 Minimax-MLS 语音相似度测试: • 英语:VoxCPM2 得分 85.4%,ElevenLabs 为 61.3% • 中文:VoxCPM2 得分 82.5%,ElevenLabs 为 67.7% • 阿拉伯语:VoxCPM2 得分 79.1%,ElevenLabs 为 70.6% 支持 30 种语言、48kHz 工作室级输出,可通过短音频片段进行语音克隆,也支持纯文本描述生成新声音(Voice Design),并能在本地 GPU 上运行(最低约 8GB VRAM)。 项目由 OpenBMB 与清华大学相关团队开发,采用 Apache 2.0 许可,可免费用于商业用途。GitHub 已登上 Trending。 你只要给它一小段录音,它就能把这个人的声音完整复刻下来。 口音、情绪、语速、呼吸的节奏,分毫不差。 输出是 48kHz 的录音棚品质,普通人根本听不出是 AI 生成的。 更离谱的是,你甚至可以用文字直接创造声音。 写一句“二十多岁的女生,声音温柔带点沙哑”,它就能从无到有生成一个完全符合描述的声音。 不用找参考音频,不用请配音演员,连麦克风都不用开。 它的能力有多夸张呢: • 文字造声:描述性别、年龄、音色、情绪,AI 直接生成 • 完美克隆:上传 1 分钟音频,复刻所有声音细节 • 可控克隆:克隆后还能改情绪,比如“语速加快,带着一点兴奋” • 极致还原:给音频加对应文本,连语气的细微起伏都能复现 • 30 种语言自动识别,不用手动标注 • 上下文感知,读新闻像主播,讲故事像说书人 • RTX 4090 上生成速度比播放还快 • 8G 显存就能跑,普通游戏本都能用 • 用 5-10 分钟自己的声音微调,就能得到专属声音模型 最震撼的是第三方基准测试的结果: 英语相似度 VoxCPM2 85.4% vs ElevenLabs 61.3% 中文相似度 VoxCPM2 82.5% vs ElevenLabs 67.7% 阿拉伯语相似度 VoxCPM2 79.1% vs ElevenLabs 70.6% 一个免费开源项目,在核心指标上全面碾压了行业标杆。 专业配音一个项目 250 到 1000 美元 AI 语音平台每月 5 到 100 美元 录音棚每小时 200 美元 VoxCPM2 完全运行在你本地电脑上。 没有 API 费用,没有按字符计费,没有订阅。 永远免费,还能商用。 一行命令就能安装:pip install voxcpm 以下中文实测视频是电磁波Studio 老哥提供,供大家参考, 作为新开源模型,在情绪控制稳定性、长文本一致性、企业级可靠性等方面可能仍有提升空间,实际使用体验建议大家亲自测试, GitHub地址和在线 Demo老规矩评论区自取 👇

AYi

49,240 görüntüleme • 2 ay önce