Video yükleniyor...

Video Yüklenemedi

Bu video yüklenirken bir sorun oluştu. Bu geçici bir ağ sorunundan kaynaklanıyor olabilir veya video kullanılamıyor olabilir.

Ana Sayfaya Dön

我一直有一个小需求，是用我的 AI 音色把文字内容做成播客。可就是这么一个小小的需求，各种方法用了一圈，都特别麻烦。要么就得自己训练模型... 要么就是2B服务，后台难用的一批... 要么就是只能微信使用，还收费99一个声音... 试完发现就只有 Fish Audio 可以满足我的需求。 - 简单，录音十秒就能克隆自己的声音，还支持上传录音文件克隆朋友的声音 - 易用，打开网页就可以直接合成声音，不用下载APP，不用打开小程序，非常方便 - 免费，其他平台克隆一个声音收100，非常离谱，Fish Audio 克隆声音不要钱，生成500字以内也不要钱，一般内容几百字对个人来说完全够用（更多字数订阅10美金/月也不贵说实话） Fish 不仅能克隆自己的声音，还提供了一个声音共享社区，里面有各种用户上传的上万种有趣声音可以体验，坤坤，赛马娘，孙笑川，高启强...打开你的想象空间... 另外附上这条推的音频版，全部使用 Fish Audio 克隆和生成，使用剪映美化声音、增加背景音防止被其他人克隆，可以试听一下。 Fish Audio 的网址，记得收藏，以后你一定会用到

Orange AI

174,137 subscribers

61,579 görüntüleme • 1 yıl önce •via X (Twitter)

Bilim & Teknoloji

Anya Rossi• Live Now

Private livecam show

10 Yorum

orange.ai profil fotoğrafı

orange.ai1 yıl önce

克隆声音的tips： - 说话时要快一些，要无脑说自己熟悉的话，说什么不重要，重要的是不要念稿子，播客的话可以参考声动早咖啡的那种速度 - 说话的时候情绪很重要，这代语音大模型都会学习你的情绪，如果要兴奋就不要疲倦，要喜悦就不要伤感 - 演绎你的声音，每个人都是潜在的声优，可以演绎可以模仿

布吉岛岛主 profil fotoğrafı

布吉岛岛主1 yıl önce

老哥，去下载一个CosyVoice，装自己电脑上，一分钱不要，克隆语音想弄多长弄多长，效果还特好。

orange.ai profil fotoğrafı

orange.ai1 yıl önce

你说的是这个吗。。。还需要 conda？？

柴郡🔔｜Crypto+AI Plus profil fotoğrafı

柴郡🔔｜Crypto+AI Plus1 yıl önce

效果还是不错的。

AZ profil fotoğrafı

AZ1 yıl önce

怎么做到把外语访谈类播客，转文本翻译为中文后，再用不同音色还原回来，成为一个完整的中文访谈？

orange.ai profil fotoğrafı

orange.ai1 yıl önce

@AZ02890 剪映有这个功能

木木 profil fotoğrafı

木木1 yıl önce

感觉不如gsv呢

orange.ai profil fotoğrafı

orange.ai1 yıl önce

gsv 是什么

Dugu profil fotoğrafı

Dugu1 yıl önce

豆包不是可以克隆自己的声音吗，而且好用的一批

orange.ai profil fotoğrafı

orange.ai1 yıl önce

豆包能扔几百字进去朗读出来一个mp3文件吗。。。

Benzer Videolar

🔥震惊！Fish Audio 居然可以克隆声音而且完全免费🎧 体验了一下还挺好玩的，用手机录制一段自己的声音，上传上去就能克隆合成一个属于你自己的音源，500字以内都免费，每天50次足够用了。除了用自己声音还可以用其他人的，太多选择了。最主要的是用起来非常非常的方便，几乎0门槛。好用推荐低成本克隆合成声音已经不再是遥不可及的梦想！直达传送门： #低成本克隆合成声音 #声音克隆 #机器学习技术 #先进技术 #工具易用性 #生成声音质量 #隐私保护 #声音合成技术 #最佳选项

🔥震惊！Fish Audio 居然可以克隆声音而且完全免费🎧 体验了一下还挺好玩的，用手机录制一段自己的声音，上传上去就能克隆合成一个属于你自己的音源，500字以内都免费，每天50次足够用了。除了用自己声音还可以用其他人的，太多选择了。最主要的是用起来非常非常的方便，几乎0门槛。好用推荐低成本克隆合成声音已经不再是遥不可及的梦想！直达传送门： #低成本克隆合成声音 #声音克隆 #机器学习技术 #先进技术 #工具易用性 #生成声音质量 #隐私保护 #声音合成技术 #最佳选项

穆尼

100,025 görüntüleme • 1 yıl önce

YouMind 已上线音色克隆！🎉 可以用你自己或者喜欢的音色朗读文章、给 Slide 配音。（本视频的配音也使用了音色克隆，真的和同事的声音一模一样）

YouMind 已上线音色克隆！🎉 可以用你自己或者喜欢的音色朗读文章、给 Slide 配音。（本视频的配音也使用了音色克隆，真的和同事的声音一模一样）

Nicolechan

18,256 görüntüleme • 2 ay önce

很多人问我这个remotion做的广告宣传片，TTS怎么选择？其实我现在TTS主力用几家： Index TTS2：克隆音质非常好，情感表达可以调节并且非常丰富，缺点是需要GPU，生成速度慢 Qwen3-TTS：可以克隆声音，但是对声音的原声音要求高。情感表达也挺丰富，也可以调节。最好的是，可以用CPU去生成，即便用CPU速度也可以接受。 edge-tts：英文还可以，中文就比较AI音了，有点拉垮。这个视频里面英文配音用的就是edge-tts 还有很多家还没有尝试，比如F5-TTS，MiniMax，等有空了要好好测试一下。

很多人问我这个remotion做的广告宣传片，TTS怎么选择？其实我现在TTS主力用几家： Index TTS2：克隆音质非常好，情感表达可以调节并且非常丰富，缺点是需要GPU，生成速度慢 Qwen3-TTS：可以克隆声音，但是对声音的原声音要求高。情感表达也挺丰富，也可以调节。最好的是，可以用CPU去生成，即便用CPU速度也可以接受。 edge-tts：英文还可以，中文就比较AI音了，有点拉垮。这个视频里面英文配音用的就是edge-tts 还有很多家还没有尝试，比如F5-TTS，MiniMax，等有空了要好好测试一下。

huangserva

36,531 görüntüleme • 5 ay önce

$兄弟们，这个数字人工具感觉不错我刚安装好，正在体验一个安装包即可解决所有问题，非常适合小白用户，以往的开源数字人工具都需要自己配置环境什么的，对小白很不友好。这个一个安装包，然后下载模型即可，很容易上手可以生成带有数字人的视频，并且保持嘴型和声音是同步的。支持语音合成和声音克隆支持Windows\Linux和macOS 支持模型：比如 MuseTalk（文本到语音）和 CosyVoice（语音克隆）。可以很方便地导入各种 AI 模型，界面支持中英文，关键还是开源的。$

兄弟们，这个数字人工具感觉不错我刚安装好，正在体验一个安装包即可解决所有问题，非常适合小白用户，以往的开源数字人工具都需要自己配置环境什么的，对小白很不友好。这个一个安装包，然后下载模型即可，很容易上手可以生成带有数字人的视频，并且保持嘴型和声音是同步的。支持语音合成和声音克隆支持Windows\Linux和macOS 支持模型：比如 MuseTalk（文本到语音）和 CosyVoice（语音克隆）。可以很方便地导入各种 AI 模型，界面支持中英文，关键还是开源的。

小互

41,028 görüntüleme • 1 yıl önce

它主要用于两个场景，一个是音轨剥离，一个是声音移除，例如它可以提取人声、鼓、贝斯、吉他和弦乐等声音，也可以去除背景音乐、麦克风隆隆声以及其他不需要的噪音。下面的视频演示了剥离伴奏和人声的效果，还是比较直观的。也去搜罗了下实现原理，找到一篇介绍 MSS（Musical Source Separation）的论文：

它主要用于两个场景，一个是音轨剥离，一个是声音移除，例如它可以提取人声、鼓、贝斯、吉他和弦乐等声音，也可以去除背景音乐、麦克风隆隆声以及其他不需要的噪音。下面的视频演示了剥离伴奏和人声的效果，还是比较直观的。也去搜罗了下实现原理，找到一篇介绍 MSS（Musical Source Separation）的论文：

Barret李靖

319,890 görüntüleme • 2 yıl önce

Clone voice-CV 声音克隆工具一个带web界面的声音克隆工具，使用你的音色或任意声音来录制音频。压缩包 3.4 G，解压后 6.3 G，可以直接本地运行。

Clone voice-CV 声音克隆工具一个带web界面的声音克隆工具，使用你的音色或任意声音来录制音频。压缩包 3.4 G，解压后 6.3 G，可以直接本地运行。

MZ 🍒

139,495 görüntüleme • 2 yıl önce

AigcPanel 一款由 Vue 实现的简单易用一站式 AI 数字人系统，小白也可使用。支持视频合成、声音合成、声音克隆，简化本地模型管理、一键导入和使用AI模型。

AigcPanel 一款由 Vue 实现的简单易用一站式 AI 数字人系统，小白也可使用。支持视频合成、声音合成、声音克隆，简化本地模型管理、一键导入和使用AI模型。

Geek

55,041 görüntüleme • 1 yıl önce

一人电台工作室绝对有戏！我的免费批量做播客电台的进展明显，克隆声音录制有声书绝了！情绪、语速、节奏感比普通人还强，强很多（当然专业的可能比不了）雷军的声音+《明朝那些事儿》，还原度95%😀 丢个Demo感受下声音克隆移步：（新用户一次免费机会，够用了） #AI声音

一人电台工作室绝对有戏！我的免费批量做播客电台的进展明显，克隆声音录制有声书绝了！情绪、语速、节奏感比普通人还强，强很多（当然专业的可能比不了）雷军的声音+《明朝那些事儿》，还原度95%😀 丢个Demo感受下声音克隆移步：（新用户一次免费机会，够用了） #AI声音

anguo W

33,059 görüntüleme • 1 yıl önce

用Myshell做一个用自己声音的AI英语对话机器人（暂不支持中文）核心操作：声音录音采样->上传Myshell->配置机器人教程： 1. 生成文本素材：用ChatGPT生成一段故事 “生成一段800字的英文故事”，长度足够念3分钟，只需要念2分钟左右就行。 2. 阅读录音：iPhone打开语音备忘录，用英语朗读上面生成的故事。 3. 转换音频格式：语音备忘录分享给微信文件传输助手，下载m4a格式音频，打开转换成MP3下载。 4. 注册Myshell，打开创建自己的机器人，填写基础信息，上传MP3录音文件，合成大概需要1分钟时间。到这里，就可以体验用自己声音创建的机器人Web版。如果想用自己声音搭Telegram机器人，可以按下面教程操作，相对复杂。下面视频是把声音下载用剪映做的视频，声音还挺像自己的。

用Myshell做一个用自己声音的AI英语对话机器人（暂不支持中文）核心操作：声音录音采样->上传Myshell->配置机器人教程： 1. 生成文本素材：用ChatGPT生成一段故事 “生成一段800字的英文故事”，长度足够念3分钟，只需要念2分钟左右就行。 2. 阅读录音：iPhone打开语音备忘录，用英语朗读上面生成的故事。 3. 转换音频格式：语音备忘录分享给微信文件传输助手，下载m4a格式音频，打开转换成MP3下载。 4. 注册Myshell，打开创建自己的机器人，填写基础信息，上传MP3录音文件，合成大概需要1分钟时间。到这里，就可以体验用自己声音创建的机器人Web版。如果想用自己声音搭Telegram机器人，可以按下面教程操作，相对复杂。下面视频是把声音下载用剪映做的视频，声音还挺像自己的。

向阳乔木

139,676 görüntüleme • 3 yıl önce

我去这个语音克隆模型有点牛P 哈哈哈使用了 250,000 小时的中英双语语音数据训练只需15秒的声音就能完美克隆声音，保持音色和情感 Llasa-3B 可以通过输入一个带有情感特征的语音提示（Prompt），在生成目标语音时保留提示语音中的情感特征。基于 LLaMA 语言模型（ 1B、3B 和 8B 参数规模），通过整合 XCodec2 的语音 token 提供语音生成功能。

我去这个语音克隆模型有点牛P 哈哈哈使用了 250,000 小时的中英双语语音数据训练只需15秒的声音就能完美克隆声音，保持音色和情感 Llasa-3B 可以通过输入一个带有情感特征的语音提示（Prompt），在生成目标语音时保留提示语音中的情感特征。基于 LLaMA 语言模型（ 1B、3B 和 8B 参数规模），通过整合 XCodec2 的语音 token 提供语音生成功能。

小互

96,666 görüntüleme • 1 yıl önce

藏师傅第一时间测试了一下 Sora 2，这玩意太吊了不能用常规的 AI 视频模型评判标准去看待它只需要两秒的音频就可以完美克隆你的音色，而且不止可以生成英文语音，中文也行！而且模型具有世界知识，可以自主规划每个分镜，跟一个成熟的导演一样！下面是详细的测试👇：

藏师傅第一时间测试了一下 Sora 2，这玩意太吊了不能用常规的 AI 视频模型评判标准去看待它只需要两秒的音频就可以完美克隆你的音色，而且不止可以生成英文语音，中文也行！而且模型具有世界知识，可以自主规划每个分镜，跟一个成熟的导演一样！下面是详细的测试👇：

歸藏(guizang.ai)

181,401 görüntüleme • 9 ay önce

holy shit，刷到一个开源语音生成项目，中英文语音效果真的吊炸，有点行业掀桌子的意思🚀 ElevenLabs 个人版每月 $5 到 $99 ，商业版更是开到 $1320一个月，现在这个完全开源、免费本地运行的模型 VoxCPM2，在部分语音相似度基准上表现我想用惊人来形容🤩 根据公开的 Minimax-MLS 语音相似度测试： • 英语：VoxCPM2 得分 85.4%，ElevenLabs 为 61.3% • 中文：VoxCPM2 得分 82.5%，ElevenLabs 为 67.7% • 阿拉伯语：VoxCPM2 得分 79.1%，ElevenLabs 为 70.6% 支持 30 种语言、48kHz 工作室级输出，可通过短音频片段进行语音克隆，也支持纯文本描述生成新声音（Voice Design），并能在本地 GPU 上运行（最低约 8GB VRAM）。项目由 OpenBMB 与清华大学相关团队开发，采用 Apache 2.0 许可，可免费用于商业用途。GitHub 已登上 Trending。你只要给它一小段录音，它就能把这个人的声音完整复刻下来。口音、情绪、语速、呼吸的节奏，分毫不差。输出是 48kHz 的录音棚品质，普通人根本听不出是 AI 生成的。更离谱的是，你甚至可以用文字直接创造声音。写一句“二十多岁的女生，声音温柔带点沙哑”，它就能从无到有生成一个完全符合描述的声音。不用找参考音频，不用请配音演员，连麦克风都不用开。它的能力有多夸张呢： • 文字造声：描述性别、年龄、音色、情绪，AI 直接生成 • 完美克隆：上传 1 分钟音频，复刻所有声音细节 • 可控克隆：克隆后还能改情绪，比如“语速加快，带着一点兴奋” • 极致还原：给音频加对应文本，连语气的细微起伏都能复现 • 30 种语言自动识别，不用手动标注 • 上下文感知，读新闻像主播，讲故事像说书人 • RTX 4090 上生成速度比播放还快 • 8G 显存就能跑，普通游戏本都能用 • 用 5-10 分钟自己的声音微调，就能得到专属声音模型最震撼的是第三方基准测试的结果：英语相似度 VoxCPM2 85.4% vs ElevenLabs 61.3% 中文相似度 VoxCPM2 82.5% vs ElevenLabs 67.7% 阿拉伯语相似度 VoxCPM2 79.1% vs ElevenLabs 70.6% 一个免费开源项目，在核心指标上全面碾压了行业标杆。专业配音一个项目 250 到 1000 美元 AI 语音平台每月 5 到 100 美元录音棚每小时 200 美元 VoxCPM2 完全运行在你本地电脑上。没有 API 费用，没有按字符计费，没有订阅。永远免费，还能商用。一行命令就能安装：pip install voxcpm 以下中文实测视频是电磁波Studio 老哥提供，供大家参考，作为新开源模型，在情绪控制稳定性、长文本一致性、企业级可靠性等方面可能仍有提升空间，实际使用体验建议大家亲自测试， GitHub地址和在线 Demo老规矩评论区自取 👇

holy shit，刷到一个开源语音生成项目，中英文语音效果真的吊炸，有点行业掀桌子的意思🚀 ElevenLabs 个人版每月 $5 到 $99 ，商业版更是开到 $1320一个月，现在这个完全开源、免费本地运行的模型 VoxCPM2，在部分语音相似度基准上表现我想用惊人来形容🤩 根据公开的 Minimax-MLS 语音相似度测试： • 英语：VoxCPM2 得分 85.4%，ElevenLabs 为 61.3% • 中文：VoxCPM2 得分 82.5%，ElevenLabs 为 67.7% • 阿拉伯语：VoxCPM2 得分 79.1%，ElevenLabs 为 70.6% 支持 30 种语言、48kHz 工作室级输出，可通过短音频片段进行语音克隆，也支持纯文本描述生成新声音（Voice Design），并能在本地 GPU 上运行（最低约 8GB VRAM）。项目由 OpenBMB 与清华大学相关团队开发，采用 Apache 2.0 许可，可免费用于商业用途。GitHub 已登上 Trending。你只要给它一小段录音，它就能把这个人的声音完整复刻下来。口音、情绪、语速、呼吸的节奏，分毫不差。输出是 48kHz 的录音棚品质，普通人根本听不出是 AI 生成的。更离谱的是，你甚至可以用文字直接创造声音。写一句“二十多岁的女生，声音温柔带点沙哑”，它就能从无到有生成一个完全符合描述的声音。不用找参考音频，不用请配音演员，连麦克风都不用开。它的能力有多夸张呢： • 文字造声：描述性别、年龄、音色、情绪，AI 直接生成 • 完美克隆：上传 1 分钟音频，复刻所有声音细节 • 可控克隆：克隆后还能改情绪，比如“语速加快，带着一点兴奋” • 极致还原：给音频加对应文本，连语气的细微起伏都能复现 • 30 种语言自动识别，不用手动标注 • 上下文感知，读新闻像主播，讲故事像说书人 • RTX 4090 上生成速度比播放还快 • 8G 显存就能跑，普通游戏本都能用 • 用 5-10 分钟自己的声音微调，就能得到专属声音模型最震撼的是第三方基准测试的结果：英语相似度 VoxCPM2 85.4% vs ElevenLabs 61.3% 中文相似度 VoxCPM2 82.5% vs ElevenLabs 67.7% 阿拉伯语相似度 VoxCPM2 79.1% vs ElevenLabs 70.6% 一个免费开源项目，在核心指标上全面碾压了行业标杆。专业配音一个项目 250 到 1000 美元 AI 语音平台每月 5 到 100 美元录音棚每小时 200 美元 VoxCPM2 完全运行在你本地电脑上。没有 API 费用，没有按字符计费，没有订阅。永远免费，还能商用。一行命令就能安装：pip install voxcpm 以下中文实测视频是电磁波Studio 老哥提供，供大家参考，作为新开源模型，在情绪控制稳定性、长文本一致性、企业级可靠性等方面可能仍有提升空间，实际使用体验建议大家亲自测试， GitHub地址和在线 Demo老规矩评论区自取 👇

AYi

49,240 görüntüleme • 2 ay önce

阿里巴巴开发的这个模型有点像Heygen的声音克隆+对嘴型了。如果能用的话，用自己的照片和音频就可以生成各种对话视频，唱歌视频，快节奏说唱，跨演员表演等等，厉害哦。以后能应用的领域就更多了，持续关注，感兴趣的同学可以收藏起来。#EMO：Emote Portrait Alive 直达传送门地址： GitHub：

阿里巴巴开发的这个模型有点像Heygen的声音克隆+对嘴型了。如果能用的话，用自己的照片和音频就可以生成各种对话视频，唱歌视频，快节奏说唱，跨演员表演等等，厉害哦。以后能应用的领域就更多了，持续关注，感兴趣的同学可以收藏起来。#EMO：Emote Portrait Alive 直达传送门地址： GitHub：

穆尼

75,468 görüntüleme • 2 yıl önce

想要生成逼真的 AI 语音，通常使用在线 API 服务，不仅有隐私泄露风险，而且支付费用成本还不低。今天发现了一个开源免费的超逼真语音合成模型：NeuTTS Air，仅 0.5B 参数，可直接在本地电脑运行。生成的语音媲美真人，支持仅用 3 秒音频就能完成声音克隆，在手机、笔记本甚至树莓派上都能流畅运行。 GitHub：主要特性： - 超逼真语音合成，生成接近真人水平的自然语音； - 即时声音克隆，仅需 3 秒音频样本即可复制声音特征； - 完全本地运行，无需网络连接保护隐私安全； - 轻量级设计，支持手机、电脑和嵌入式设备部署； - 实时语音生成，在中等配置设备上也能流畅运行； - 内置水印技术，确保生成音频的责任可追溯性。根据 README 文档提供的详细使用教程，克隆项目安装 espeak 依赖后即可使用。

想要生成逼真的 AI 语音，通常使用在线 API 服务，不仅有隐私泄露风险，而且支付费用成本还不低。今天发现了一个开源免费的超逼真语音合成模型：NeuTTS Air，仅 0.5B 参数，可直接在本地电脑运行。生成的语音媲美真人，支持仅用 3 秒音频就能完成声音克隆，在手机、笔记本甚至树莓派上都能流畅运行。 GitHub：主要特性： - 超逼真语音合成，生成接近真人水平的自然语音； - 即时声音克隆，仅需 3 秒音频样本即可复制声音特征； - 完全本地运行，无需网络连接保护隐私安全； - 轻量级设计，支持手机、电脑和嵌入式设备部署； - 实时语音生成，在中等配置设备上也能流畅运行； - 内置水印技术，确保生成音频的责任可追溯性。根据 README 文档提供的详细使用教程，克隆项目安装 espeak 依赖后即可使用。

GitHubDaily

59,269 görüntüleme • 8 ay önce

用自己的声音唱任何歌曲，解救五音不全！制作过程分享： 1. kits在线录音或上传纯唱歌音频克隆音色 2. kits上传任意歌曲，克隆人声唱歌部分 3. 原始歌曲用vocalremover .org 去人声，保留音乐 4. 把kits做好的人声+纯音乐导入剪映，合成音乐改天写个详细教程

用自己的声音唱任何歌曲，解救五音不全！制作过程分享： 1. kits在线录音或上传纯唱歌音频克隆音色 2. kits上传任意歌曲，克隆人声唱歌部分 3. 原始歌曲用vocalremover .org 去人声，保留音乐 4. 把kits做好的人声+纯音乐导入剪映，合成音乐改天写个详细教程

向阳乔木

39,006 görüntüleme • 8 ay önce

效果非常不错的一款TTS，一个完全非自回归的TTS模型：MaskGCT 它不需要文本和语音之间的显式对齐信息，也不需要音素级别的持续时间预测，采用了掩码和预测的学习方式，在声音克隆、跨语种合成、语音控制等方面表现优秀 1、支持控制生成语音的总长度，可调节语速、停顿等韵律特征、支持情感控制和语气调整，比如开心的、悲伤的、生气的、平静的等情绪 2、支持零样本语音合成，可以修改已生成的语音，支持声音转换和克隆 github：项目： #TTS #MaskGCT

效果非常不错的一款TTS，一个完全非自回归的TTS模型：MaskGCT 它不需要文本和语音之间的显式对齐信息，也不需要音素级别的持续时间预测，采用了掩码和预测的学习方式，在声音克隆、跨语种合成、语音控制等方面表现优秀 1、支持控制生成语音的总长度，可调节语速、停顿等韵律特征、支持情感控制和语气调整，比如开心的、悲伤的、生气的、平静的等情绪 2、支持零样本语音合成，可以修改已生成的语音，支持声音转换和克隆 github：项目： #TTS #MaskGCT

AIGCLINK

103,720 görüntüleme • 1 yıl önce

兄弟， DomoAI 新功能上传语音+图像直接生成会说话的数字人嘿嘿 🫡 我测试了下，挺好玩的，而且比其他家速度快很多中文的支持能力也不错可以生成5秒、10秒、20秒、30秒，最长支持60秒的生成。也支持文本转语音功能，内置6种声音，生成语音后再生成数字人，也支持上传自己的声音。还可以指定声音的情绪状态。

兄弟， DomoAI 新功能上传语音+图像直接生成会说话的数字人嘿嘿 🫡 我测试了下，挺好玩的，而且比其他家速度快很多中文的支持能力也不错可以生成5秒、10秒、20秒、30秒，最长支持60秒的生成。也支持文本转语音功能，内置6种声音，生成语音后再生成数字人，也支持上传自己的声音。还可以指定声音的情绪状态。

小互

40,119 görüntüleme • 1 yıl önce

分享一个mac语音转文字的信息差！这个真的非常好用，直接按住fn键就可以了不需要下载任何其他app，直接就能用我以为大家都知道呢。。。太方便了

分享一个mac语音转文字的信息差！这个真的非常好用，直接按住fn键就可以了不需要下载任何其他app，直接就能用我以为大家都知道呢。。。太方便了

天策

25,239 görüntüleme • 3 ay önce

卧槽，发现一个好东西视频翻译，字幕，配音，语音克隆，一体方案 KrillinAI - 免费免费免费 - 出海开发酱可以替代剪映了 • 支持多种语言，英语和中文都不错（王炸功能） • 支持 Win 和 Mac，下载即用 • 一键启动 - 即刻开启你的工作流 • 视频导入 - 支持 yt-dlp 下载和本地文件上传 • 精准字幕 - 基于 Whisper 的高精度识别 • 智能分段 - 基于 LLM 的字幕分段与对齐 • 专业翻译 - 按段翻译，确保上下文一致性 • 术语替换 - 一键替换领域专用词汇 • 配音与声音克隆 - 支持 CosyVoice 选音或声音克隆 • 视频合成 - 自动适配横屏/竖屏等格式可以看下视频里面的 TTS 效果，非常不错。

卧槽，发现一个好东西视频翻译，字幕，配音，语音克隆，一体方案 KrillinAI - 免费免费免费 - 出海开发酱可以替代剪映了 • 支持多种语言，英语和中文都不错（王炸功能） • 支持 Win 和 Mac，下载即用 • 一键启动 - 即刻开启你的工作流 • 视频导入 - 支持 yt-dlp 下载和本地文件上传 • 精准字幕 - 基于 Whisper 的高精度识别 • 智能分段 - 基于 LLM 的字幕分段与对齐 • 专业翻译 - 按段翻译，确保上下文一致性 • 术语替换 - 一键替换领域专用词汇 • 配音与声音克隆 - 支持 CosyVoice 选音或声音克隆 • 视频合成 - 自动适配横屏/竖屏等格式可以看下视频里面的 TTS 效果，非常不错。

艾略特

113,761 görüntüleme • 1 yıl önce