Gorden Sun's banner
Gorden Sun's profile picture

Gorden Sun

@Gorden_Sun57,606 subscribers

只发AI相关信息,个人维护的AI资讯日报(已连续日更3年)👇

Shorts

你问别人怎么做的,我给你默默做好了CuiMao 在线玩: Github:

你问别人怎么做的,我给你默默做好了CuiMao 在线玩: Github:

99,103 görüntüleme

阿里的欢乐马发布了,效果远远比不上Seedance 2.0,而且价格也不便宜。 使用地址: 下方视频1是Seedance 2.0生成,视频2是欢乐马生成。

阿里的欢乐马发布了,效果远远比不上Seedance 2.0,而且价格也不便宜。 使用地址: 下方视频1是Seedance 2.0生成,视频2是欢乐马生成。

53,717 görüntüleme

我现在已经不在即梦用Seedance 2.0了,即使是年付最高会员也得排好几个小时才出视频。改在Yapper用,目前仅对邀请的创作者开放Seedance 2.0模型,15分钟就能生成15秒长度的视频,爽爆了。如果你是有影响力的创作者,我可以帮你引荐。Yapper 官网:

我现在已经不在即梦用Seedance 2.0了,即使是年付最高会员也得排好几个小时才出视频。改在Yapper用,目前仅对邀请的创作者开放Seedance 2.0模型,15分钟就能生成15秒长度的视频,爽爆了。如果你是有影响力的创作者,我可以帮你引荐。Yapper 官网:

87,409 görüntüleme

火山引擎目前可以免费用Seedance 2.0,能免费生成8次15秒长度的视频,速度极快不用排队。 使用地址:

火山引擎目前可以免费用Seedance 2.0,能免费生成8次15秒长度的视频,速度极快不用排队。 使用地址:

65,641 görüntüleme

《Veo 3 Prompt完全指南》 结合我的使用经验,整理了Replicate和谷歌官方的Veo 3指南,写了一篇文章详细介绍Veo 3的提示词写法。

《Veo 3 Prompt完全指南》 结合我的使用经验,整理了Replicate和谷歌官方的Veo 3指南,写了一篇文章详细介绍Veo 3的提示词写法。

111,205 görüntüleme

One-to-All Animation:让照片动起来 能让照片人物,按参考视频的动作动起来,基于Wan2.1训练,效果比Wan2.2 Animate还好一些,支持大幅度的动作复刻。 Github: ComfyUI工作流:

One-to-All Animation:让照片动起来 能让照片人物,按参考视频的动作动起来,基于Wan2.1训练,效果比Wan2.2 Animate还好一些,支持大幅度的动作复刻。 Github: ComfyUI工作流:

60,006 görüntüleme

Fun-CineForge:阿里开源的AI生成影视配音 输入视频+文本,AI生成配音,能识别多个角色,能按要求设置配音风格,生成的配音节奏与视频里说话的唇形同步。演示视频的声音效果非常好。 项目地址: 模型:

Fun-CineForge:阿里开源的AI生成影视配音 输入视频+文本,AI生成配音,能识别多个角色,能按要求设置配音风格,生成的配音节奏与视频里说话的唇形同步。演示视频的声音效果非常好。 项目地址: 模型:

26,823 görüntüleme

HeyGen实现流程中的语音克隆,现在有最佳开源方案了:XTTS v2,单样本即可克隆语音,效果见视频。 现在已经能实现:让一个明星的采访视频,变成他讲述任意小故事(内容可以GPT编)的视频,声音是他的声音,嘴型也能对上。 XTTS v2在线体验: Github:

HeyGen实现流程中的语音克隆,现在有最佳开源方案了:XTTS v2,单样本即可克隆语音,效果见视频。 现在已经能实现:让一个明星的采访视频,变成他讲述任意小故事(内容可以GPT编)的视频,声音是他的声音,嘴型也能对上。 XTTS v2在线体验: Github:

169,638 görüntüleme

推上的朋友应该用不到,但是很有必要给国内的朋友做一个免费、双击就用的小白版本nano banana。 我做了一个,无需登录、无需VPN、API Key我都覆盖了。 双击打开本地html文件,输入提示词、上传要编辑的图片,几秒出结果。

推上的朋友应该用不到,但是很有必要给国内的朋友做一个免费、双击就用的小白版本nano banana。 我做了一个,无需登录、无需VPN、API Key我都覆盖了。 双击打开本地html文件,输入提示词、上传要编辑的图片,几秒出结果。

54,517 görüntüleme

B站上大分!IndexTTS2 名副其实的好! 不仅能克隆音色,而且能还原情感和语调,这一点比11Labs还要强的多。

B站上大分!IndexTTS2 名副其实的好! 不仅能克隆音色,而且能还原情感和语调,这一点比11Labs还要强的多。

52,807 görüntüleme

Grok上线Imagine 1.0版本了,可以生成10秒长度视频 好,快,还免费。

Grok上线Imagine 1.0版本了,可以生成10秒长度视频 好,快,还免费。

27,432 görüntüleme

新版本DeepSeek生成的天气卡片,挺好看,但比Gemini的美学还是弱一些

新版本DeepSeek生成的天气卡片,挺好看,但比Gemini的美学还是弱一些

23,484 görüntüleme

Google AI Studio升级 最大的亮点是新增了很多Starter Apps,包括GIF Maker(生成动图)、Co-Drawing(辅助绘画)、Video Toys(基于视频创建教育应用)等许多有趣的小应用。 官方介绍:

Google AI Studio升级 最大的亮点是新增了很多Starter Apps,包括GIF Maker(生成动图)、Co-Drawing(辅助绘画)、Video Toys(基于视频创建教育应用)等许多有趣的小应用。 官方介绍:

56,043 görüntüleme

千问开源Qwen3-TTS 除了常规的文本生成语音,还支持设计声音和语音克隆。分0.6B和1.7B两个大小。效果不错,速度也很快。语音克隆的音色还原还可以,但是情感还原上不如Index TTS2。 模型: 在线体验:

千问开源Qwen3-TTS 除了常规的文本生成语音,还支持设计声音和语音克隆。分0.6B和1.7B两个大小。效果不错,速度也很快。语音克隆的音色还原还可以,但是情感还原上不如Index TTS2。 模型: 在线体验:

18,202 görüntüleme

LiveAvatar:阿里夸克开源的实时虚拟人模型 能实时生成虚拟人视频(需要5个H800),能生成无限长度的视频且画质不降低。 模型: 项目地址:

LiveAvatar:阿里夸克开源的实时虚拟人模型 能实时生成虚拟人视频(需要5个H800),能生成无限长度的视频且画质不降低。 模型: 项目地址:

21,588 görüntüleme

这个视频不是从抖音截的,而是AI生成的。 短视频即将迎来自产自足的时代,要是不受监管的模型也发展起来了,那画面太美我都不敢想。

这个视频不是从抖音截的,而是AI生成的。 短视频即将迎来自产自足的时代,要是不受监管的模型也发展起来了,那画面太美我都不敢想。

47,489 görüntüleme

EchoMimicV2:生成数字人 相比v1版本,从数字脸扩展为数字人,输入1张图+1段手势视频+1段音频,即可生成数字人说该音频的、带手势、带头部动作的视频。 项目地址: Github:

EchoMimicV2:生成数字人 相比v1版本,从数字脸扩展为数字人,输入1张图+1段手势视频+1段音频,即可生成数字人说该音频的、带手势、带头部动作的视频。 项目地址: Github:

38,581 görüntüleme

一键生成风格视频 填写OpenRouter Key,上传图片和背景音乐,调用nano banana随时生成10种转换风格的图片并合成视频。 效果如视频1所示。操作步骤如视频2所示。

一键生成风格视频 填写OpenRouter Key,上传图片和背景音乐,调用nano banana随时生成10种转换风格的图片并合成视频。 效果如视频1所示。操作步骤如视频2所示。

14,287 görüntüleme

Long-LRM:根据图片还原场景 输入32张的场景图片,即可还原出整个3D场景。 项目地址:

Long-LRM:根据图片还原场景 输入32张的场景图片,即可还原出整个3D场景。 项目地址:

24,002 görüntüleme

Videos