正在加载视频...

视频加载失败

加载此视频时出现问题。这可能是由于临时网络问题，或视频可能不可用。

新加坡国立大学Show Lab放出了一款教育视频自动生成工具：Code2Video，非常实用把写教案升级为了自动代码动画生成，同时更好的解决了生成内容逻辑结构和视觉准确性的问题对老师来说，只需要输入教学主题就能自动获得一个3Blue1Brown风的教学动画 Code2Video核心是让AI先自动写Manim Python代码，然后再渲染出教育视频，并非直接出视频。是一个多智能体架构，包括Planner、Coder和Critic 看给出的效果，跟Veo3、Wan-2.1比，Code2Video在逻辑结构、知识准确性，以及教学清晰度上表现更好一些视频通过代码生成，对生成的每个元素、动作、公式都可以精准控制，这就比较适合需要逻辑结构和视觉准确性的教学场景 #AI教学视频生成 #AI公式视频 #AI教育 #Code2Video

AIGCLINK

36,132 subscribers

35,757 次观看 • 8 个月前 •via X (Twitter)

科学技术教育艺术

Anya Rossi• Live Now

Private livecam show

0 条评论

暂无评论

原始帖子的评论将显示在这里

相关视频

可以拿来做教育演示的一款动画引擎AI工具，Fogsight，给定一个概念词，它即会生成一段叙事完整的动画整个动画的叙事完整性、趣味性、视觉效果都还可以，用在教育上，把抽象概念做成教学动画非常实用生成的动画还配有双语旁白智能编排，从旁白、视觉元素到动态效果，整个工作流自动完成有用户界面，可以进一步编辑和优化生成效果代码作者是开源的，见下条 #AI教学动画 #Fogsight #AI教育

可以拿来做教育演示的一款动画引擎AI工具，Fogsight，给定一个概念词，它即会生成一段叙事完整的动画整个动画的叙事完整性、趣味性、视觉效果都还可以，用在教育上，把抽象概念做成教学动画非常实用生成的动画还配有双语旁白智能编排，从旁白、视觉元素到动态效果，整个工作流自动完成有用户界面，可以进一步编辑和优化生成效果代码作者是开源的，见下条 #AI教学动画 #Fogsight #AI教育

AIGCLINK

56,108 次观看 • 11 个月前

AI教育领域的应用，一个AI数理化老师：TheoremExplainAgent，它可以生成5分钟动画视频来给学生讲解数学公式和科学定理，实用性很强双智能体架构设计：一个规划智能体，负责备课，设计教案，写讲稿一个编程智能体，负责制作课件，用Manim生成Python动画脚本及相应音频支持数学、物理、化学、计算机科学等学科代码即将开源 #AI教学工具 #AI老师 #TheoremExplainAgent #AI教学视频

AI教育领域的应用，一个AI数理化老师：TheoremExplainAgent，它可以生成5分钟动画视频来给学生讲解数学公式和科学定理，实用性很强双智能体架构设计：一个规划智能体，负责备课，设计教案，写讲稿一个编程智能体，负责制作课件，用Manim生成Python动画脚本及相应音频支持数学、物理、化学、计算机科学等学科代码即将开源 #AI教学工具 #AI老师 #TheoremExplainAgent #AI教学视频

AIGCLINK

100,261 次观看 • 1 年前

非常酷的用例，Christian H. Cooper 基于DeepSeek R1-Zero生成的Manim数学动画视频，不到30秒钟无误的生成了勾股定理解释动画，9分钟一次性完成了量子电动力学概念的视觉化。未来教育和知识的传播越来越便捷 #数学动画 #DeepSeekR1Zero #AI数学动画生成

非常酷的用例，Christian H. Cooper 基于DeepSeek R1-Zero生成的Manim数学动画视频，不到30秒钟无误的生成了勾股定理解释动画，9分钟一次性完成了量子电动力学概念的视觉化。未来教育和知识的传播越来越便捷 #数学动画 #DeepSeekR1Zero #AI数学动画生成

AIGCLINK

39,230 次观看 • 1 年前

划重点 Gemini 2.5 Pro（I/O 预览版）可基于一段 YouTube 视频，自动生成交互式学习 App 包括内容提取、界面构建与逻辑生成，使得AI 正从“语言驱动代码”进化为“视频驱动产品”的多模态阶段。也就是Gemini 2.5可以观看一段视频，并根据视频的内容自动生成关于该视频的交互式程序。🙂

划重点 Gemini 2.5 Pro（I/O 预览版）可基于一段 YouTube 视频，自动生成交互式学习 App 包括内容提取、界面构建与逻辑生成，使得AI 正从“语言驱动代码”进化为“视频驱动产品”的多模态阶段。也就是Gemini 2.5可以观看一段视频，并根据视频的内容自动生成关于该视频的交互式程序。🙂

小互

36,841 次观看 • 1 年前

卧槽一句话生成任何知识讲解视频 VideoTutor ：输入任何问题 AI 自动创建带清晰视觉效果和旁白的短视频课程类似可汗学院那是视频风格主要面向K12教育支持上传问题（如 SAT 数学题截图），生成定制化教学视频还能根据学生年级自动调整讲解深度测试效果很不错，见2楼↓ 覆盖多种语言，可以生成包括中文、英语、日语在内的多种语言视频

卧槽一句话生成任何知识讲解视频 VideoTutor ：输入任何问题 AI 自动创建带清晰视觉效果和旁白的短视频课程类似可汗学院那是视频风格主要面向K12教育支持上传问题（如 SAT 数学题截图），生成定制化教学视频还能根据学生年级自动调整讲解深度测试效果很不错，见2楼↓ 覆盖多种语言，可以生成包括中文、英语、日语在内的多种语言视频

小互

48,469 次观看 • 1 年前

Pixelle-Video 一款全自动短视频生成引擎，只需输入一个主题，便能自动完成视频文案撰写、AI 配图生成、语音合成、背景音乐添加以及视频合成等一系列操作。

Pixelle-Video 一款全自动短视频生成引擎，只需输入一个主题，便能自动完成视频文案撰写、AI 配图生成、语音合成、背景音乐添加以及视频合成等一系列操作。

Fang知识分享

47,179 次观看 • 5 个月前

HeyGen这次开源，把AI做视频的最后一道门槛拆没了🤯 他们用Claude Code写代码，做了自己的50秒产品发布视频，然后把整个工具链完整开源给了所有人，致敬开源🫡 以后做视频真的能简单到离谱，给一句话，做一个30秒的产品介绍，给一个PDF，自动生成总结视频，迭代就是改一句话的事，比如把标题放大两倍，第三秒加一个淡入转场等，这个工具叫HyperFrames，本质上就是一个纯HTML转MP4的视频渲染框架。所以其实我们不用学任何剪辑软件，也不用写复杂的React代码，只要写普通HTML，加几个简单的data属性，就能定义视频的每一帧、时间线、动画和音轨。 HyperFrames从第一天起就是为AI代理原生设计的。 AI天生就会写HTML，现在Claude、Cursor、Gemini所有编码Agent，只要装一个skill，立刻就会做视频。这妥妥的降维打击啊，以前Remotion把视频变成了代码，但它需要你会React，需要构建流程，属于开发者专属的玩具。 HyperFrames是把视频变成了纯HTML，零构建，无DSL，不需要任何前置知识。说白了，Remotion是给人写的，HyperFrames是给AI写的。以前AI能写文字，能生成图片，但视频一直是最后一块硬骨头，现在这块骨头也被啃下来了。代理现在能端到端完成一整条内容流水线，调研，写脚本，做设计，加动画，最后直接渲染出成品视频，全程不需要人类碰一下。它还自带50+官方现成组件，社交遮罩、图表、转场，一行命令一键安装。支持GSAP、Lottie、Three.js所有主流动画库，随便混用。也就是说，同一份HTML永远出一样的结果，完美适合自动化流水线。官方甚至把视频语言都标准化了，缓动用snappy，bouncy，转场用能量等级，字幕分Hype/Corporate/Tutorial三种风格。 AI只要学会这套词汇，就能稳定输出专业级视频，这不就是在教AI做导演嘛🤣 这对HeyGen来说也是一步妙棋，他们不再只是一个卖AI头像的SaaS公司，现在能做整个AI视频时代的基础设施了，未来所有AI代理生成的视频都能跑在HyperFrames上。然后再无缝接入HeyGen的头像、语音、翻译能力，形成一个完美的闭环。当然目前也不是完美的，初期输出还有AI味，超过一分钟的复杂长视频，渲染还需要较强算力。但我觉得这都不重要，关键是它第一次把完整的视频生产力交给了AI Agent，相当于AI内容创作时代的又一个里程碑。想试的直接去GitHub搜heygen-com/hyperframes。跑一行npx hyperframes init，然后让Claude帮你做第一个视频。 #HyperFrames #HeyGen #AI视频 #AI代理 #开发者 #内容创作

HeyGen这次开源，把AI做视频的最后一道门槛拆没了🤯 他们用Claude Code写代码，做了自己的50秒产品发布视频，然后把整个工具链完整开源给了所有人，致敬开源🫡 以后做视频真的能简单到离谱，给一句话，做一个30秒的产品介绍，给一个PDF，自动生成总结视频，迭代就是改一句话的事，比如把标题放大两倍，第三秒加一个淡入转场等，这个工具叫HyperFrames，本质上就是一个纯HTML转MP4的视频渲染框架。所以其实我们不用学任何剪辑软件，也不用写复杂的React代码，只要写普通HTML，加几个简单的data属性，就能定义视频的每一帧、时间线、动画和音轨。 HyperFrames从第一天起就是为AI代理原生设计的。 AI天生就会写HTML，现在Claude、Cursor、Gemini所有编码Agent，只要装一个skill，立刻就会做视频。这妥妥的降维打击啊，以前Remotion把视频变成了代码，但它需要你会React，需要构建流程，属于开发者专属的玩具。 HyperFrames是把视频变成了纯HTML，零构建，无DSL，不需要任何前置知识。说白了，Remotion是给人写的，HyperFrames是给AI写的。以前AI能写文字，能生成图片，但视频一直是最后一块硬骨头，现在这块骨头也被啃下来了。代理现在能端到端完成一整条内容流水线，调研，写脚本，做设计，加动画，最后直接渲染出成品视频，全程不需要人类碰一下。它还自带50+官方现成组件，社交遮罩、图表、转场，一行命令一键安装。支持GSAP、Lottie、Three.js所有主流动画库，随便混用。也就是说，同一份HTML永远出一样的结果，完美适合自动化流水线。官方甚至把视频语言都标准化了，缓动用snappy，bouncy，转场用能量等级，字幕分Hype/Corporate/Tutorial三种风格。 AI只要学会这套词汇，就能稳定输出专业级视频，这不就是在教AI做导演嘛🤣 这对HeyGen来说也是一步妙棋，他们不再只是一个卖AI头像的SaaS公司，现在能做整个AI视频时代的基础设施了，未来所有AI代理生成的视频都能跑在HyperFrames上。然后再无缝接入HeyGen的头像、语音、翻译能力，形成一个完美的闭环。当然目前也不是完美的，初期输出还有AI味，超过一分钟的复杂长视频，渲染还需要较强算力。但我觉得这都不重要，关键是它第一次把完整的视频生产力交给了AI Agent，相当于AI内容创作时代的又一个里程碑。想试的直接去GitHub搜heygen-com/hyperframes。跑一行npx hyperframes init，然后让Claude帮你做第一个视频。 #HyperFrames #HeyGen #AI视频 #AI代理 #开发者 #内容创作

AYi

36,425 次观看 • 2 个月前

以前想要制作数学和物理教学这类交互动画，需要用到 Manim 这些专业工具，还得搞清楚 LaTeX 公式渲染和相机运动等。现在用 Math-To-Manim 这个开源 AI 工具，只需要一句话简单描述就能自动生成完整的交互动画。从分析概念逐步构建到目标主题，自动生成包含详细 LaTeX 公式和镜头设计，全流程自动化完成。 GitHub：同时输出动画代码和完整的 LaTeX 学习笔记文档，并提供了 55+ 个涵盖物理、数学、计算机科学等领域的示例动画。通过克隆代码到本地，安装相关依赖，并配置好模型 API Key，即可在可视化操作界面输入描述生成动画。

以前想要制作数学和物理教学这类交互动画，需要用到 Manim 这些专业工具，还得搞清楚 LaTeX 公式渲染和相机运动等。现在用 Math-To-Manim 这个开源 AI 工具，只需要一句话简单描述就能自动生成完整的交互动画。从分析概念逐步构建到目标主题，自动生成包含详细 LaTeX 公式和镜头设计，全流程自动化完成。 GitHub：同时输出动画代码和完整的 LaTeX 学习笔记文档，并提供了 55+ 个涵盖物理、数学、计算机科学等领域的示例动画。通过克隆代码到本地，安装相关依赖，并配置好模型 API Key，即可在可视化操作界面输入描述生成动画。

GitHubDaily

39,865 次观看 • 8 个月前

港大和字节的这个广告视频生成模型很赞，Goku+，可以生成20秒以上的广告宣传片、生成口播/走播视频，目前没代码效果看上去画面稳定，没有明显的闪烁或抖动，人物及面部自然、动作流畅支持室内/户外、产品特写、人物互动场景等，适合电商、品牌营销等商业广告 Goku+是Goku的优化版，主打广告生成 Goku是一个基于流的视频生成基础模型，支持风景、人物、动物、动作多种场景，支持写实风、动画风 #AI视频 #AI广告制作 #Goku #视频生成 #广告视频生成

港大和字节的这个广告视频生成模型很赞，Goku+，可以生成20秒以上的广告宣传片、生成口播/走播视频，目前没代码效果看上去画面稳定，没有明显的闪烁或抖动，人物及面部自然、动作流畅支持室内/户外、产品特写、人物互动场景等，适合电商、品牌营销等商业广告 Goku+是Goku的优化版，主打广告生成 Goku是一个基于流的视频生成基础模型，支持风景、人物、动物、动作多种场景，支持写实风、动画风 #AI视频 #AI广告制作 #Goku #视频生成 #广告视频生成

AIGCLINK

16,374 次观看 • 1 年前

这期视频我们用Cursor做了一个浏览器插件用来爬取Coze模板 + 新浪财经中概股的数据，一键保存csv。我们会学到：如何让AI解析网页结构并给出获取数据代码、如何实现表格自动翻页逻辑等知识。源码+更详细的手把手教学视频👇👇👇

这期视频我们用Cursor做了一个浏览器插件用来爬取Coze模板 + 新浪财经中概股的数据，一键保存csv。我们会学到：如何让AI解析网页结构并给出获取数据代码、如何实现表格自动翻页逻辑等知识。源码+更详细的手把手教学视频👇👇👇

Yihui

57,889 次观看 • 1 年前

别傻傻手剪视频了！Codex装上这个插件，直接“写代码”生成MP4！普通人也能批量做号！还在用剪映一帧帧调？太慢了！今天教你个降维打击的野路子：Codex + HyperFrames。不用懂代码，不用会剪辑，HTML直接变视频，效率提升10倍！ 1⃣ 安装与开启：在Codex的插件市场找到“HyperFrames by HeyGen”，一键启用。它能把Codex变成你的“视频导演+剪辑师”。 2⃣ 下达指令（参数锁定）：直接告诉Codex你要做什么。公式：用途 + 尺寸 + 时长 + 风格 + 平台。例：“用HyperFrames做一个3:4竖屏教程视频，45秒，Swiss Pulse风格，用来发抖音。” Codex会自动拆结构、写分镜、安排时间轴。 3⃣ 全自动执行流：你只需看着它跑。Codex会自动生成HTML源文件、GSAP动画、同步字幕、甚至配音。核心逻辑：HTML就是视频源文件。文字、卡片、时间轴全用代码精确控制，改一个参数，整个视频自动更新。 4⃣ 一键导出：跑完流程，直接预览并渲染成MP4。特别适合做工具教程、产品宣传片、数据图表视频。别把时间浪费在重复劳动上。这套SOP跑通了，你一个人就是一个MCN。

别傻傻手剪视频了！Codex装上这个插件，直接“写代码”生成MP4！普通人也能批量做号！还在用剪映一帧帧调？太慢了！今天教你个降维打击的野路子：Codex + HyperFrames。不用懂代码，不用会剪辑，HTML直接变视频，效率提升10倍！ 1⃣ 安装与开启：在Codex的插件市场找到“HyperFrames by HeyGen”，一键启用。它能把Codex变成你的“视频导演+剪辑师”。 2⃣ 下达指令（参数锁定）：直接告诉Codex你要做什么。公式：用途 + 尺寸 + 时长 + 风格 + 平台。例：“用HyperFrames做一个3:4竖屏教程视频，45秒，Swiss Pulse风格，用来发抖音。” Codex会自动拆结构、写分镜、安排时间轴。 3⃣ 全自动执行流：你只需看着它跑。Codex会自动生成HTML源文件、GSAP动画、同步字幕、甚至配音。核心逻辑：HTML就是视频源文件。文字、卡片、时间轴全用代码精确控制，改一个参数，整个视频自动更新。 4⃣ 一键导出：跑完流程，直接预览并渲染成MP4。特别适合做工具教程、产品宣传片、数据图表视频。别把时间浪费在重复劳动上。这套SOP跑通了，你一个人就是一个MCN。

Vincent | 信号＞噪音

85,386 次观看 • 1 个月前

AI 做视频，终于不用自己一帧帧剪了分享 6 个可以直接用的视频类 Claude Skills： ① HyperFrames 一句话生成动效视频。基于 HTML/CSS，文章、推文、产品介绍丢进去，直接变成动效视频并渲染为 MP4。适合产品宣发、教程开场和社交短视频。 ② video-use 让 Codex 帮你剪视频。自动处理停顿、错句、口头禅、字幕和调色。口播、采访、教程视频的粗剪，能省下大量时间。 ③ Remotion Skills 用代码批量做视频。基于 React，字幕、动画和时间轴都能控制。排行榜、数据周报、产品更新等固定栏目，一次写好模板，后续改数据就能出片。 ④ Generative Media Skills AI 多媒体生成工具箱，覆盖图片、视频和音频生成。适合产品广告、UGC 视频、音乐短片和实验性创作。 ⑤ videocut-skills 面向中文创作者的视频剪辑 Agent，能理解中文剪辑需求，协助处理素材、字幕和短视频工作流。 ⑥ seedance2-skill 帮你生成 Seedance 2.0 专业视频提示词，根据创意设计分镜和镜头描述。适合有想法但不会写视频提示词的人。

AI 做视频，终于不用自己一帧帧剪了分享 6 个可以直接用的视频类 Claude Skills： ① HyperFrames 一句话生成动效视频。基于 HTML/CSS，文章、推文、产品介绍丢进去，直接变成动效视频并渲染为 MP4。适合产品宣发、教程开场和社交短视频。 ② video-use 让 Codex 帮你剪视频。自动处理停顿、错句、口头禅、字幕和调色。口播、采访、教程视频的粗剪，能省下大量时间。 ③ Remotion Skills 用代码批量做视频。基于 React，字幕、动画和时间轴都能控制。排行榜、数据周报、产品更新等固定栏目，一次写好模板，后续改数据就能出片。 ④ Generative Media Skills AI 多媒体生成工具箱，覆盖图片、视频和音频生成。适合产品广告、UGC 视频、音乐短片和实验性创作。 ⑤ videocut-skills 面向中文创作者的视频剪辑 Agent，能理解中文剪辑需求，协助处理素材、字幕和短视频工作流。 ⑥ seedance2-skill 帮你生成 Seedance 2.0 专业视频提示词，根据创意设计分镜和镜头描述。适合有想法但不会写视频提示词的人。

撸毛吃猪脚饭

25,397 次观看 • 12 天前

Codex + HyperFrames插件，真的把AI视频生成卷疯了还在剪映里一帧一帧手动抠？醒醒，在Codex只需要敲一行字+插件，一句话就能生成任何视频，动效、转场、字幕、配音全自动，秒改秒出还支持批量下面这个视频就是Codex生成的自媒体人和内容创作者快来学Codex，效率直接拉高十倍

Codex + HyperFrames插件，真的把AI视频生成卷疯了还在剪映里一帧一帧手动抠？醒醒，在Codex只需要敲一行字+插件，一句话就能生成任何视频，动效、转场、字幕、配音全自动，秒改秒出还支持批量下面这个视频就是Codex生成的自媒体人和内容创作者快来学Codex，效率直接拉高十倍

Smartpig

71,930 次观看 • 1 个月前

一款AI一键批量生成短视频及自动发布工具：MoneyPrinterPlus 支持自动混剪，自动发布到抖音、快手、小红书、视频号等平台支持本地语音模型 chatTTS、fasterwhisper、GPTSoVITS以及Azure、阿里云、腾讯云；支持 Stable diffusion 、comfyUI 直接AI生图特点： 1、AI 视频批量混剪: 可以将多个视频片段进行混剪，生成大量不重复的短视频 2、AI 视频生成器: 可以根据关键词生成视频文案，并自动配音和背景音乐 3、批量视频自动上传: 可以将生成的视频自动发布到抖音、快手、小红书、视频号等平台 github： #AI短视频 #MoneyPrinterPlus

一款AI一键批量生成短视频及自动发布工具：MoneyPrinterPlus 支持自动混剪，自动发布到抖音、快手、小红书、视频号等平台支持本地语音模型 chatTTS、fasterwhisper、GPTSoVITS以及Azure、阿里云、腾讯云；支持 Stable diffusion 、comfyUI 直接AI生图特点： 1、AI 视频批量混剪: 可以将多个视频片段进行混剪，生成大量不重复的短视频 2、AI 视频生成器: 可以根据关键词生成视频文案，并自动配音和背景音乐 3、批量视频自动上传: 可以将生成的视频自动发布到抖音、快手、小红书、视频号等平台 github： #AI短视频 #MoneyPrinterPlus

AIGCLINK

47,271 次观看 • 1 年前

Pixverse 发布 R1 实时视频世界模型藏师傅也试了一下前几天测试的 Pixverse R1 终于发布了，这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。极限情况下可以实时生成 1080P 的高清视频，感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验，目前他们在一个单独的平台测试需要邀请码。你可以选择预制的的三个主题进行体验，三个主题分别是巨龙巢穴、二战主题、海底世界，正式版本会增加到 6 个。也可以创建自己的主题，选择画面比例、风格输入主题相关提示词就可以了。生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。而且这里生成的视频居然还是带音乐、音效混合旁白的，比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有：这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流，接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构，用来实现无限连续的生成，还使用了增加注意力机制，确保长时间生成的内容一致性。为了适配实时视频生成的性能，他们将原来的迭代降噪逻辑进行了多项优化，他们叫瞬时响应引擎 (IRE)，主要包括三个优化： Temporal Trajectory Folding：传统模型从噪点到清晰图像需要迭代几十步，他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification：直接将传统的 CFG 逻辑蒸馏到了模型参数内部，节省了时间。 Adaptive Sparse Attention：生成高分辨率的视频的时候让模型学会学会“抓大放小”，自动识别重要区域进行精细计算，大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试，生成的分辨率是 480P，过几天会提高到 720P。

Pixverse 发布 R1 实时视频世界模型藏师傅也试了一下前几天测试的 Pixverse R1 终于发布了，这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。极限情况下可以实时生成 1080P 的高清视频，感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验，目前他们在一个单独的平台测试需要邀请码。你可以选择预制的的三个主题进行体验，三个主题分别是巨龙巢穴、二战主题、海底世界，正式版本会增加到 6 个。也可以创建自己的主题，选择画面比例、风格输入主题相关提示词就可以了。生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。而且这里生成的视频居然还是带音乐、音效混合旁白的，比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有：这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流，接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构，用来实现无限连续的生成，还使用了增加注意力机制，确保长时间生成的内容一致性。为了适配实时视频生成的性能，他们将原来的迭代降噪逻辑进行了多项优化，他们叫瞬时响应引擎 (IRE)，主要包括三个优化： Temporal Trajectory Folding：传统模型从噪点到清晰图像需要迭代几十步，他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification：直接将传统的 CFG 逻辑蒸馏到了模型参数内部，节省了时间。 Adaptive Sparse Attention：生成高分辨率的视频的时候让模型学会学会“抓大放小”，自动识别重要区域进行精细计算，大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试，生成的分辨率是 480P，过几天会提高到 720P。

歸藏(guizang.ai)

16,373 次观看 • 5 个月前

字节跳动的新项目通过音频驱动静态照片生成动态视频并且生成头部和面部的自然动作，如表情变化、头部移动等。模型不仅支持各种音频和视觉风格，还能够生成高度逼真的细节，包括面部的微表情、眉毛和眼睛的细微变化以及头部的自然运动。它还支持生成非言语动作（如叹息、情感驱动的面部表情），使动画更加生动。效果非常不错... Loopy 摒弃了传统音频驱动生成方法中需要手动设定空间运动模板的限制。通过自主学习音频中的运动模式。可以自动生成逼真的肖像动画，无需人为干预，提升了生成过程的效率和灵活性。

字节跳动的新项目通过音频驱动静态照片生成动态视频并且生成头部和面部的自然动作，如表情变化、头部移动等。模型不仅支持各种音频和视觉风格，还能够生成高度逼真的细节，包括面部的微表情、眉毛和眼睛的细微变化以及头部的自然运动。它还支持生成非言语动作（如叹息、情感驱动的面部表情），使动画更加生动。效果非常不错... Loopy 摒弃了传统音频驱动生成方法中需要手动设定空间运动模板的限制。通过自主学习音频中的运动模式。可以自动生成逼真的肖像动画，无需人为干预，提升了生成过程的效率和灵活性。

小互

35,076 次观看 • 1 年前

卧槽，发现一个巨牛批的 AI 视频剪辑工具，这才是完全以 AI 功能构建的视频剪辑产品。 Captions 这个产品可以自动识别超长视频的有价值判断并且自动剪辑成多条适合传播的短视频。生成的短视频可以选择对应的字幕模板，并且支持AI 自动在对应的视频片段添加音效、贴纸等增加氛围的内容。此外还支持AI眼神注视、AI 降噪、 AI 唇形同步、 AI 调色等一系列自动化的 AI 能力。最重要的还是网页版本的，任何平台都能用，这要完善一点不得把剪映干稀烂？可惜的是暂时还不支持翻译，看选项后面会有自动字幕翻译。

卧槽，发现一个巨牛批的 AI 视频剪辑工具，这才是完全以 AI 功能构建的视频剪辑产品。 Captions 这个产品可以自动识别超长视频的有价值判断并且自动剪辑成多条适合传播的短视频。生成的短视频可以选择对应的字幕模板，并且支持AI 自动在对应的视频片段添加音效、贴纸等增加氛围的内容。此外还支持AI眼神注视、AI 降噪、 AI 唇形同步、 AI 调色等一系列自动化的 AI 能力。最重要的还是网页版本的，任何平台都能用，这要完善一点不得把剪映干稀烂？可惜的是暂时还不支持翻译，看选项后面会有自动字幕翻译。

歸藏(guizang.ai)

46,589 次观看 • 2 年前

ChatGPT 视觉风格JSON模板可视化工具只需将“输入图片”和“json风格代码”结合，即可得到丰富视觉效果 50多种独特美学代码实现无限风格组合支持属性随机化，可实现无限风格组合通过JSON风格模板，用户可以反复使用同一套风格设定，保证多次输出的一致性。同时GPT也能更好的理解你的各种要求。实际用途 -AI绘画/生成图片时：通过JSON风格，AI能快速套用统一的视觉语言，输出风格高度一致的图片。 -AI写作/对话时：让ChatGPT以指定语气、用词、情感风格来生成故事、描述、回复等。 -开发和设计中：用于自动化生成网页、APP、内容板块等，保证风格美学和结构的标准化、批量化。

ChatGPT 视觉风格JSON模板可视化工具只需将“输入图片”和“json风格代码”结合，即可得到丰富视觉效果 50多种独特美学代码实现无限风格组合支持属性随机化，可实现无限风格组合通过JSON风格模板，用户可以反复使用同一套风格设定，保证多次输出的一致性。同时GPT也能更好的理解你的各种要求。实际用途 -AI绘画/生成图片时：通过JSON风格，AI能快速套用统一的视觉语言，输出风格高度一致的图片。 -AI写作/对话时：让ChatGPT以指定语气、用词、情感风格来生成故事、描述、回复等。 -开发和设计中：用于自动化生成网页、APP、内容板块等，保证风格美学和结构的标准化、批量化。

小互

51,696 次观看 • 1 年前

Adobe和香港科大开源的一款可以生成透明视频的项目：TransPixar，它可以生成包含烟雾、反射、水滴等透明元素的视频，看起来非常真实、更自然这给比如电影特效制作、游戏画面渲染、虚拟现实创作提供了更多的便利性 #视频生成 #TransPixar

Adobe和香港科大开源的一款可以生成透明视频的项目：TransPixar，它可以生成包含烟雾、反射、水滴等透明元素的视频，看起来非常真实、更自然这给比如电影特效制作、游戏画面渲染、虚拟现实创作提供了更多的便利性 #视频生成 #TransPixar

AIGCLINK

26,844 次观看 • 1 年前