正在加载视频...

视频加载失败

新加坡国立大学Show Lab放出了一款教育视频自动生成工具:Code2Video,非常实用 把写教案升级为了自动代码动画生成,同时更好的解决了生成内容逻辑结构和视觉准确性的问题 对老师来说,只需要输入教学主题就能自动获得一个3Blue1Brown风的教学动画 Code2Video核心是让AI先自动写Manim Python代码,然后再渲染出教育视频,并非直接出视频。是一个多智能体架构,包括Planner、Coder和Critic 看给出的效果,跟Veo3、Wan-2.1比,Code2Video在逻辑结构、知识准确性,以及教学清晰度上表现更好一些 视频通过代码生成,对生成的每个元素、动作、公式都可以精准控制,这就比较适合需要逻辑结构和视觉准确性的教学场景 #AI教学视频生成 #AI公式视频 #AI教育 #Code2Video

35,757 次观看 • 8 个月前 •via X (Twitter)

0 条评论

暂无评论

原始帖子的评论将显示在这里

相关视频

HeyGen这次开源,把AI做视频的最后一道门槛拆没了🤯 他们用Claude Code写代码,做了自己的50秒产品发布视频,然后把整个工具链完整开源给了所有人,致敬开源🫡 以后做视频真的能简单到离谱, 给一句话,做一个30秒的产品介绍,给一个PDF,自动生成总结视频, 迭代就是改一句话的事,比如把标题放大两倍,第三秒加一个淡入转场等, 这个工具叫HyperFrames,本质上就是一个纯HTML转MP4的视频渲染框架。 所以其实我们不用学任何剪辑软件,也不用写复杂的React代码, 只要写普通HTML,加几个简单的data属性,就能定义视频的每一帧、时间线、动画和音轨。 HyperFrames从第一天起就是为AI代理原生设计的。 AI天生就会写HTML,现在Claude、Cursor、Gemini所有编码Agent,只要装一个skill,立刻就会做视频。 这妥妥的降维打击啊,以前Remotion把视频变成了代码,但它需要你会React,需要构建流程,属于开发者专属的玩具。 HyperFrames是把视频变成了纯HTML,零构建,无DSL,不需要任何前置知识。 说白了,Remotion是给人写的,HyperFrames是给AI写的。 以前AI能写文字,能生成图片,但视频一直是最后一块硬骨头,现在这块骨头也被啃下来了。 代理现在能端到端完成一整条内容流水线,调研,写脚本,做设计,加动画,最后直接渲染出成品视频,全程不需要人类碰一下。 它还自带50+官方现成组件,社交遮罩、图表、转场,一行命令一键安装。 支持GSAP、Lottie、Three.js所有主流动画库,随便混用。 也就是说,同一份HTML永远出一样的结果,完美适合自动化流水线。 官方甚至把视频语言都标准化了,缓动用snappy,bouncy,转场用能量等级,字幕分Hype/Corporate/Tutorial三种风格。 AI只要学会这套词汇,就能稳定输出专业级视频,这不就是在教AI做导演嘛🤣 这对HeyGen来说也是一步妙棋,他们不再只是一个卖AI头像的SaaS公司,现在能做整个AI视频时代的基础设施了, 未来所有AI代理生成的视频都能跑在HyperFrames上。 然后再无缝接入HeyGen的头像、语音、翻译能力,形成一个完美的闭环。 当然目前也不是完美的,初期输出还有AI味,超过一分钟的复杂长视频,渲染还需要较强算力。 但我觉得这都不重要,关键是它第一次把完整的视频生产力交给了AI Agent,相当于AI内容创作时代的又一个里程碑。 想试的直接去GitHub搜heygen-com/hyperframes。 跑一行npx hyperframes init,然后让Claude帮你做第一个视频。 #HyperFrames #HeyGen #AI视频 #AI代理 #开发者 #内容创作

AYi

36,425 次观看 • 2 个月前

Pixverse 发布 R1 实时视频世界模型 藏师傅也试了一下 前几天测试的 Pixverse R1 终于发布了,这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。 极限情况下可以实时生成 1080P 的高清视频,感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验,目前他们在一个单独的平台测试需要邀请码。 你可以选择预制的的三个主题进行体验,三个主题分别是巨龙巢穴、二战主题、海底世界,正式版本会增加到 6 个。 也可以创建自己的主题,选择画面比例、风格输入主题相关提示词就可以了。 生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。 而且这里生成的视频居然还是带音乐、音效混合旁白的,比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有: 这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流,接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构,用来实现无限连续的生成,还使用了增加注意力机制,确保长时间生成的内容一致性。 为了适配实时视频生成的性能,他们将原来的迭代降噪逻辑进行了多项优化,他们叫瞬时响应引擎 (IRE),主要包括三个优化: Temporal Trajectory Folding:传统模型从噪点到清晰图像需要迭代几十步,他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification:直接将传统的 CFG 逻辑蒸馏到了模型参数内部,节省了时间。 Adaptive Sparse Attention:生成高分辨率的视频的时候让模型学会学会“抓大放小”,自动识别重要区域进行精细计算,大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试,生成的分辨率是 480P,过几天会提高到 720P。

歸藏(guizang.ai)

16,373 次观看 • 5 个月前