正在加载视频...

视频加载失败

这个 AI 很强。 LingBot-Map 可以把实时视频流转换成实时的 3D 重建。 20 FPS 代码 + 模型 👇

66,382 次观看 • 2 个月前 •via X (Twitter)

0 条评论

暂无评论

原始帖子的评论将显示在这里

相关视频

2026年,AI 视频进入下半场,不再是比谁生成的画面更精美,而是比谁更"实时"。 最近我深度测试了 PixVerse R1 实时世界模型,它彻底打破了我作为产品设计师对"视频文件"的固有认知。 视频不再是 .mp4,而是一个活生生的、可交互的世界。 以往我们用 AI 视频:输入提示词,等待 1 分钟,得到结果。 在 R1 里:输入即所得。没有等待,没有重生成,画面随着你的意图流转。 这种"实时性"意味着 AI 视频从一种“结果变成了”过程“。它构建的是一个"持久的视觉宇宙"。你可以通过语言、情绪甚至肢体,实时重写你眼前的视觉现实。这就是所谓的"Playable Reality(可玩的现实)"。 我做了一个小试验:在R1里建立一个以印象派画作为基底的连贯世界,并通过我的意图,让这个世界的视觉风格和所处环境实时流转,最后融入音乐的律动。非常初级,但已经充满了想象的空间。 目前 R1 还处于早期测试阶段(非最终 UI),但这种"实时世界模型"的雏形已经足够震撼。比如光是一个教育领域,就可以看到教育的未来: 学习不再是看录像带,而是走进场景。想学在咖啡馆点餐?AI 实时生成一个咖啡馆。你想改变天气或氛围?说句话,世界立刻响应。这种沉浸感是传统视频无法比拟的。如果你对 AI 落地感兴趣,建议关注一下这个产品。 PixVerse目前赠送了几个邀请码,感兴趣的朋友请在这个贴点赞+评论,我会在24小时后抽取3位朋友赠送邀请码,让大家也体验一下这个创新式的AI产品。

Bear Liu

15,189 次观看 • 5 个月前

Pixverse 发布 R1 实时视频世界模型 藏师傅也试了一下 前几天测试的 Pixverse R1 终于发布了,这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。 极限情况下可以实时生成 1080P 的高清视频,感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验,目前他们在一个单独的平台测试需要邀请码。 你可以选择预制的的三个主题进行体验,三个主题分别是巨龙巢穴、二战主题、海底世界,正式版本会增加到 6 个。 也可以创建自己的主题,选择画面比例、风格输入主题相关提示词就可以了。 生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。 而且这里生成的视频居然还是带音乐、音效混合旁白的,比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有: 这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流,接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构,用来实现无限连续的生成,还使用了增加注意力机制,确保长时间生成的内容一致性。 为了适配实时视频生成的性能,他们将原来的迭代降噪逻辑进行了多项优化,他们叫瞬时响应引擎 (IRE),主要包括三个优化: Temporal Trajectory Folding:传统模型从噪点到清晰图像需要迭代几十步,他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification:直接将传统的 CFG 逻辑蒸馏到了模型参数内部,节省了时间。 Adaptive Sparse Attention:生成高分辨率的视频的时候让模型学会学会“抓大放小”,自动识别重要区域进行精细计算,大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试,生成的分辨率是 480P,过几天会提高到 720P。

歸藏(guizang.ai)

16,373 次观看 • 5 个月前