Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

全程靠 Google Antigravity 和 Google AI Studio 嘴撸 Vibe coding 的鲜花滤镜平台太好看了! 谁能想到这些鲜花滤镜,都是就地取材拍摄出来,通过 Prompt 在 AI 里面加工成不同的效果,再叠加用户上传的人像,变成了独一无二的图像和视频。 每一款鲜花,都是一个独一无二的滤镜。能在生活中随意拍摄路边的花花草草,生成自己的专属滤镜。 🥲 AI 太伟大了,0 代码,全程嘴撸,大概 3 天做出来的。唯一有点惆怅的是,接下来要折腾部署了…

77,494 görüntüleme • 6 ay önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

两个最厉害的模型联手 会有什么神奇效果呢? ChatGPT-image-2 + Seedance 2.0 帮我司拍宣传视频这件事,突然变简单了。 以后大家还想看 Misa 的真人视频么?😭😭 我今天看到特别感兴趣,试了一把 先用 ChatGPT-image-2 生成广告分镜图, 再丢给 Seedance 2.0 去生成视频。 结果是 一个人,已经越来越像一个小型广告团队。 最近小作文大赛不是也有视频赛道吗 大家可以试试用AI辅助! 下面给大家分享流程~ 1 先别急着做视频,先把广告结构搭出来 很多人一上来就直接文生视频, 但最后出来的东西往往更像炫技,不像广告 因为广告最重要的不是画面会不会动, 而是: 开头怎么抓人 中间怎么展示产品 卖点怎么推进 最后怎么收口 所以我第一步不是生成视频, 而是先把它拆成一个标准 15 秒广告结构: 钩子 产品 功能 信任 CTA 你先把导演思路想清楚, 后面的模型才有东西可执行。 2 用 ChatGPT-image-2 生成一张可拍的分镜图 这一步是关键中的关键。 我不是让它随便生成一张好看的图, 而是让它生成一张 广告 storyboard。 也就是一张图里,直接包含: 5 个镜头 时间轴 人物动作 字幕/台词 转场逻辑 品牌信息 这一步的本质,其实不是“画图”, 而是把你的广告脚本可视化。 以前这事要策划、导演、美术一起干。 现在你一个人就能先把骨架搭出来。 3 固定人物参考,让整条片子更像真人拍摄 如果每个镜头都让 AI 随机生成人物, 出来的视频会非常散。 所以我这次直接用固定参考人物,统一整套画面。 这样做的好处非常明显: 人设不会漂 镜头连续性更强 代入感更强 商业感更完整 说白了,AI 视频最怕的不是“不够真实”, 而是“看起来不属于同一个世界”。 人物一统一,质感马上就不一样了。 4 把分镜图交给 Seedance 2.0,让它把静态脚本变成动态广告 当分镜图已经把逻辑搭好以后, Seedance 2.0 的工作就不是“自由发挥”, 而是把这套脚本执行出来。 它负责补足的是: 动作 微表情 运镜感 镜头衔接 视频节奏 这也是为什么我越来越觉得: 比起直接文生视频,先做分镜图再做视频,会稳得多。 因为前者是在赌博, 后者是在导演。 5 最后不断改字幕、卖点和镜头,形成素材流水线 我觉得最有价值的,不是做出这一条。 而是这个流程一旦跑通, 你就不再是在“做视频”, 你是在搭一个 素材生产系统。 同一个产品,你可以快速改出: 不同开头 不同卖点顺序 不同字幕表达 不同人物风格 不同口号收尾 这意味着广告素材终于可以像产品一样被快速迭代了。 以前做一条片子像开项目。 以后做一条片子,可能更像改 prompt。 AI 并不是在替代视频团队的一两个岗位。 它是在把“整条广告生产链路”压缩到一个人手里。 所以问题可能真的来了: 以后大家还要看 Misa 的真人视频么?😭 #AI #Ai视频 #教程

Misa_OKX💚

66,832 görüntüleme • 1 ay önce

【ZenMux 深度评测第二弹:AI 视频的“动线导演思维”】 在实际动作片拍摄中,动作导演和武指执行一镜到底的格逐戏前,会先设计完整的“动线”——角色从哪进、经哪些节点、在哪完成动作。路径定了,机位反而是被动推导出来的。控制的核心是动线,不是镜头。 用 AI 生成建筑跑酷或一镜到底也是同理。很多人直接在提示词里描述运镜,结果画面空间感混乱。正确解法是先建立动线(沿哪个立面跑、在哪腾空、落点是哪个平面),把空间路径描述清楚,AI 生成的运动才会有连贯的空间逻辑。 但怎么把这种抽象的“导演思维”翻译成 AI 听得懂的语言?这就涉及到一个高频痛点:不同的 AI 模型,对空间和镜头语言的“理解性格”完全不同。以前为了试一组跑酷动线 Prompt,要在 Claude、GPT、DeepSeek 之间来回切平台,切到思路断线,月底对账单也头大。 最近把这个动线测试工作流接进了 ZenMux,在同一个界面里直接调度和交叉实测,发现很有意思:Claude 的空间解构和节点拆分极专业;GPT-4o 对材质和光影的细腻润色拿来就能用;而 DeepSeek 成本极低,适合批量跑盲盒初筛。全程在一个入口搞定,后台额度清晰,还有智能路由和延迟赔付。真正干活和做内容交付的人,要的就是这种多模型调度的“确定性”和工作流“韧性”。降本增效不只是换个便宜模型,而是像导演一样,把不同的任务精准派发给最合适的工具。

波妞PONYO

11,352 görüntüleme • 21 gün önce

Google推出了一种在 StableDiffusion 图像生成中保证内容特征一致性的方式。 这个其实是现在图像生成中一个非常重要的问题,故事可视化、游戏开发资产设计、广告等都需要在生成的时候具备角色或者内容的一致性。 从演示来看效果非常好人物角色和其他内容的特征都保持的非常好,他们有一个示例是一个男人的一生十几张不同年龄段的图片都很像能看出来是一个人。 而且这个项目还可以跟 SD 已有的控制方式结合,比如局部重绘和 Controlnet 等。下面是具体的介绍: 实现方法: 身份聚类:这一步骤涉及首先生成一系列图像,然后将这些图像嵌入到一个语义空间中。接着,使用聚类算法将这些图像分组,每个组代表一种可能的角色身份。这个过程旨在识别出一组视觉上一致的图像,从而确定角色的主要视觉特征。 身份提取:在确定了一组具有高内聚性的图像之后,接下来的步骤是通过在这些图像上训练模型来提炼出一个更一致的角色身份。这意味着模型将学习到特定角色的关键视觉特征,以便在未来的生成中更准确地重现这些特征。 收敛性:方法的最后一个步骤是迭代过程,该过程在达到一定的收敛标准时停止。在每次迭代中,模型基于最新的训练数据生成新的图像,并重新进行聚类和身份提取。这个过程重复进行,直到模型能够可靠地生成具有一致视觉身份的角色为止。 效果验证: 定性和定量比较:在这一部分,作者将他们的方法与其他个性化文本到图像生成技术进行比较。这包括通过视觉和数值指标来评估生成图像的一致性和质量。 用户研究:作者还进行了一项用户研究,以评估他们的方法在实际使用中的效果。这包括让用户评价生成图像的一致性和吸引力。 消融研究:这部分是对方法中不同组件的效果进行评估。通过修改或移除方法的某些部分,作者能够理解每个组成部分对最终结果的贡献。 论文链接:

歸藏(guizang.ai)

125,719 görüntüleme • 2 yıl önce