老王霸 AI Lab's banner
老王霸 AI Lab's profile picture

老王霸 AI Lab

@laowangbabababa5,367 subscribers

🏫前Top2大厂产品经理 ,独立开发者 📚这本书《电商产品经理》作者 👉学AI第一个月赚6000,第四个月赚6位数,知识付费7位数收益 👀 分享AI出海,AI实操分享,AI 编程经验和踩坑分享 🔥 企业AI培训 | AI 工具推广,合作V: pmlaowangba

Shorts

我去,美团把数字人视频生成模型开源了。外面数字人 Agent 一天卖 50 万,美团直接做了个 LongCat-Video-Avatar 塞进同一个仓库里开源了。 给一张人脸图加一段音频,数字人张嘴念稿,嘴唇、眼神、表情全自动对上。 它不是那种玩具开源,是实打实对标 Sora、Veo3、Kling 那种商业模型。 13.6B 参数,文生视频、图生视频、视频续写,一个模型全干完,720p 30 帧,长视频一口气跑几分钟不崩画质。而且你敢信?推理还比同级快了 10 倍。 坦率的讲,我看到技术报告的时候是有点懵的。因为 benchmark 上它一个 Dense 架构的 13.6B 模型,追着人家 28B 的 MoE 打。更让我愣住的是数字人那块。 你想想看,这事以前怎么搞。 要么自己录真人,要么掏钱买方案,几百块一条起步。现在一个开源模型,丢段文案给 TTS 一念,画面它自己出。而且 1.5 版做了蒸馏,推理从几十步压到 8 步,快了 15 倍。还加了 INT8 量化省显存。 说实话,这种东西别只收藏。 想试的,先跑 一下我下面的文章教程,参考就能部署。 GitHub 搜 meituan-longcat / LongCat-Video,权重在 HuggingFace 上直接下。

我去,美团把数字人视频生成模型开源了。外面数字人 Agent 一天卖 50 万,美团直接做了个 LongCat-Video-Avatar 塞进同一个仓库里开源了。 给一张人脸图加一段音频,数字人张嘴念稿,嘴唇、眼神、表情全自动对上。 它不是那种玩具开源,是实打实对标 Sora、Veo3、Kling 那种商业模型。 13.6B 参数,文生视频、图生视频、视频续写,一个模型全干完,720p 30 帧,长视频一口气跑几分钟不崩画质。而且你敢信?推理还比同级快了 10 倍。 坦率的讲,我看到技术报告的时候是有点懵的。因为 benchmark 上它一个 Dense 架构的 13.6B 模型,追着人家 28B 的 MoE 打。更让我愣住的是数字人那块。 你想想看,这事以前怎么搞。 要么自己录真人,要么掏钱买方案,几百块一条起步。现在一个开源模型,丢段文案给 TTS 一念,画面它自己出。而且 1.5 版做了蒸馏,推理从几十步压到 8 步,快了 15 倍。还加了 INT8 量化省显存。 说实话,这种东西别只收藏。 想试的,先跑 一下我下面的文章教程,参考就能部署。 GitHub 搜 meituan-longcat / LongCat-Video,权重在 HuggingFace 上直接下。

164,139 次观看

非常Nice啊,这模型完全免费,Token终于可以自由白嫖了,甚至视频模型都是免费的,太爽了。 它叫Agnes AI,全球模型榜前十,6 月 1 号起把自己家三个核心模型全免费开放了,无限期。图片模型在 artificial analysis 上榜了,文字模型一周被干了一万亿 Token。我把它接进 Claude Code,配起来十分钟的事,Token 随便用。 这玩意到底是什么呢。 Agnes AI 是全球模型榜单前十的一个 AI Lab,这次免费开放的是三个模型,文本、图片、视频。 文本模型叫 agnes-2.0-flash。能写代码,能做知识问答,能跑 Agent,能规划复杂任务。在 Claw-Eval 智能体评测榜进了 Top 10。说真的,这周它还要上 1M 超长上下文,以前用 200K 的模型跑到 150K 就降智,这种破事不用再忍了。 图片模型叫 agnes-image-2.1-flash。图改图、多图融合、换背景、改文字、图像修复,电商主图和广告素材这种反复改的场景,太合适了。最近还加了 4K 超高清输出,最高 4096×4096,生成的图可以直接进印刷,不是那种看着还行一放大就糊的草稿。 视频模型叫 agnes-video-2.0。原生音画同步,首帧生视频、首尾帧生视频、多镜头切换都支持,720P 和 1080P 随便选。 接进 Claude Code 怎么搞,其实很简单。 第一步,去 注册,拿到 API key。 第二步,打开 cc-switch。右上角选 Claude CLI,右上角点 + 号,选自定义配置。把 API key 填进去,请求地址写 格式选 OpenAI Chat Completions。 第三步,点获取模型列表,选 agnes-2.0-flash。 第四步,点左上角设置,找到路由,打开路由总开关,Claude 打开。 完事。 回到 Claude Code 正常发消息,模型就已经切过去了。我试了一个在酒吧吉他弹唱的视频,和真人区别不大。 现在 Token 不要钱,Agent 该跑几轮跑几轮,该拆几步拆几步。反正我觉得这才是免费开放最爽的部分,不只是省钱,是心理上解放了。 我测试了一下视频模型,能用,就是慢了点,文字模型还是比较快的。 开发者文档在 OpenClaw、Hermes、Claude Desktop 的,也有现成教程。

非常Nice啊,这模型完全免费,Token终于可以自由白嫖了,甚至视频模型都是免费的,太爽了。 它叫Agnes AI,全球模型榜前十,6 月 1 号起把自己家三个核心模型全免费开放了,无限期。图片模型在 artificial analysis 上榜了,文字模型一周被干了一万亿 Token。我把它接进 Claude Code,配起来十分钟的事,Token 随便用。 这玩意到底是什么呢。 Agnes AI 是全球模型榜单前十的一个 AI Lab,这次免费开放的是三个模型,文本、图片、视频。 文本模型叫 agnes-2.0-flash。能写代码,能做知识问答,能跑 Agent,能规划复杂任务。在 Claw-Eval 智能体评测榜进了 Top 10。说真的,这周它还要上 1M 超长上下文,以前用 200K 的模型跑到 150K 就降智,这种破事不用再忍了。 图片模型叫 agnes-image-2.1-flash。图改图、多图融合、换背景、改文字、图像修复,电商主图和广告素材这种反复改的场景,太合适了。最近还加了 4K 超高清输出,最高 4096×4096,生成的图可以直接进印刷,不是那种看着还行一放大就糊的草稿。 视频模型叫 agnes-video-2.0。原生音画同步,首帧生视频、首尾帧生视频、多镜头切换都支持,720P 和 1080P 随便选。 接进 Claude Code 怎么搞,其实很简单。 第一步,去 注册,拿到 API key。 第二步,打开 cc-switch。右上角选 Claude CLI,右上角点 + 号,选自定义配置。把 API key 填进去,请求地址写 格式选 OpenAI Chat Completions。 第三步,点获取模型列表,选 agnes-2.0-flash。 第四步,点左上角设置,找到路由,打开路由总开关,Claude 打开。 完事。 回到 Claude Code 正常发消息,模型就已经切过去了。我试了一个在酒吧吉他弹唱的视频,和真人区别不大。 现在 Token 不要钱,Agent 该跑几轮跑几轮,该拆几步拆几步。反正我觉得这才是免费开放最爽的部分,不只是省钱,是心理上解放了。 我测试了一下视频模型,能用,就是慢了点,文字模型还是比较快的。 开发者文档在 OpenClaw、Hermes、Claude Desktop 的,也有现成教程。

39,666 次观看

这个数字人吧,差强人意了,绝对不能直接口播的形式,穿插一些素材,或者小窗口还凑合。 但是项目功能比较完整,适合自己手搓,二开叠加功能。

这个数字人吧,差强人意了,绝对不能直接口播的形式,穿插一些素材,或者小窗口还凑合。 但是项目功能比较完整,适合自己手搓,二开叠加功能。

11,575 次观看

Videos

laowangbabababa's profile picture

我靠,原来抖音一晚上卖 50w 的数字人,都是基于这个项目开发的。叫MoneyPrinterTurbo,7.4 万 star。 输个主题,AI 写文案、自动从 Pexels 扒无版权素材、配音、加字幕、配 BGM、合成出片。 我已经部署到自己的mac 电脑,并拿山海经 12 祖巫的故事跑了1次, 还挺好玩,只需要输入一个标题,出来的视频成品基本不用改。 LLM 写稿、TTS 配音、素材搜索、字幕识别、视频合成,五条互不搭边的技术链路,被它串成了一条自动化流水线。每一步的提供商都是可配置的。 拆开看,总共有这几个能力可供我们学习: → 脚本层:接了 15 种大模型,内置 20 多套爆款模板,支持中文 → 素材层:自动跑 Pexels 扒无版权视频,也能往里扔自己的素材 → 配音层:9 种语音合成方案,Edge TTS 免费,Azure 和 ElevenLabs 可切 → 字幕层:Whisper 做精准对齐,Edge 做快速生成,字体大小颜色随便调 → 合成层:MoviePy 把所有东西拼成一条高清视频,竖屏横屏都行 对电脑配置很低,CPU 就能跑,根本不用显卡。还自带的 Web 界面,也能用 API 和命令行。讲真,这配置对普通电脑来说挺友好的。 想做内容的,不想露脸,就先把仓库 clone 下来跑通一条视频,看看它怎么把五步串成一步。 做开发的,抄它的模块化思路。插件式架构加多方案可替换,自己项目里就能用这套拆法。 别只收藏啊,你看老王搞得成片,是那么个意思了。然后,你拆一遍它的流水线怎么搭的,比收藏 100 个工具值。

老王霸 AI Lab

170,244 次观看 • 11 天前

laowangbabababa's profile picture

这个荷兰人,你肯定听过,没员工,没融资,1人公司年入 300 万美金,折合人民币两千一百万。 他做的 PhotoAI 一个产品,一个月赚 14 万美金。InteriorAI 一个月 3 万 5。RemoteOK 一个月 4 万 4。加起来 8 个项目,全都他一个人在跑。 更狠的是,他一共做了 70 个项目,失败了 66 个,只有4 个赚到大钱。 但这不是重点。我刚把他那场快 4 小时的长访谈完整看完,心情非常震动。他在访谈里讲的这套 AI 赚钱方法论,我给你拆出几个观点 第一条公式叫两周验证法。 有想法,两周内必须上线,而且必须挂付款按钮。有人付钱,这个想法就是真需求,继续做。没人付钱,立刻放弃,换下一个。 他做 PhotoAI 的时候土到什么程度。第一版就一个网页,写清楚产品干嘛,放一个付款按钮。用户付完钱,他这边收到通知,自己手动下载照片,自己用 AI 改图,改完用邮件一张张发回去。 就这么土的做法,前 10 天赚了 10 万美金。他后面才慢慢把这些手动操作写成代码。 为什么必须是付款按钮,不是问卷?因为问卷里说想买的人,90% 不会真买。能真金白银付钱的人,才是真用户。 第二条公式叫极致自动化。他有句原话:我没员工,我有脚本。 任何事做了两遍,第三遍必须写代码自动跑。他的服务器上现在跑着 180 多个自动脚本。数据更新、内容审核、客服回复、监控告警,全是脚本干的。他睡觉的时候脚本在跑,他健身的时候脚本还在跑。 他整个商业体系一个月运营成本不到 200 美金。 为什么不招人?招一个人意味着管理、工资、文化。写一个脚本只用一次,跑一万次不要钱。所以他能一个人,顶一支军队。 所以如果你现在也有一个想法一直没动手,先做最丑的那一版,挂个付款按钮,看有没有人为它付钱。不会做的部分用 AI 问,问着问着就会了。 做培训课不是先去录三个小时的内容,是先做一张课表,挂个付款链接发朋友圈。有老板私信咨询,有定金进来,这门课才正式录。 做 AI 落地咨询也一样,不先做完整方案,先做一张产品宣传图,看有没有企业老板来问。 如果第一步都没人付钱,后面的事根本不值得做。 这事不是 Pieter 一个人的运气。5 年前一个人想干年入 300 万美金是天方夜谭,3 年前还得拼运气,2026 年 AI 一人干这条路,从野路子变成了主流。 PS:这兄弟在这,Twitter @levelsio

老王霸 AI Lab

48,225 次观看 • 23 天前

没有更多内容可加载