Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

之前用 Seedance 2 做了个做酸菜鱼的视频, 生成到第10秒的时候,美女的手直接伸进滚烫的锅里搅拌。AI完全不知道那样会烫。 当时觉得好笑,后来越想越觉得,这不只是 bug这么简单,现在的 AI 根本还没到理解物理世界怎么运转这一层。 这半年做了太多AI视频了,每次满心欢喜等它生成,结果经常是人物动作接不上、物体空间瞬移、手还没碰到东西物体就动了,各种幻觉 bug,真的挺折磨。 最近看到黄碧薇教授 Biwei Huang 的 Aether AI 官宣融资,认真看了一下方向,感觉它解释了很多视觉 AI 里反复出现的问题。 Aether AI 做的是因果世界模型。这个词听起来很学术,但放到视频生成里其实很好理解。 今天的视频模型,Sora、即梦、Veo,已经能生成非常真实的画面。杯子掉落、水洒出来、机械臂抓取,看起来越来越像真的。但它们很多时候是在根据海量视频经验预测下一帧,类似画面后面通常会发生什么,就生成什么。 所以桌子高了 2cm,机械臂就可能失效。明明伸过去的角度看起来对,杯子却自己飞起来了。画质够了,数据也不少,但模型没有真正理解这个动作为什么会带来这个结果。 Aether AI想做的,就是让 AI 学到变量之间的底层规律,比如桌子高度变了会带来什么影响,物体受力之后会怎么运动,一个动作会导致什么后果。 这类东西学进去,模型才能在没见过的场景里稳定推演、举一反三。对视频生成、机器人、自动驾驶、3D 世界模拟都会很关键。 视觉 AI 下一阶段的方向,可能就是从生成看起来合理的画面,走向理解画面为什么会这样变化。 黄教授 Biwei Huang 做因果AI 超过 12 年,这次 Aether AI 融资,我觉得是一个值得关注的信号:因果世界模型正在从学术前沿走向产业。 想了解的可以戳一下官网看看:

72,093 görüntüleme • 13 gün önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

说个暴论,你的审美和品味就是你的提示词,并决定了你使用AI的上限。 咱们看看这个案例, 零游戏开发经验,两周时间, 一个人,做出了一个完整可玩的3D外卖配送游戏🆒 主角是一只戴粉色头盔的卡皮巴拉, 骑着电动车在城市里穿梭接单, 订单会真实堆叠在后座,掉了就会失败, 还有完整的手机App导航和超市捡货系统, 很多人看完第一反应都是AI太厉害了,但其实并不是是AI的胜利, 本质是人类品味的胜利, 他没写几行代码, 所有的逻辑模型贴图音乐音效, 全都是AI生成的, 他只做了3件事, 1️⃣告诉AI我想要一个卡皮巴拉送外卖的游戏, 2️⃣然后在AI生成的一万个版本里, 3️⃣选出那个看起来最好玩的, 最后花两周时间一点点打磨细节, 调参数摆道具改手感, 其实这就是现在大家说的vibe coding, 让AI接管了所有的执行层, 人类只需要负责方向和品味, 以前你得学会编程建模配乐剪辑, 才能做出一个游戏, 现在你只需要知道, 什么东西是好的, 很多人说这是作弊, 但这才是真正的创意民主化呀, 一年前需要一个小团队干几个月的活, 现在一个普通人两周就能搞定, 我相信未来会有无数这样的作品冒出来,创意会比技术重要一百倍甚至更多。 这也回答了那个很多人都在问的问题, AI时代人类到底还有什么用❓ AI确实能生成一切, 但它不知道的是 什么东西看起来舒服, 什么东西玩起来爽, 什么东西能让人会心一笑, 比如那些纯AI生成的游戏为什么不好玩, 因为它们只有技术,没有灵魂, 那什么是灵魂呢? 我理解灵魂就是那个站在AI背后, 做每一个微小选择的人, 就是那个知道什么时候该停手, 什么时候该再改一下的人, 而且我觉得这只是一个开始, 今天是浏览器3D游戏, 那明天可能就是完整的App, 后天甚至是3A级别的游戏原型, 我们正在见证一个全新的创作时代, 任何人都能把自己的脑洞, 变成真正的产品, 游戏链接放在评论区了, 直接浏览器打开就能玩, 建议大家去试试, 你会真切地感受到, 那个属于普通人的创作黄金时代, 真的已经来了! #AI #游戏开发 #vibecoding

阿绎 AYi

12,095 görüntüleme • 2 ay önce

两个最厉害的模型联手 会有什么神奇效果呢? ChatGPT-image-2 + Seedance 2.0 帮我司拍宣传视频这件事,突然变简单了。 以后大家还想看 Misa 的真人视频么?😭😭 我今天看到特别感兴趣,试了一把 先用 ChatGPT-image-2 生成广告分镜图, 再丢给 Seedance 2.0 去生成视频。 结果是 一个人,已经越来越像一个小型广告团队。 最近小作文大赛不是也有视频赛道吗 大家可以试试用AI辅助! 下面给大家分享流程~ 1 先别急着做视频,先把广告结构搭出来 很多人一上来就直接文生视频, 但最后出来的东西往往更像炫技,不像广告 因为广告最重要的不是画面会不会动, 而是: 开头怎么抓人 中间怎么展示产品 卖点怎么推进 最后怎么收口 所以我第一步不是生成视频, 而是先把它拆成一个标准 15 秒广告结构: 钩子 产品 功能 信任 CTA 你先把导演思路想清楚, 后面的模型才有东西可执行。 2 用 ChatGPT-image-2 生成一张可拍的分镜图 这一步是关键中的关键。 我不是让它随便生成一张好看的图, 而是让它生成一张 广告 storyboard。 也就是一张图里,直接包含: 5 个镜头 时间轴 人物动作 字幕/台词 转场逻辑 品牌信息 这一步的本质,其实不是“画图”, 而是把你的广告脚本可视化。 以前这事要策划、导演、美术一起干。 现在你一个人就能先把骨架搭出来。 3 固定人物参考,让整条片子更像真人拍摄 如果每个镜头都让 AI 随机生成人物, 出来的视频会非常散。 所以我这次直接用固定参考人物,统一整套画面。 这样做的好处非常明显: 人设不会漂 镜头连续性更强 代入感更强 商业感更完整 说白了,AI 视频最怕的不是“不够真实”, 而是“看起来不属于同一个世界”。 人物一统一,质感马上就不一样了。 4 把分镜图交给 Seedance 2.0,让它把静态脚本变成动态广告 当分镜图已经把逻辑搭好以后, Seedance 2.0 的工作就不是“自由发挥”, 而是把这套脚本执行出来。 它负责补足的是: 动作 微表情 运镜感 镜头衔接 视频节奏 这也是为什么我越来越觉得: 比起直接文生视频,先做分镜图再做视频,会稳得多。 因为前者是在赌博, 后者是在导演。 5 最后不断改字幕、卖点和镜头,形成素材流水线 我觉得最有价值的,不是做出这一条。 而是这个流程一旦跑通, 你就不再是在“做视频”, 你是在搭一个 素材生产系统。 同一个产品,你可以快速改出: 不同开头 不同卖点顺序 不同字幕表达 不同人物风格 不同口号收尾 这意味着广告素材终于可以像产品一样被快速迭代了。 以前做一条片子像开项目。 以后做一条片子,可能更像改 prompt。 AI 并不是在替代视频团队的一两个岗位。 它是在把“整条广告生产链路”压缩到一个人手里。 所以问题可能真的来了: 以后大家还要看 Misa 的真人视频么?😭 #AI #Ai视频 #教程

Misa_OKX💚

66,832 görüntüleme • 2 ay önce

为什么刘震云是刘震云? 因为他能把一个人一辈子都绕不过去的事,写成一句最普通的家常话。 电影《一句顶一万句》,改编自刘震云的同名小说。 里面有一句话,特别轻。 轻到你第一次听见,可能都不会停下来。 但这句话在原著里出现了两次。 一部作品里,一句话反复出现,就不是随便写的。 它是刘震云真正看透日子以后,说出来的话: “过日子是过以后,不是过以前。” 这句话,不只是写给曹青娥的,也不只是写给牛爱国的,它就是刘震云自己的觉醒。 一个人要活到一定年纪,经历过很多绕不过去的事,才会明白: 人这一生,最难的不是吃苦。 最难的是,别一直困在以前的苦里。 年轻的时候,总觉得有些事必须想明白。 为什么当初会那样? 为什么那个人要那么对我? 为什么那条路走错了? 为什么明明已经很努力,结果还是不如人意? 想来想去,日子还是一天一天过。 只是人慢慢被过去拖沉了。 后来才知道,过去的事,真的没法重新过一遍。 你再不甘,它也发生了。 你再后悔,它也改不了。 你再放不下,明天还是会来。 所以刘震云这句话狠就狠在这里。 它不是劝你忘了过去。 忘不了。 真正经历过的人都知道,有些事不是说放下就能放下。 它是在告诉你: 别再拿以前,继续过今天。 以前吃过的苦,留下教训就够了。 以前走错的路,认了、改了就够了。 以前离开的人,走远了也就走远了。 人这一生,真正能过的,永远是后面的日子。 身体要往后养。 心要慢慢放宽。 路也还得继续走。 刘震云厉害的地方就在这儿。 他不是站在高处讲道理。 他是把人活着最朴素、最疼、也最难做到的事,写成了一句家常话。 过日子是过以后,不是过以前。 这句话,表面是写人物。 其实是他自己过人生的方式。 人到了一定年纪,真要学会这一点: 别总回头。 后面的日子,才是真正要过的日子。

杨高能

36,417 görüntüleme • 1 ay önce

当 AI 走进法庭,它最缺的其实是一份证据 当 AI 真正走出实验室,开始大规模进入我们的现实生活时 大家讨论最多的其实并不是它的智力到了什么程度,而是这个系统一旦出了问题 法律层面到底该怎么判定责任归属,很多人可能还没意识到,目前几乎所有的 AI 系统在法律层面上都有一个致命的伤 那就是它们根本拿不出任何可以被第三方采信的证据。 想象一下,在未来的金融系统或者交易场景里 如果一个 AI 驱动的协议突然出现了巨大的亏损,或者是在清算的时候出了偏差,现在的处理方式其实非常尴尬,模型厂商会说这只是概率问题 而开发者会说自己只是写了代码,这种模糊的解释在技术圈里或许能混过去,但在法官或者是仲裁员面前,这种话是完全没有法律效力的,因为法律不相信任何口头上的解释,法律只看证据。 现在的情况就是这样,因为 AI 具有天然的黑箱特性,导致法律体系无法对它的行为进行复现和验证,所以一旦真的出了事。 现实社会往往只有两种极端的处理办法,要么就是由于风险不可控而直接禁用,要么就是找一个具体的人出来背黑锅。 这并不是因为我们的监管机构太守旧,而是法律体系的底层逻辑决定的,它无法接受任何无法自证的黑箱行为。 说到底,法律其实从来不关心一个模型到底是聪明还是笨。 它关心的只有三件事,那就是你到底做了什么,你是按照什么样的流程去做的,以及最重要的,你能不能拿出实实在在的证据来证明这一切。 这就是 Inference Labs 最核心的价值所在,它其实不是在跟人比拼算法的优劣,而是在给 AI 的每一个行为补齐那一层法律意义上的证据结构。 这个项目实际上是解决了 AI 的可仲裁性问题,这虽然是一个很少被人提及的法律视角,但它却是 AI 从辅助工具走向核心执行层的必经之路。 以前的 AI 推理过程就像一团理不清楚的乱麻,在仲裁机构眼里,它既不是一个能负责的人,也不是一套可以被审计的标准流程,这就导致大家只敢让 AI 提提建议,而不敢让它去真正掌握决策大权。 Inference Labs 提供的推理证明,本质上是在用法律能听懂的语言去记录 AI 的行为,它不需要向外界解释模型当时到底是怎么想的,它只需要负责向法庭或者是受害者证明,在那个特定的时间点,确实是这个版本的模型,在特定的输入环境下,产出了这么一个确定的结果,这在仲裁场景下简直就是定海神针。 有了这层证明之后,AI 产生的决策就有了可以被法律认可的证据,在未来的 DeFi 自动风控或者是合约执行中,一旦双方发生了争议。 我们就不再需要去争论开发者的初心,而是直接把那份不可篡改的推理证明丢进仲裁程序,系统不需要证明自己是善良的,只需要证明自己是如实执行的。 这就是 AI 从灰色地带走向主流市场的关键转折点,所以它的真实用户绝对不是那些每天在推特上找空投的散户,而是那些真正身处一线、需要设计协议并承担合规风险的专业人士,这些人可能平时很低调,但他们对这种能保命的工具极其看重,一旦采用了就很难再换掉。 大家习惯了去追逐那些爆发性的技术热点,却往往忽略了 AI 融入社会体系时最真实的摩擦力,这个项目的眼光其实放得很长远,它在赌一个非常确定的趋势,那就是所有的 AI 最终都必须被拉进法律的框架里,到那个时候。 那些拿不出证据结构的 AI 都会被迅速淘汰,而像它这样提前搭好仲裁入口的项目,才会真正成为系统的基石。 Inference Labs #inference_labs #KAITO

阿川

147,843 görüntüleme • 5 ay önce

我去!image2和seedance2.0简直绝配 还记得在视频号上「流量上百万」靠流量日入过千的机器人变形视频吗 现在又有羊毛可以薅了 而且光变现就有两种方式,第一种直接发布这种视频,我能赚流量的钱 第二种,那通过这个视频会有很多的商家来找我给他们做,一单200,这个是我验证过的 而且获客也很简单,发两条在自己的视频号上就可以了,土老板很喜欢这个,做出来的视频样式就在下面 而且这个平台是「字节官方开白名单的平台」我一定要推荐一下! 就是之前我推GPT会员购买的GamsGo做出来的rita 真的一定要去试一下,链接我放下面了,而且这是我实际接到的第一个需求,后面还有一个需求,我下一条就马上写出来给你。真的AI赚钱很轻松 而且 Rita 不只是视频生成这一个功能,它一站式集成了 Seedance 2.0、Kling、Runway 这些视频模型,还有 Midjourney、Flux 、image2这些生图模型,Claude、GPT、Gemini 这些对话模型 一个平台搞定全部,不用在五六个工具之间反复横跳,效率真的不是提升一点 还有一点很实在:新人注册直接送 100 积分,Seedance 2.0 可以先体验再决定要不要付费 Mega 套餐 $11.99 一个月,1200 积分,算下来比官方便宜不少,试错成本低很多。 想试试的直接点这个链接,有什么问题直接评论区反馈给我!:

叫我阿杭

58,522 görüntüleme • 2 ay önce

我不准备把 BerryCode 做成最便宜的中转站。 现在市面上有 0.06 倍、0.1 倍、0.2 倍的渠道,我知道这些价格看起来非常诱人,但我现在只能做到 GPT 官网口径 0.28X,也就是 0.4 折,用 1 M token, 综合下来大约在 0.4~0.6 人民币;换句话说,它不是最低价那一档。 但我能保证一件事:BerryCode 现在只做纯 GPT。 坦诚讲,我的能力还撑不起 Claude 中转。 Claude 封号太严,我承担不起这个风险,也不想为了多卖一个模型,把一个自己都没把握的东西塞给用户。后面我会自己体验一批价格合适、稳定性还不错的 Claude 中转站,如果真的好用,我会直接推荐给大家。 但 GPT 对我来说,是另一回事。 我现在用 Pro 账号做号池,配合一部分补充渠道去填 token 缺口,即便不卷到全网最低价,毛利润率依然能做到 30% 左右,这个数字对我来说已经够了。 我有一个暴论: **你现在能看到的大部分 AI 机会,其实都已经开始走下坡路了。** 中转站最近在推特被骂得很惨,卖数据、掺水、跑路,大家骂得不算冤,因为这个行业确实混进来了太多只想短期收割的人。 而且后面中转站这个生意只会越来越不稳定。 官方会持续封控各种渠道,低价货源会越来越少,成本会越来越高,如果一个站唯一的竞争力就是便宜,那它迟早会遇到一个问题: 成本涨了以后怎么办? 2C 用户对价格很敏感,你今天用低价把人吸进来,明天成本上升你要涨价,用户凭什么继续用你? 所以我现在越来越确定一件事: **中转站最后拼的不是谁便宜,而是谁值得被信任。** 信任从哪里来?我有几个思考: 第一,你得有自己的个人 IP。 如果一个完全匿名的站跑路,用户连骂谁都不知道;但我这个账号就在这里,几千个关注我的人也都在这里,BerryCode 真出了问题,我不可能装作没发生过。 第二,你不能什么模型都往上写。 我现在不碰自己没把握的 Claude,不碰我无法承担封控风险的渠道,只做我能解释清楚成本、稳定性和边界的 GPT。 第三,你得承认自己不是万能的。 我不说 BerryCode 永远不出问题,也不说它多便宜,我只能说我会把每一次问题都摊开讲,把修复过程讲出来,把我能做到的稳定性做到极致。 真正长期使用中转站的人,需求和轻量用户是不一样的。 轻量用户可能只看今天谁便宜 20%,但那些每天要跑 Codex、Vibe Coding、自动化任务、长上下文任务的人,他们更关心的是: 会不会突然跑路? 会不会掺模型? 会不会偷偷改请求? 会不会跑到一半没额度? 出了问题有没有人处理? 尤其是国内那些真的在用 AI 做业务的人,他们并不只是想省几块钱,他们想要的是一个能长期放在工作流里的入口。 这也是我为什么选择用更稳的方式做 BerryCode。 一个 Pro 账号 1400 左右,我拿它做号池,成本不低,但我心里踏实;我宁愿少赚一点,也不想把整个站建在自己都解释不清楚的便宜渠道上。 坦诚讲,我为什么要做中转站? 第一,肯定是赚钱。 去年炒币负债以后,我现在确实很需要现金流,这个没什么好装的,来推特的人也不是为了单纯装逼,大家都要吃饭。 第二,我的推特一个月涨了 4200 个粉,但我前阵子很迷茫,不知道该把这些流量导向哪里。 推特上很多商业模式,本质还是拉人头,做应用也好,做服务也好,很多钱来得快,但不一定长久。 中转站当然也不是一个完美的行业,但只要我不赚那些没良心的钱,只要我真的能给用户提供稳定、透明、可用的服务,那这个钱我觉得可以由我来赚。 第三,这一个礼拜搭 BerryCode,我认识了很多以前接触不到的人。 有做政务网站的,有用 AI Vibe Coding 做产品的,有自己搭工作流的,有在公司里偷偷把 AI 引进业务流程的。 我每天通宵改代码、测接口、修登录、修支付、修人机验证,虽然累,但我很久没有这么强烈地感觉到,自己正站在一个还在生长的行业里。 这个感觉有点像早年的币圈。 混乱是真的混乱,但开放也是真的开放;风险是真的风险,但机会也是真的机会。 所以从今天开始,BerryCode 正式进入压力测试和拉新阶段。 活动很简单: 充 20,送 10 平台额度; 充 200,送 100 平台额度; 最高充 2000,送 1000 平台额度。 我需要通过真实用户的使用,知道服务器、号池、支付、监控、客服到底要做到什么程度,才算是一个能长期运营的站。 如果你只是想找全网最低价,那 BerryCode 大概率不是最适合你的。 但如果你想找一个价格不离谱、模型边界讲清楚、出了问题有人处理、愿意长期把信任一点点攒起来的 GPT 中转站,可以来试试。 后面这个群也不叫 BerryCode 交流群了。 我想把它叫做: 才谷和他的朋友们。 欢迎体验,也欢迎挑毛病。 我现在最需要的不是一句“支持”,而是真实用户把问题砸到我脸上,然后我一个一个修掉。

才谷 | 哪吒商业评论

10,419 görüntüleme • 1 ay önce

全自动科学论文工厂,它真的来了。 你该看看这个新仓库。 之前那个中国大学生搞了个MiroFish,做实时社会模拟;字节跳动那边出了OpenViking,把记忆结构化;还有Percepta,把数学计算直接嵌进大模型的权重里;吴恩达那边也推了个Context Hub,相当于给代理加了一层自己标注的文档系统。 👉 Polymarket 官方入口: 现在,AutoResearchClaw 刚在 GitHub 上线——一个全自动的科学论文生成器。 仓库上线几个小时,就拿了差不多 4k 星。 给一个原始的想法进去,出来的就是一篇 6000 字、能直接用的 PDF 论文。关键它不是那种垃圾玩意儿。 它背后跑的是真正的代理系统: · 自己做实验:写代码、跑测试、读日志,崩了还能自己调 · 几乎没有幻觉:走硬核四层验证,对接真实科学数据库,没有假引用 · 格式也挑不出毛病:图表自动生成,LaTeX 排版,直接对标 NeurIPS / ICML 的标准 挺有意思的悖论是:这东西不会把 arXiv 搞死。 仓库: 当生成一篇论文的成本几乎为零,真正的权力就到了“筛选者”手里。行业里的新神,会是那些活人审稿人——他们要在无穷无尽的 AI 论文洪流里,手动淘出真东西。 愿安息吧,五年磨一篇的突破性论文——可能一夜之间就被批量淹没了。 把这几样东西拼在一起看: MiroFish 的集群 + OpenViking 的记忆 + Percepta 的真实数学 + Context Hub 的干净文档 + AutoResearchClaw 的自主研究 你就得到了一类代理——能自己跑完整个研究闭环,用真数学去验证假设,反复推敲,以远超人类的速度做出真正的突破。 这不就是在 Polymarket 和各类条件市场上,搭建下一代预测机器人要用的那套东西吗?代理自己去研究、模拟、验证概率,用科学的方法更新判断,而不是靠猜。 一个真正能发现、能证明的预测超级代理时代,就这么来了。 存好这套配置。 如果想在 Polymarket 上搞跟单交易,我推荐用这个: #Polymarket

区块链行情研究

62,529 görüntüleme • 3 ay önce

看到好几个人发这个上海复兴路隧道在漏水的视频,都在说什么豆腐渣工程,隧道要塌了。 我觉得这就是很多海外极端反贼的问题,看到中国发生什么坏事就兴奋,完全失去了逻辑和理智。 我做过一期视频《大基建落幕》,分析中国的疯狂大基建已经进入大维修时代,但我是拿出具体数据和事实来讲这些事的。 像这个视频里的情况,官方说是车子撞上了消防设施,消防用水喷出。我觉得这是个合理的解释。我虽然不是什么隧道专家,但起码的物理常识是有的。这如果是隧道已经破裂,河水都已经开始用这样的水势在喷入的时候,那是多么巨大的水压,隧道根本撑不了多久就要崩塌了。况且,视频里明显可以看到确实有事故车在边上。 有些极端反贼总是认为只要是共产党的官方通报,就肯定都是假的,标点符号都不能相信。虽然中共确实经常造假,但我们还是要具体事情具体分析。 反贼们如果总是用这种不讲常识不讲逻辑的方式去反共,那么你只不过是天平另外一端的张维为和司马南罢了。那么你其实不是反贼,你成为了变相的大外宣,因为这种愚蠢的反共言论不会伤害中共一丝一毫,反而是在帮助中共。 我最大的担忧之一,就是那些刚刚学会翻墙的人一出来就看到那些支黑和极端反贼,反而把他们推向了中共的怀抱。

老周横眉

118,793 görüntüleme • 1 yıl önce