Loading video...

Video Failed to Load

Go Home

Claude Cowork有多强? 就这么说吧,刚我让它从 它甚至可以从底层代码来判断页面类型,然后放在我的本地文件夹,本来是可以利用Remotion来做视频的,但是沙箱环境有问题,所以最终用的其他方案,但是这个效果也不错了~

11,030 views • 1 month ago •via X (Twitter)

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 views • 6 months ago

小扎吐槽苹果和 Google,以及谈为什么开源 AI **Mark Zuckerberg**: 我认为移动生态系统中普遍存在的一个问题是有两个把持入口的公司,Apple 和 Google,它们可以告诉你可以构建什么。 在我们的历史中有很多次,比如有经济层面的情况,就是我们构建了些东西,然后它们就会拿走我们大部分的收入,但还有一种是质量层面,这实际上让我更加不满,也就是有很多次我们推出或希望推出某些功能,然后Apple就会说,不,你不能推出这功能。 这真的很糟糕。 问题是,这样的世界是否会在AI领域复现,就像你会有一小部分拥有封闭模型的公司,它们控制API,因此将能够告诉你可以构建什么。 我可以说,对我们来说,自己构建一个模型以避免处于那种位置是值得的。 我不希望那些其他公司告诉我们可以构建什么,而且我认为从开源的角度来看,很多开发人员也不希望那些公司告诉他们可以构建什么。这就是我坚定支持开源的原因之一,我认为未来AI的集中化可能像其广泛传播一样具有潜在危险。 我发现很多人都在思考,如果我们能实现这种技术,那么让它广泛传播是否不利。 我认为另一种可能也很糟糕的情况是,如果一个机构掌握了一种强大的AI远超其他所有人的,这同样是非常糟糕的。在我看来,一个理想的世界应该是这样的:AI技术被广泛而均衡地应用,随着时间推移逐步增强其健康性。在这样的世界里,各种系统能够相互制衡,这种平衡的状态比一个高度集中化的世界要健康得多。 虽然风险无处不在,但我觉得有一个风险我想人们我并没有听到太多人提及。 **Dwarkesh Patel**:举例来说,一个价值100亿美元的模型,如果经过评估是完全安全的,你们会选择开源吗? **Mark Zuckerberg**:我的答案是,只要这个模型对我们有所帮助,那我们就会开源。 **Dwarkesh Patel**: 那如果这个模型是用100亿美元的研发经费研发出来的,然后现在要开源呢? **Mark Zuckerberg**: 我们一直以来都有开源软件的传统,但是我们并不会开源我们的产品。 比如说,我们并不会将Instagram的代码开源,但我们会开源许多底层的基础设施。我们历史上最大的一个项目可能就是开放计算项目。在这个项目中,我们将我们所有的服务器的设计网络交换机和数据中心的设计开源了,这对我们来说非常有帮助。 因为很多人可以设计服务器,但现在,大家普遍都采用了我们的设计,这就意味着整个供应链都围绕我们的设计展开,规 模变大,对所有人来说都变得更便宜,为我们节省了数十亿美元。 这真是太棒了,对吧? 因此,我认为开源有多种方式可以对我们有所帮助。 一种就是,如果有人能够找出更便宜的运行模型的方法,我们将花费数十亿甚至上千亿美元,在所有这些模型上,所以如果我们能做的更有效率,那我们就可以节省数十亿甚至上百亿美元,这可能本身就非常有价值。 **Dwarkesh Patel**: 关于开源,我很想知道你是否认为像PyTorch、React、Open Compute这样的开源项目,对世界的影响是否已经超过了Meta在社交媒体方面的作用。 **Mark Zuckerberg**: 因为我曾经和使用这些服务的人交谈过,他们觉得这是有可能的,因为互联网的很大一部分都在运行这些项目。这是一个有趣的问题,我认为几乎有一半的世界人口都在使用我们的产品,这是一个真实的点,所以我觉得这很难超越。 但不管怎样,我还是认为开源是一种新的、非常強大的建设方式。 来源:

宝玉

74,721 views • 2 years ago

试了一下 OpenAI 新出的 Codex App,有些亮点 跟 Skills 的适配还是有点问题,模型的主要问题就是慢 OpenAI 给 Pro 和 Plus 用户的 Codex 额度在未来两个月内全部翻倍了 👇看一下详细的能力介绍: Skills 可视化管理 有一个专门的 Skills 列表界面,预置了一些官方 skills,也可以扫描你已经安装的 skills。注意这里只能扫描 NPX 安装的,本地创建的(比如在 Claude Code 里创建的)扫不出来。 还支持 Skills Creator 创建的 skills,可以直接在 APP 里用它去创建新 skills。 ------ 定时任务功能,这个挺实用的。 可以让 AI 定期执行某些任务,比如每周给你一个解决问题的报告,定期去解决某个项目的 PR 问题,或者定期 review 代码。 对于需要持续维护的项目来说,这个功能还是挺有价值的。 ------ Codex APP 现在支持计划模式了。 因为它跟 Codex CLI 共享后端,所以现在 Codex CLI 也同步支持计划模式了。这意味着 AI 会先规划任务步骤,让你确认后再执行。 ------ 用量显示的样式做得挺好的。 进度条、余量、使用情况都很清楚,一眼就能看到你还有多少额度。 还有 code review 的快捷方式,可以快速调用你的 skills。MCP 的添加也支持。 ====== 实测:用 video-wrapper skill 跑了一遍 我测试主要是让它跑了一个我最近做的 skill,可以一键给视频添加视频包装,比如卡片、花字、人物条、章节标题这些。 这个 skill 挺复杂的,所以很适合用来测试。 ------ 第一次运行的问题 可以工作,但第一次它选了 PIL 这个方案,比较差。 核心问题是什么?它跟你没有交互。 我的 skill 里边写清楚了:要先问用户要哪套方案,再给出包装方案让用户确认,用户确认了再开始包装。 但在 Codex 这里,明显没有交互。它就直接跑,把所有决定都自己做了,跑完就完了。出错了也不管,直接用降级方案。 ------ 修复后的效果 我让它修复以后,它倒是能修复。重新跑了一遍,效果也不错。 最终生成的视频包装效果还行: ▸ 左下角有人物卡片 ▸ 有花字 ▸ 有各种卡片和章节标题 ▸ 结论卡片也加上了 因为我们用前端代码约束了样式,所以它在样式上不会出什么错误。 ------ 体验总结 整个过程很不可控: ▸ 速度很慢 - Codex 本身速度就慢 ▸ 交互明显不够 - 你根本不知道进到哪个阶段了,也不知道它的方案是什么 ▸ 只管执行 - AI 一直在执行,不会停下来问你 可能是它不太适应 skills 规范,只是简单做了一下适配,没有 Claude Code 跟 skills 的适配那么好。

歸藏(guizang.ai)

30,521 views • 4 months ago

段永平回应为何不买特斯拉,称不喜欢马斯克品行,做投资实际上就是在跟他做朋友,但马斯克确实是厉害。认为现在的大部分电动车品牌肯定会被淘汰。 雪球创始人方三文问,这些年是否对特斯拉的看法有所变化。段永平表示,“没有什么本质的变,但确实觉得埃隆·马斯克这个人是厉害,他有很多想法也确实是很先进,但是投资我觉得我比较难,个人的角度来讲,我不是很喜欢这个人的品行,你投资实际上你在跟他做朋友,我不想跟他做朋友,哪怕给我钱我也不干,所以我没有那么喜欢这件事情,但是我认识到他确实是厉害,而且他的东西,有很多东西很有道理,有些东西很没道理,你不知道他哪一条先出来。” “电动车生意不会太好,会很累,它差异化很小,但是特斯拉的电动车是做出差异化的。大部分电动车的生意,我觉得是会很艰苦。特斯拉总体来讲确实是做得好,款式少,东西也很单一,量又很大,那它相对来讲成本就会低,它是很可能有钱赚。 我在博客上是写过特斯拉的,我最早是很喜欢特斯拉,后来就看马斯克那些事儿,我就觉得有点不太喜欢这个人,加上我买了他们车以后,看他们的服务各方面,好多我没那么满意的东西,这又把股票也卖了,当然这是个错误的决策,我可能应该留着。我不是很喜欢特斯拉车,但是我喜欢他的Starlinks,我是它的客户,SpaceX我觉得确实也是厉害的,能够把那么大一个东西就让它降下来,我觉得太牛了。” “智能驾驶如果每个人都自己搞,其实也很累,我不知道,我不在这个行当里头,我是觉得也可能将来大家都用Google的方案或者是用某几家的方案,最后大家也是同质化的,大家的东西也都差不多,最后大家就赚个平均利润,也不是说就没有钱赚,因为它没有很好的差异化,所以它也很难有很好的利润,但是如果大家要是卷的话,卷到什么程度就不知道了,那个一定是要卷完了才会有剩下的人能够赚钱。现在我不知道有多少家在做电动车,就像我们当年做游戏机一样,可能有几百家,卷到最后就剩几家,那几家是赚钱的,但这几百家都是要倒的,所以现在看到的电动车大部分都会死掉,这个我可以肯定,谁会活下来,我不知道。”

外汇交易员

265,613 views • 6 months ago

习近平敢给日本、台湾扔核弹吗? “共产党毕竟有核武器...... 中共的核潜艇能不能用?肯定能用。 它有这么几百枚呢,是吧? 那扔哪国家去也管用, 但是它能不能扔出去?......” 正文: 你什么都可以,你什么都可以这个高估共产党,但共产党呢,就是这个作战能力,你绝对不用高估。所有作战能力,它取决两个方面,是吧?第一个,最重要的就是你军事的,这个就是军人。军人的素质是最重要的。 文斌你当过兵啊,就中共的军队的下边的溃烂、和腐败、和虚假,全人类上只有一个是以假治国、以女人治国的,以假治军、以女人治军,就中共国。这我太多朋友,咱战友当中很多军人,很多秘密你们不知道。 6月4号那天的时候,我们有战友给我发来了,就是潜水艇上的这个当时的视频:“七哥,我宁可被抓了,你把这发出去,叫共产党知道你掌握多大秘密。爆料革命哪里都有人。” 我说:“你傻了吧,就为了在直播中播一段你在潜水艇的视频,还有一些什么这个这个资料,我就把你命给搭上去?那还叫爆料革命吗?那不成了真正的黑帮革命了吗?” 就我们掌握他的一切。用他的原话说:“七哥,就我们这潜水艇,”他说,“发一个导弹出去,我们把自己都能给击沉,不用打别人哈。” 就像那个,就是拿枪挎着三八大盖是吧?没开过枪,结果一开枪,枪没往外打出去,枪卡壳了,把自己枪炸了。就是这种水平。 但是只要是当官,口号喊震天响。像我这种大校级的,他说:“打草稿吧,领导想听啥,什么时候问啥,几乎就是我们这些年都是干这个的。” 我说:“那共产党毕竟有核武器。” 他说:“七哥,共产党的核武器,”他说,“你知道我是从哪过来?我是从甘肃过来的,我又到了江西,从江西到了潜水艇部队。我那么多年说,中国的核潜艇能不能用?肯定能用,它有这么几百枚呢,是吧?那扔哪国家去也管用。但是它能不能扔出去,我告诉你,它扔到非洲肯定能扔出去;它扔台湾也没办法,因为台湾太近了,你根本防不了;日本也是有可能。” “它要是扔到欧洲和美国,它绝不可能。它只要能给出去超过15秒的时间——15秒,数的:1、2、3、4、5……15秒——他说只要15秒过去,他说大概在35秒,他说现在15秒足够了,给美国、欧洲100%把核武器直接炸到咱头上,没有任何可能。” “那你说共产党这个核武器扔到台湾?他把台湾可以拿导弹炸烂,他还要扔核弹?我不相信,他不会愚蠢到这种程度去。是吧?但扔到日本去,核武器他敢。他扔到日本的代价是什么?日本可以告诉你,他早就是准核武器国家了,日本在24小时,甚至现在超过16个小时,一定会迅速拿出核武器来,就是开箱的问题了,是吧?你动核,日本动了核武器,日本一定要把你给灭了。”

喜马拉雅日本勇者村

34,198 views • 6 months ago

Claude Opus 4.8 出了之后,我的第一反应是:想试。 第二反应是:算了,token 这东西真的不经烧。 结果看到 ZenMux 现在可以体验 Opus 4.8,就拿它试了一个我最近一直想做的小东西。 我自己有个很真实的问题: 脑子里经常冒出各种产品想法。 但每次真要开始做,就会卡住。 用户是谁? 第一版到底做什么? 哪些功能应该先砍掉? 怎么定价? 第一周从哪一步开始? 上线后怎么找第一批用户? 想法很多,执行很散。 所以我让 Claude Opus 4.8 做了一个「一人公司作战室」。 需求我写得也挺直接: 输入一句产品 idea。 自动拆出产品定位、MVP、开发任务、定价方案。 再生成落地页文案、冷启动实验、风险清单和本周计划。 最好不是一个静态页面,而是真的能点、能改、能导出。 然后我就把这段话丢给 Claude Opus 4.8。 出来的效果比我预期好不少。 它真的把“一人公司怎么从想法走到执行”这件事拆开了。 左边输入产品想法。 中间生成产品蓝图、MVP 范围、定价和官网文案。 右边是任务看板和本周计划。 底部还有冷启动实验、风险雷达和 Markdown 导出。 最让我觉得有意思的是,它不是一味堆功能。 比如我输入“给小红书博主做 AI 选题助手”,它会主动判断: 第一版必须做什么。 哪些功能看起来高级,但现在应该先别碰。 怎么找第一批真实用户。 哪些风险可能让这个项目做不下去。 这点就很能体现 Opus 4.8 的能力。 普通模型经常是:你要什么,我全给你加上。 最后页面很热闹,但产品判断是空的。 Opus 4.8 更像是在帮你收敛:先想清楚用户、场景和第一步,再把它变成可以执行的工作台。 我是在 ZenMux 上试的。 它比较方便的一点是,一个 Key 就能切不同模型,新模型上线也很快。 Opus 4.8 拿来做这种带产品判断、交互状态和复杂信息结构的网页,确实挺顺。 想试 Claude Opus 4.8 的,可以从这里进:

Joruno

15,250 views • 3 days ago

花了三天时间,build了我们第一个X402的产品 「X Spaces Transcription Agent」 你现在可以访问 使用它。 对我们来说,x402 不是一个“又一个支付方案”,而有可能成为未来互联网里最简单、最通用的支付协议。 但当我开始深入研究时,我发现一个很现实的问题: 今天的 x402scan 上,大部分服务其实并没有真实价值。很多调用量只是刷出来的——因为 facilitator 会代付 gas,所以你完全可以靠刷量堆数字。 (如果你感兴趣,我之后可以详细讲讲现在的刷量模式和一些典型行为。) 既然协议本身已经这么干净,那么真正缺的不是“更多 endpoint”,而是——有没有人愿意真正付费使用的 x402 服务? 所以我们换了一个思路: 别再追调用量了,从我们自己的真实需求出发,去做一个我们自己会持续付费使用的 x402 agent。 于是,我们构建了一个有明确使用价值的 x402 Server: 👉 只需用 x402 支付 1 USDC 你就可以转录任意一场 Twitter Space。 完整音频 → Whisper → LLM 多段格式化 转录完成后,这个 Space 的全文对所有人永久开放 所有人可以继续用 0.1 USDC/次 的方式使用 Chat agent 做 summary、key points、projects、translate 等二次分析 我们已经用它转录了不少 daydreams 和 x402 meta 相关的空间,如果你感兴趣可以点进去看。 为什么先做这个? 因为如果 x402 真要成为“互联网的通用支付层”,那就必须要出现一批真正愿意付费的服务: 不是刷量,不是 demo,而是你愿意掏 1 USDC、可以给你带来价值的数据资产。 而 Twitter Space 转录对我们来说就是一个非常明确的需求: 太多高质量讨论沉在音频里,不可搜索、不可引用、不可分析。 但当转录成为一个“用 1 USDC 买下的公共数据资产”之后,整个生态的 Agent 都可以在这上面做二次增值。 这个 Space Agent 只是我们构建的一批 x402 实用服务的第一个。 最后不要在熊市躺平,而是在熊市面向未来build, 而这个未来就是 X402 + ERC8004. 如果你对 x402、Web3、AI 的结合感兴趣,也可以完整的看看我们的技术文章:

0xhhh

14,661 views • 6 months ago

Hello D哥 CryptoD | 1000X GEM ,我来交作业了。这个项目总共用时3个小时不到,是一款meme打标类的chrome辅助插件。目前已经推送到github并且开源 (我本地跑过没问题,但github还未检查 如有问题请多多包涵): 灵感是最近这pvp的一个月里,我在交易的同时也在 William 直播间学习内盘pvp技巧;发现gmgn的三冠王最常用的就是猜猜谁是dev,通常知名钱包或者巨鲸钱包都能吃到不错的利润。但是在实战中我觉得真的太耗费精力,所以那时候我就在想如果有一款打标插件可以直接在新创建的token卡片上就直接标记出来那不是很爽,跳过了很多步骤;于是从这个点出发我开始了今天的vibe coding。 我使用的是gemini pro和cursor的工具组合,从一个MVP开始和Gemini先做一个直接测试,结果上我真的蛮吃惊的,因为其实从去年我就大量使用ai自己写东西,我是一个0基础的人,走了很多弯路,那时候我用的cursor,经常就是抽奖然后出问题重新改;这次gemini的表现几乎0失误:我用Gemini问答得到代码后放入cursor写文件,这样我甚至都不需要自己创建。 期间一共迭代了四五个版本,在api请求烦忙的事上最费功夫,这其实导致了我最初想要的核心功能无法实现(在新创建界面直接显示),但好消息是如果你采用花钱的方案使用付费的api,你也可以在我的版本之上做到。 #tradingtool

ACE ㊌

13,894 views • 6 months ago