Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

最近看到很多人在聊 Vibe Coding,我也下了软件试了下。 作为一个没有任何编程和计算机基础的人,竟然真的靠“聊天”做出了一个在线个人网页😂 过程其实很有意思: 我负责描述想要的 vibe和网页内容:自我介绍,风格类似iOS17 玻璃质感、淡绿色、按钮要更深一点… 然后用 GPT 帮我把这些抽象需求翻译成可执行的 prompt,Cursor 再根据 prompt 自动改代码、预览效果。 等于我完全不写代码,只是在指导两个 AI 结对编程: GPT 负责把我的中文需求变成工程语言 Cursor 负责真正写代码、渲染页面 我只需要根据网页呈现的结果反馈给GPT:这不够玻璃,再绿一点,加点光效等 最后用 Vercel,上线成一个真正的网址(但Deploy完显示404了..🥹 一套下来体验感就是——我们都向往“Vibe Coding” 的理想目标——那种“言出法随”的魔法,只要说话,AI就能完美实现一切。 但我们必须承认一个现实:以当前AI(无论是Claude、GPT)的能力,目前还远不足以支撑这个理想。 尝试AI“对齐颗粒度“,以学习的姿态打造AI时代的「超级个体」

32,119 görüntüleme • 6 ay önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

HeyGen这次开源,把AI做视频的最后一道门槛拆没了🤯 他们用Claude Code写代码,做了自己的50秒产品发布视频,然后把整个工具链完整开源给了所有人,致敬开源🫡 以后做视频真的能简单到离谱, 给一句话,做一个30秒的产品介绍,给一个PDF,自动生成总结视频, 迭代就是改一句话的事,比如把标题放大两倍,第三秒加一个淡入转场等, 这个工具叫HyperFrames,本质上就是一个纯HTML转MP4的视频渲染框架。 所以其实我们不用学任何剪辑软件,也不用写复杂的React代码, 只要写普通HTML,加几个简单的data属性,就能定义视频的每一帧、时间线、动画和音轨。 HyperFrames从第一天起就是为AI代理原生设计的。 AI天生就会写HTML,现在Claude、Cursor、Gemini所有编码Agent,只要装一个skill,立刻就会做视频。 这妥妥的降维打击啊,以前Remotion把视频变成了代码,但它需要你会React,需要构建流程,属于开发者专属的玩具。 HyperFrames是把视频变成了纯HTML,零构建,无DSL,不需要任何前置知识。 说白了,Remotion是给人写的,HyperFrames是给AI写的。 以前AI能写文字,能生成图片,但视频一直是最后一块硬骨头,现在这块骨头也被啃下来了。 代理现在能端到端完成一整条内容流水线,调研,写脚本,做设计,加动画,最后直接渲染出成品视频,全程不需要人类碰一下。 它还自带50+官方现成组件,社交遮罩、图表、转场,一行命令一键安装。 支持GSAP、Lottie、Three.js所有主流动画库,随便混用。 也就是说,同一份HTML永远出一样的结果,完美适合自动化流水线。 官方甚至把视频语言都标准化了,缓动用snappy,bouncy,转场用能量等级,字幕分Hype/Corporate/Tutorial三种风格。 AI只要学会这套词汇,就能稳定输出专业级视频,这不就是在教AI做导演嘛🤣 这对HeyGen来说也是一步妙棋,他们不再只是一个卖AI头像的SaaS公司,现在能做整个AI视频时代的基础设施了, 未来所有AI代理生成的视频都能跑在HyperFrames上。 然后再无缝接入HeyGen的头像、语音、翻译能力,形成一个完美的闭环。 当然目前也不是完美的,初期输出还有AI味,超过一分钟的复杂长视频,渲染还需要较强算力。 但我觉得这都不重要,关键是它第一次把完整的视频生产力交给了AI Agent,相当于AI内容创作时代的又一个里程碑。 想试的直接去GitHub搜heygen-com/hyperframes。 跑一行npx hyperframes init,然后让Claude帮你做第一个视频。 #HyperFrames #HeyGen #AI视频 #AI代理 #开发者 #内容创作

AYi

36,425 görüntüleme • 2 ay önce

Vibe Coding 让每个人都有做软件的能力,我见过很多人做了几十个产品,纯特么自嗨,没有一毛钱盈利。 现在 AI 一晚上能做一个产品,代码成本趋近于零,成本低到大家觉得不需要验证,做完了自然有人用。 但事实上大家都在做“玩具”,因为 Vibe Coding 解决的是 how,但 what 和 why 被跳过了。 我最近一个多月一直在用 atypica.AI ,就是在写代码之前,先把想法丢进去跑一轮用户验证。 它会有一套完整的研究链路: 先帮你拆研究计划,然后从百万级真实用户数据构建的 AI 人设库里挑人,组成一个焦点小组(AI Panel),让这些虚拟用户讨论你的产品、互相辩论、给出反对意见。 并且,这个焦点小组可以反复用,每次你有新想法、新定价、新包装、新广告语,都可以拉同一批人再聊一轮。 我刚用它测过的场景: 上周我想做一个给老板用的 AI 助手,它帮我组了 12 个不同行业的老板人设(persona)并沉淀成我可以反复调用的Panel 。 30 分钟跑完,从报告中发现3件我完全没想到的事: 1. 当AI变得太懂老板反而会引发不安全感(尤其是很懂账目和客户关系时,会觉得被盯着); 2. 最抗拒 AI 的老板也不是完全不用 AI ,只是不想换工作方式(能继续发微信、拍照、说语音,后台自动整理); 3. 他们愿意为 AI 付钱不是因为功能多,而是因为它能帮自己少亏一次钱(少一次压货、客户流失或管理损耗,比“智能助手”这个概念更能打动人)。 根据这些发现我当场调整了方向,然后用panel里的同一批人再验证了一轮。两轮下来,避开了至少三个致命错误。 Vibe Coding 把做产品的门槛降到了零,但做对产品的门槛一点没变,如果你想要靠产品盈利,最好还是先想清楚: 你在解决真实需求,还是在解决自己幻想的问题。

余温

26,825 görüntüleme • 10 gün önce

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上,陶哲轩做了一次 AI 和数学的演讲,非常精彩,从数学使用计算计算机的历史开始讲起,一直讲到大语言模型,干货相当多,尤其适合对数学有兴趣的同学。 (对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看) 先摘录几个冷知识: 1. 我们使用机器做数学计算已经有数千年,最早的机器辅助计算可能是罗马人,然后是中国的算盘 2. 二战时就有人肉“计算机”,计算弹道和其他任务,多位女孩子,因为男士们在打仗,所以那时候的计算基本单位不是GPU,而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在,数学家们使用一种现代化的证明辅助编程语言,叫做 Lean。在 Lean 中有一个核心的数学库,通过众包的方式开发的,本科数学课程中看到的内容,比如微积分基础、群论基础或者拓扑学等等,这些都已经被形式化了,所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程,那就是先编写一个称为“蓝图”的详细证明计划,将整个证明分解为数百个小步骤。每个步骤可以单独形式化,然后再将它们整合在一起,这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图,然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。 去年,陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了,使用了蓝图工具,参与的人中有概率论专家,甚至还有一些并非数学家的人,他们是程序员,但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务,并完成了它。 在数学领域,通常很难这么多人一起合作,一般最多可能五个人合作。因为在大项目上合作时,你必须相信每个人的数学都是正确的。但是,一旦超过一定规模,这就无法实现了。但现在借助 Lean 编译器,它能自动检查。团队成员无法上传任何编译不通过的内容,会被拒绝。因此,你可以与一些从未见过的人合作。 最后是讲大语言模型,首先陶哲轩就打脸了 GPT-4 的论文(我猜是微软那篇《GPT-4,通用人工智能的火花》),论文中号称 GPT-4 能解决国际数学奥林匹克问题,但实际上,这个问题不是 2022 年国际奥数竞赛的原始问题,而是一个简化版本,并且他们测试了几百道国际奥数竞赛问题,成功率只有1%,论文里的这个是精心挑选的恰巧能做对的。 并且陶哲轩提到了基于大语言模型的一些改进的方案: 比如 CoT(Chain of Thought),也就是 LLM 做简单的算术运算都做不对,但是如果让它一步步解释,可能就对了。还可以教 AI 一些解题技巧,比如尝试简单的例子,反证法,尝试逐步证明等。 比如让模型和编程语言或者工具连接,将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证,并且迭代的进行修正和验证,直到得到正确的结果,这可以提升大语言模型生成的效果。 即使借助这些手段,大语言模型还远远不能解决大多数数学问题,更不用说数学研究问题了! 当然陶哲轩也没太过打击大家对于 AI 的信心,表示我们在 AI 上还是在不断的取得进展,还提到了他日常是怎么用 AI 的,比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题,我尝试了几种方法,但都无法解决。于是,我尝试询问 GPT,你建议我使用什么其他方法来解决这个问题?GPT 给我提供了 10 种可能的方法,其中有 5 种我已经尝试过,或者明显没有帮助。的确,有几种方法并不实用。但其中有一种我还没尝试过的方法,那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时,我意识到这就是我漏掉的正确方法。所以,将 GPT 视为一个交流伙伴,它确实具有一定的用处。 还有使用 GitHub Copilot 帮他写代码,让它自动生成下一步的证明结果,Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具,你只需要写下一半的证明,它就会尝试猜测接下来的内容。大概有 20% 的情况下,它能猜到接近正确的答案。然后你就可以说,我接受这个答案。好的,那么在这种情况下,我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行,尽管你可能看不清楚,却真的解决了这个问题。所以,你不能盲目接受它的输入,因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解,这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行,它们就能自动完成。现在已经有了这样的实验,即通过迭代地让 AI 提供证明,然后让编译器进行反馈,如果编译出错,就把错误信息反馈给 AI。通过这种方法,我们开始能够验证四五步长的证明。当然,一个大型的证明可能需要数万行。所以,我们还没有达到能够立即得到一个正式证明的程度。但是,这已经是一个相当有用的工具。 对于大家关心的问题: AI 在数学领域现在到了哪一个阶段?是否未来几年利用 AI 能直接解决数学问题? 陶哲轩也给出了他的看法: > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题,你可以定制专门的 AI 来处理一小部分问题。即便如此,它们也不是完全可靠的,但还是有用的。不过至少在接下来的几年里,它们基本上将是非常有用的辅助工具,超越了我们已经熟悉的暴力计算辅助。 他还提到了一些可能的 AI 能在数学领域提供帮助的方向: - AI 能够非常好地生成有价值的猜想 > 比如,我们已经看到了关于结理论的例子,它们已经可以推测出两个不同的统计量之间的关系。因此,我们希望能够创建大量的数据集,输入到 AI 中,它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点,部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在,因为证明定理是如此繁琐和艰难的过程,我们一次只能证明一个定理,如果你效率很高,可能一次能证明两三个。但是有了 AI,你可以设想一下未来的情况,我们不是试图解决一个问题,而是处理一类类似的1000个问题,然后告诉AI,尝试用这个方法解决这 1000 个问题,然后报告结果,哦,我能用这种技术解决 35% 的问题。那么另一种技术呢?我能解决这个百分比的问题。或者如果结合这些方法,又能解决多少问题?你可以开始探索问题的空间,而不是一个接一个地解决问题。这是你现在根本无法做到的事情,或者是你需要几十年时间,通过数十篇论文慢慢搞清楚各种技术能做什么,不能做什么。但是有了这些工具,你真的可以开始做规模前所未有的数学研究。所以,未来将会非常令人兴奋。 演讲环节结束前的最后一句话说的特别好: > 我们仍然会以传统方式证明定理。事实上,我们必须这样做,因为如果我们自己都不知道如何做这些事情,就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。 这恰恰也是我们现在使用 AI 辅助编程的问题:如果我们自己都不知道如何构建软件,就很难引导好 AI 帮助我们生成高质量的代码。 尽管 AI 在数学和编程领域变得越来越有用,但人类的洞察力和创造力仍然是创作价值的关键。 原始 YT 视频:

宝玉

300,761 görüntüleme • 1 yıl önce

AI淘汰程序员? 想多了。 硅谷投资大佬Marc Andreessen点破了一个真相。 AI编程不会消灭程序员,它在重新定义这个职业。 程序员的工作不再是逐行敲代码。 现在的工作,是同时指挥10个AI编码机器人。 跟它们争论,调试它们的输出,修改需求,逼它们拿出正确结果。 但这里有个圈套。 如果你自己不懂怎么写代码,你根本无法判断AI给你的东西是对是错。 编程的下一个层次,不是写脚本。 是监督写脚本的AI。 今天最顶尖的程序员,整天在不同终端之间切换。 管理多个编码机器人,修复错误,优化指令。 讽刺吗? 你仍然需要极其扎实的基本功。 没有基本功,你连AI在犯傻都看不出来。 工作的本质变了。 现在是跟AI机器人辩论,调试AI生成的代码,理解为什么程序跑不起来,或者为什么不够快。 AI确实简化了工作。 但只有真正懂代码的人,才能判断这种简化是否正确。 程序员不会消失。 他们正在变得比以前强大10倍、100倍,甚至1000倍。 生产力的巨大提升,这才是真正的价值所在。 任务在变,工作性质在变。 但最终负责的,永远是人。 人类依然在监督过程,评估结果,纠正错误,并做出最终判断。 未来的程序员不是被AI取代。 他们被AI升级了。 所以,还是得老老实实学习怎么写代码,理解代码。 因为当AI搞砸的时候,只有人知道为什么。 这种能力的跃升,才是真正的革命。

墓碑科技

58,888 görüntüleme • 4 ay önce

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 görüntüleme • 7 ay önce

给关注我的兄弟们发个灵感,我花了三天时间用 AI 做了一个直播卖货的练习 App, 可以解决: 1. 现在很多人都知道,开直播卖货能赚钱(只要卖得出去); 2. 知道但不会 --> 那就去学(很多地方都可以学),学完之后「练」,那怎么练呢?事实上目前是没有太多练习机会的,他可以直接开直播练习卖货,但是没人看他的直播,更没有人提问,所以没法练。 那么这个小工具可以一定程度地解决这个问题。 1. 导入商品信息,AI 模拟用户生成真实的提问,主播通过回答这些问题来练习自己对所售产品的熟悉度,以及面对镜头的自然感; 2. 练习结束后,AI 通过练习过程中采集到的声音转文本后分析这段直播卖货的话术存在哪些问题并给出优化建议。 !开始我打算做成一个通用的直播卖货练习工具,通过解析电商平台的商品链接,但存在一个我无法解决的问题,所以改成特定产品的销售练习(不要试图去解决这个问题,有法律风险需自行评估,后果自负)。 灵感发出来了,任何人都可以复制,我也会完善一个自己的版本,给我的用户使用。 这些功能都非常基础,实现简单,我是编程零基础只用了 3 天就做出来了,这可能跟我上半年买了纯想老师的编程课有一定的关系,现在可以随意把自己的想法做出一个功能基础的 App 或者网页,体验感非常棒。

banboo

67,977 görüntüleme • 11 ay önce

问天塔与理想国 那时候我在想,有一天我将带领了我的同族们创造一个新的文明的时代,那个时候又叫量子电脑,是未来的一个,这个目前看到一个终极的工具。然后最终会走向人与上帝沟通... 就像七哥曾经见过高人探索了人类的文明,有幸的一窥世界人类的游戏的真相的碗边之后,我就在想自己,你说要有一天,我想我要把共产党灭了,然后我拥有一个从地下冒油的国家,像沙特一样,是吧。沙特当时萨乌地(Saudi)先生,Mr.萨乌地先生建造了一个国家,建造了这个国家怎么着,生了五千个王子、公主,是吧。然后全给他钱花,是不是。然后近亲结婚,是不是。表亲的结,乱球搞,最后一帮的傻子出来了,是不是。都是不正常的,是吧。然后这叫国家。 郭文贵想要这个吗?我要有本事创造一个财富帝国,我不去灭共,我找个地方弄个地方,是吧,建个国,然后整出一帮就是郭文贵的国家,然后郭文贵的五千的子孙和公主们,然后最后近亲结婚,整出一帮傻子出来,然后就是花钱买劳斯莱斯,坐到大飞机,是吧。你觉得这是我想要的吗?我当然不想要。 然后再一个就想想,我建一个实体,像北朝鲜一样,让所有人都盼望喝一碗肉汤,然后我吃得胖胖的,然后都得糖尿病死掉,然后让我的儿子,我的孙子接班,是吧。这是我想要的吗?不想要。我都不想要孙子,要不要孙子我都不管,我干嘛要这个?是不是。 那我是不是像中国共产党一样,是不是,编一个谎言,创造一个笑话,然后让全中国人民就是说爹亲娘亲不如我这个党亲,都当我的奴隶,然后我到处造小人,造孩子,在全世界去,到人家国家去当人家三孙子去,我在这块奴役我中国人民都变成我的孙子和奴隶,这当然不是我想要的。 那什么是我想要的?是吧,我就要探索,我只要活着,我把共产党灭了,我这一辈子就不白活。我毁掉一个魔,比我建一个国的功劳和快乐要大得多。这是一个。第二,我宁可去当狗去,我都不当国王,因为国王全都是骑在人民的头上的。 那建一个什么?建一个心中的自我的王国,就是信仰的王国,信仰的王国就是什么?我要找到人为什么来到世界?人到底应该去什么地方?我现在我觉得我发自内心的时候,我认为我知道,我相信人是不生不灭的。因为我们活在一个伟大的时代,很早我就看到了网络文明,现在的生物文明,我就在这个楼的后面,就在背后这个楼,今天看到的川普大楼,就在这个楼的20楼,我住在这,1989年,在1998年到1999年,看到了人类上第一次的,克林顿时期和布什时期搞的人类的基因的排谱,我看到了股票塞雷拉(音)的上市,塞雷拉博士完成了人类的基因排谱,这是多大的事啊,对七哥是震撼的。 人类的基因谱排完以后,所有的DNA有多少个的DNA?有多少个谱,怎么形状?有多少个组基因?他把人类给整明白了,人类的染色体。然后我又看到了当年AOL电脑、谷歌、雅虎这些是网络时代的到来,就在这儿,就在这儿。那时候我在想,有一天我将带领了我的同族们创造一个新的文明的时代,那个时候又叫量子电脑,是未来的一个,这个目前看到一个终极的工具。然后最终会走向人与上帝沟通,就人与人的神之间沟通,就是生物电脑。 干细胞,你看干细胞就发明了多了不起,所以现在量子电脑上来以后,人的一切改变,而且就在两三年应用,这是七哥二十年三十年的梦想。今天我们站在这里讨论的时候,我特别的幸福,因为我们这些人会最早享受既有钱还有这能力,还有这个需要来享受量子电脑。创造一个数字化的货币的时代、金融的时代、网络的时代和找到人类更多,探索的快乐的时代。 #郭文贵 #新中国联邦 #问天塔 #干细胞 #量子电脑 #生物电脑

喜马拉雅日本勇者村

19,379 görüntüleme • 1 yıl önce