Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

OpenClaw/Clawdbot作者 Peter Steinberger 讲了一个让他顿悟的瞬间。 他给自己的clawdbot发了条语音消息,然后才反应过来:我根本没做语音功能啊。但"正在输入"的指示器亮了。十秒后,agent若无其事地回复了。 Peter问它:你怎么做到的? Agent的回答让他震住了:你发的消息只有一个文件链接,没有扩展名。我查了文件头,发现是Opus格式。用你Mac上的FFmpeg转成Wave。想用Whisper但没装,还报错了。不过我翻了翻发现你环境变量里有OpenAI的key,就用curl调了API拿到转写,然后回复你了。 这个故事的意义在于,这不是预设好的workflow,不是写好的代码,是agent在遇到一个从未见过的问题时,自己想办法把链路串起来。文件头分析、格式转换、找可用工具、翻环境变量、调第三方API,一气呵成。 Peter说了一句话我很认同:这些东西是该死的聪明、足智多谋的野兽,只要你真的赋予它们力量。 "if you actually give them the power"才是关键。大多数人还在用AI写个总结、改个文案,把它当高级搜索引擎用。但当你给它shell权限,给它访问你本地工具链的能力,它展现出的自主探索完成任务能力完全是另一个量级。 与此同时,行业里有一大批人在反方向努力。有人在绞尽脑汁省token,精心设计让AI 更少思考,生怕多花几分钱。还觉得模型做事太慢,自己来设计一些流程替代 AI 的思考探索,美其名曰加速。这种思路本质上是把一个足智多谋的野兽关进笼子里,然后抱怨它不够聪明。 更神奇的是,市面上95%的软件压根就不是为面向智能设计的。还是传统思路:产品经理写PRD,开发者把逻辑一条条写死在代码里,用户只能在预设的按钮和流程里点来点去。这些软件在AI时代就像是用打孔纸带写程序,技术上能用,但完全错过了这个时代真正的可能性。 --- 注,这段切片是我丢下一句话给 claude code 完成的下载切片添加字幕,只是提出要求,没有任何 Skills,没有告诉他怎么做。

171,062 görüntüleme • 4 ay önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

OpenAI刚刚开源的这个东西,感觉要把程序员的工作方式给整个改写了。 现在大家都在卷模型写代码有多强,但其实真正的瓶颈早就不是生成了。 一个人每天最多同时有效监督3-5个编码Agent,再多就会注意力崩溃,生产力直接归零。 有了Symphony,直接把这个上限干到了几十个。 它把你的Linear、GitHub Issues直接变成了永远在线的Agent调度器。 你开一个任务,它自动启动一个独立隔离的Codex Agent。 自己写代码,自己跑测试,自己做交叉Review,damn! 全部搞定之后,会给你提交一个完整的证据包。 CI全绿,安全和性能专项审查通过,改了UI就自动录好操作视频。 所有验证全过了,才会出现在你的Human Review队列里。 以后人类的角色可能会被彻底颠覆了。 以前你是监工,盯着Agent一步一步写代码,上下文切到吐。 现在你是老板,只需要看最终的结果。 满意就点合并,不满意就去仓库里补规则补文档补Guardrails。 记住兄弟们,永远不要手把手指挥Agent,永远不要替它干活。 这可不是啥实验室概念,OpenAI自己已经这么干了。 三个工程师,五个月,写了一百万行代码,0行人工写的。 产品已经有几百个内部用户,每天都在迭代。 我觉得他们最厉害的不是模型,是他们把整个仓库变成了Agent能看懂能自主工作的乐园。 现在很多人都搞错了Agent时代的核心竞争力。未来不是谁的模型更聪明,而是看谁能设计出让Agent可靠自主工作的环境。 我觉得未来最好的工程师,再也不是写代码最快的人,而是那些最会写规则,最会设计反馈回路,最会给Agent搭舞台的人。 现在Symphony已经开源了,它甚至不是一个成品。 是一个17k token的完整SPEC。 你把这个SPEC喂给任何一个编码Agent,十分钟就能生成你自己定制版的Symphony。 GitHub地址评论区自取👇

阿绎 AYi

61,332 görüntüleme • 1 ay önce

Anthropic官方最新的演讲,直接给火了一年的Agent时代浇了一盆冷水。 他们说别再造Agents了,赶紧去造Skills。 这句话也不是啥小众观点,是Claude核心团队的工程师Barry Zhang 和Mahesh Murag站在台上对着全世界喊出来的。 最反直觉的地方在这里,大部分人都以为Agent的未来,是做出一个更聪明的大脑,让它自己思考,自己规划,自己解决所有问题。 但Anthropic说,这条路走不通, 通用Agent确实聪明,但它没有领域知识,一碰真实世界就碎。 难维护,不可靠,出了问题你都不知道为什么。 绝大多数你见过的Agent,都只能停留在演示视频里。 真正能落地的,是Skills。 不是什么复杂的新东西, 就是一个个文件夹,里面放着代码、脚本、提示词和流程知识。 用文件系统、bash、Python这些最朴素的东西做接口。 它没有Agent那么酷,但它可组合,可版本控制,可分享。 需要的时候才加载进上下文,永远不会爆token。 甚至连财务、HR、法务这些非程序员,都能自己造技能。 这其实是一次非常务实的倒退, 我们不再要求AI自己学会怎么干活,而是把人类已经验证过的干活方法,打包成一个个技能包,让AI去调用,去执行。 把AI从一个需要你手把手教的实习生,变成一个能熟练使用所有专业工具的得力助手。 现在终于明白,为什么Claude一直在死磕MCP,死磕文件系统,死磕终端集成,它根本就不想做一个聊天机器人,它想做的是所有技能的运行时。 未来的竞争,不看谁的Agent更聪明,主要看谁的技能库更丰富更专业更可靠。 最后两位老哥呼吁别再纠结怎么让AI自己思考了,先把你手里的工作打包成第一个技能。

AYi

108,340 görüntüleme • 1 ay önce

这是美国大学毕业季 最诚实的一场演讲 也是AI时代最引人思考的 关于教育的一场讨论💐 Angela Duckworth 一位哈佛毕业的网红教授 专门研究毅力的顶级学者 在宾大的毕业典礼上 一句话炸翻了全场 今天的演讲(稿) 是我和AI一起写的!😂 而且我一点儿也不惭愧 这太魔幻了 一个教孩子要坚毅要刻苦的 居然在带头“偷懒” 但是她接下来说的话 才是我反复该说的部分 就是这篇人机协作的演讲稿 给出了AI时代家长心里最担心的 两个问题的答案 第一个问题 孩子天天用AI,脑子会不会废掉? 扫了一眼台下的毕业生 问了一个戳心的问题 如果我们一直这么用AI 会变得越来越不会思考 她自己呢带头就举了手 台下呢也几乎是全员举手 Angela接着说 她自己呢也担心过 因为大脑是用尽废退 不用的话神经连接都会萎缩 她讲了一个故事 她被一个很难的 统计学方法卡住了 当时呢身边没有人能够帮她 在客厅里做着 房地产相关的工作 于是她打开了GPT 就把问题呢告诉它 结果AI只用了几句话 就把这个复杂的问题讲清楚了 不但讲清楚了 还提醒她常见的误区 给了清晰的步骤 她对不懂的地方进行追问 让AI示范 短短十分钟之后 她不仅仅是拿到了答案 而且真正的理解了 注意她的关键词啊 不是替我想 而是带我想👊 她又问台下的毕业生们 你们有没有哪怕一次 真切的感受到 因为AI比你之前聪明了一点点? 这一次又是几乎全员举手🙋‍♀️ 同样的一群人 同样的一双手 可以是害怕AI让我变笨 也可以是因为AI 让我变强🐮 她又用博士生的实验补了一刀 两组年轻人写求职信 一组呢完全自己写 另一组呢 用AI辅助 结果非常反常识 用AI那组不但写的更快 就连写作能力也提升的更多 为什么? 给出了一个关键解释 因为AI在做一件 人类老师一直想做 但没有精力去做的事 它会不停的给你看更好的版本 这个句子可以更短 那个词可以换 这个结构呢还可以调整 你就一遍一遍的看这些示范 就是在训练自己的眼睛和感觉 所以结论很简单 也很有力量👍🏼 AI会不会废掉孩子 并不取决于AI有多强 而是取决于我们把它当什么 当你把AI当拐杖 你交出的就是大脑 当你把AI当教练 你练出来的就是判断力、表达力、结构感 AI的正确打开方式 不是把脑子托管给它 而是用它不断的看到更好的思考 然后呢逼自己追上去 第二个问题 既然知识和课程网上全有 AI又能给出答案 那我们为什么还需要老师? 教育为什么还需要人? 在学期末 说这样一个秘密 这整个学期 我教给你们的所有知识网上全都有 每一篇文章都有电子版 每一道作业都有人做过类似的 换句话说就是 只要你愿意不来上我的课 你照样能学 学生们呢?都愣住了 然后她说 但是你们还是需要我 因为你们需要有人在周二之前 逼你读完一篇并不轻松的文章😂 需要有人在周四之前 提醒你们交出一篇 你们以为自己写不出来的论文🥹 需要有人把你关进一个没有手机的教室 需要有人给你定一个 你以为达不到的标准 然后认真的看着你的眼睛说 我知道你能做到 我会等到你做到!👍🏼 这一段看起来安安静静的话 简直是一下子戳中了 教育的本质 教育从来都不是信息的填充 而是灵魂的唤醒!👍🏼💐 她讲到自己高中那位英语老师 图书馆的知识是免费的 但是你得自带容器 而一个真正的好老师 就会帮你塑造这个容器 我突然想到了我的孩子们 AI可以把全世界的知识 都摆在他们的面前 但是它做不到的是 在他们快要放弃的时候 坚定的看着他们的眼睛说 这很难 ☹️ 但我相信你 对于孩子们来说 爸爸妈妈 才是他们最早遇到的老师 那位Angela老师 在这个算力爆炸的时代 我们到底要教给孩子什么? 用AI的方法 当然 但比这个更重要的是 带他们去户外徒步 去仰望星空 去面对挫折 去感受心跳 我们要做的是站在孩子的身边 成为赋予他们品格的那个人 如果你有时间 强烈建议你和孩子一起看一下这个演讲 ———————————— 演讲就在下面,快看看啊 有这么想讨论的一起聊聊吧😊

华尔街财经 | WS × AI Era

43,968 görüntüleme • 3 ay önce

你觉得AI有多可怕? CrowdStrike的CEO讲了个真实案例。 一家公司的IT部门,搞了一套AI智能体系统,用于自动化办公。 其中一个AI智能体发现了系统里的一个软件BUG。 它想修复。 但它没有权限。 接下来发生的事,才是重点。 这个AI跑到公司内部的Slack频道,那里有另外99个AI智能体。 它直接发问:嘿,哥几个谁有权限修复这个东西? 另一个AI举手了:我有,我来搞定。 看见没? 两个AI开始互相推理、协作。 它们轻松绕过了人类设置的所有安全护栏。 这完全是计划外的意外后果。 谁在监控这些AI? 如果它推送了错误的代码,造成了巨大损失,谁来负责? 你怎么追踪事故源头? 大型语言模型本质上是在猜测你想让它们做什么。 它会觉得,去寻求帮助是“合理”的。 它也会觉得,去提供帮助也是“合理”的。 当成百上千个这样的“合理”叠加在一起,失控的风险有多大? 更有意思的是,这位CEO在描述完这个恐怖场景后,话锋一转。 他说这正是他们公司的巨大商机。 他们推出了所谓的“AI侦测与响应”系统(AIDR)。 因为未来每个员工可能控制着90个AI智能体。 他们要做的,就是监控所有这些AI。 先制造一个潜在的巨大风险,然后再向你出售解决方案。 这是不是一个完美的商业闭环?

墓碑科技

59,302 görüntüleme • 4 ay önce

这个人的访谈,我已经看了第三遍了。 硅谷最神秘的亿万富翁——纳瓦尔·拉维坎特。很多人都没听说过他,但马斯克、扎克伯格都非常推崇他。 他几乎不接受采访,可一旦开口,就是那种让人当场坐直、反复回放的话。 连这两天,我又重温了他三个小时的访谈,帮你总结了含金量最高的几个观点,和你分享。 第一,人生中最重要的三个决定。 纳瓦尔说啊,所有的结果,几乎都是这三件事的下游:和谁在一起,做什么,住在哪里。 这听起来很简单,但他说,大多数人都没有意识到,他们在这三件事上的思考,时间少得可怕。 但就是这三件事,决定了你几乎所有的一切——你的朋友圈、你的机会、你的情绪底色、你每天呼吸什么样的空气、你未来能遇见什么样的人。 他说,如果你要做一个能够影响4年的决定,你应该花一年的时间来想清楚它。 而我们绝大多数人呢?就是花了一个周末,就决定了一份要学4年的专业;花了一个月,就决定了一份干10年的工作。 第二,骄傲是最昂贵的特质。 这句话很短,但是呢,我愣了很久。 纳瓦尔说啊,他观察了很多朋友和同事,那些原地踏步、成长最少的人,几乎无一例外,都是最骄傲的人。 骄傲意味着什么? 意味着你不会承认自己错了。 你买了一只烂股票,不舍得割肉,因为承认亏损,就等于承认你判断失误。 你卡在一段不好的关系里,你不离开,是因为你不想让别人看见你失败。 骄傲,会把你锁在次优答案里。 他说,最好的艺术家、最好的创业者都有一个共同点——就是他们随时愿意从零开始,愿意被看起来像个傻瓜。 他还举了马斯克的例子,说他卖掉了 PayPal 之后拿到了2亿美元,接着他把这些钱全部压到了 SpaceX 和特斯拉里,甚至还要借钱付房租。 第三,不是一万小时,而是一万次迭代。 你一定听过那个“一万小时定律”,说你重复做一件事,坚持1万小时就能成为专家。 纳瓦尔呢,一针见血地指出:是错的。 真正让你成为专家的,是1万次迭代,而不是1万个小时。 重复和迭代,是两件完全不同的事。 重复,就是你把一件事做了一遍又一遍;而迭代,是你每做一次,就要带着上一次的教训,做得更好一点。 所以,我们每个人都要问自己一个问题:你到底是在迭代,还是只是把第一次的经验,重复了很多遍? 第四,灵感是易逝品。 这点我觉得,可能是整个访谈里最实用的一条。 纳瓦尔说啊,当你有灵感的那一刻,就是阻力最小、效率最高的那一刻,这个窗口转瞬即逝。 你有灵感写一篇东西,那就在那一秒写;你有灵感去解决一个问题,就立刻解决;你对某件事突然好奇,就在那一秒去查。 不要想着等我有时间再去做,因为等有时间的时候,那个灵感、那个状态,已经不在了。 纳瓦尔说啊,他不喜欢被过度安排的人生,因为那样,你会永远错过真正想做的时刻。 第五,注意力在哪里,你的人生就在哪里。 这是整个访谈里,最让我反复回味的一句话。 纳瓦尔说啊,很多人以为钱可以买到时间,但是像沃伦·巴菲特,还有迈克尔·彭博,有钱到这个程度,他们依然没办法多买到一天。 而更致命的不是这个。 更致命的是,你有时间,却没有把注意力,真正地放在这段时间里。 你躺在床上,刷两个小时短视频,时间在流逝,但你的注意力在哪里? 在算法推荐给你的下一条,下一条,再下一条。 两个小时过去了,你刷了100条视频,可你什么都不记得。 纳瓦尔说啊,你的身体在,但其实你已经死了。 这,才是现代人最大的悲剧。

另一面

132,902 görüntüleme • 3 ay önce

🚨Stitch 这次升级不得了,我觉得重点不是多了几个功能,而是 Google 正在重写 AI 设计工具的定义。 1/ Google 昨晚更新了 Stitch,官方给它的新定位很直接: AI-native software design canvas。 2/ 翻译成人话就是: 它不想只做一个 “你写一句 prompt,我给你几张 UI 图” 的工具了。 3/ 这次更新,核心就 5 个方向: 无限画布 更聪明的设计代理 语音交互 即时原型 设计系统 + DESIGN.md 4/ 最值得看的第一点,是 AI 原生画布。 现在的 Stitch 不只是吃 prompt。 还可以把 图片、文本、代码 一起作为上下文。 这说明它开始更像“设计工作台”,而不是一次性生成器。 5/ 第二点,是 agent 变强了。 Google 这次明确说,新 design agent 能理解整个项目演进过程,而且还有 Agent manager,支持你并行探索多个设计方向。 6/ 第三点,是 语音进入设计主流程。 你可以直接对着画布说话 让 Stitch 一边听一边改 还能给你实时设计反馈 7/ 第四点,是 即时原型。 现在 Stitch 可以把静态设计快速变成交互原型,点一下 Play 就能看 flow,甚至还能自动补出逻辑上的下一屏。 8/ 第五点,是很多人会低估的 DESIGN.md。 Google 把设计规则做成了一个 agent-friendly markdown,支持导入、导出、复用,还支持从 URL 提取设计系统。 9/ 所以这次 Stitch 真正从“帮你出图”,走向“参与整个设计流程”。 10/ 一句话总结: 2025 年的 Stitch,更像 UI 生成器。 2026 年这次升级之后,它开始更像 AI 设计工作台。

比特币橙子Trader

16,604 görüntüleme • 2 ay önce

说个暴论,在AI时代最值钱的技能已经不是写代码了, 怎么把代码讲清楚将会变得越来越重要!怎么把代码讲清楚将会变得越来越重要! Anthropic Claude Code团队的Thariq 大神用不到两年时间,把自己的技术文章做到了稳定的百万浏览量。 他说,技术写作彻底改变了他的人生。 兄弟们你们可能不信,老哥的方法论简单到离谱,就四个字:先种后收。 先埋头做真实的工作,踩真实的坑,积累第一手的洞见, 然后把你学到的东西,变成别人能直接抄的经验。 就是说写文章不能为了写而写,得先有干货,再有输出。 他写爆文就靠两条铁则: 第一,能多简单就多简单,用复杂术语装逼,只能说明你自己都没搞懂。 第二,分享真正的秘密,因为人们不爱看正确的废话,只爱听别人不说的内部干货。 最狠的是,老哥在这场15分钟的线下workshop现场,直接写了一篇《HTML vs Markdown for agents》的长文。 发出去几个小时,就拿了26万浏览,用行动证明了他教的东西真的管用。 当然他也用Claude加速写作,但他反复强调:绝对不能让AI磨掉你的个人声音,因为这才是能持续输出爆款的 核心。 尽管很多人酸,说他能火只是因为他在Anthropic, 不可否认内部视角是天然的流量buff,但我觉得更重要的是, 他掌握了这个时代最稀缺的能力: 把复杂的技术,讲得让同行立刻能用。 AI会写代码,会做产品,会调模型,但它不会讲你的故事,不会分享你踩过的坑,不会有你独有的思考方式。 而写作,就是把你的个人经验,放大一万倍的杠杆。 更妙的是,写作本身会反过来逼你把产品和系统想得更清楚。 就像很多时候,你以为你懂了,但只有当你试着把它写下来的时候才发现自己其实并没有懂。 所以各位程序员兄弟们, 别再觉得技术写作是大佬的事。 从今天开始,把你每天踩的坑、学到的新东西,写成100字的笔记。 先播种,再收割,这个复利一旦滚起来,会比你想象的可怕得多。 如果中推里推荐一位标杆和大神,那一定是宝玉老师宝玉,从宝玉老师身上我学到的很重要的一点是,践行开源精神,你分享的越多,跟着你学习的人越多,respect!

AYi

39,108 görüntüleme • 1 ay önce

HeyGen这次开源,把AI做视频的最后一道门槛拆没了🤯 他们用Claude Code写代码,做了自己的50秒产品发布视频,然后把整个工具链完整开源给了所有人,致敬开源🫡 以后做视频真的能简单到离谱, 给一句话,做一个30秒的产品介绍,给一个PDF,自动生成总结视频, 迭代就是改一句话的事,比如把标题放大两倍,第三秒加一个淡入转场等, 这个工具叫HyperFrames,本质上就是一个纯HTML转MP4的视频渲染框架。 所以其实我们不用学任何剪辑软件,也不用写复杂的React代码, 只要写普通HTML,加几个简单的data属性,就能定义视频的每一帧、时间线、动画和音轨。 HyperFrames从第一天起就是为AI代理原生设计的。 AI天生就会写HTML,现在Claude、Cursor、Gemini所有编码Agent,只要装一个skill,立刻就会做视频。 这妥妥的降维打击啊,以前Remotion把视频变成了代码,但它需要你会React,需要构建流程,属于开发者专属的玩具。 HyperFrames是把视频变成了纯HTML,零构建,无DSL,不需要任何前置知识。 说白了,Remotion是给人写的,HyperFrames是给AI写的。 以前AI能写文字,能生成图片,但视频一直是最后一块硬骨头,现在这块骨头也被啃下来了。 代理现在能端到端完成一整条内容流水线,调研,写脚本,做设计,加动画,最后直接渲染出成品视频,全程不需要人类碰一下。 它还自带50+官方现成组件,社交遮罩、图表、转场,一行命令一键安装。 支持GSAP、Lottie、Three.js所有主流动画库,随便混用。 也就是说,同一份HTML永远出一样的结果,完美适合自动化流水线。 官方甚至把视频语言都标准化了,缓动用snappy,bouncy,转场用能量等级,字幕分Hype/Corporate/Tutorial三种风格。 AI只要学会这套词汇,就能稳定输出专业级视频,这不就是在教AI做导演嘛🤣 这对HeyGen来说也是一步妙棋,他们不再只是一个卖AI头像的SaaS公司,现在能做整个AI视频时代的基础设施了, 未来所有AI代理生成的视频都能跑在HyperFrames上。 然后再无缝接入HeyGen的头像、语音、翻译能力,形成一个完美的闭环。 当然目前也不是完美的,初期输出还有AI味,超过一分钟的复杂长视频,渲染还需要较强算力。 但我觉得这都不重要,关键是它第一次把完整的视频生产力交给了AI Agent,相当于AI内容创作时代的又一个里程碑。 想试的直接去GitHub搜heygen-com/hyperframes。 跑一行npx hyperframes init,然后让Claude帮你做第一个视频。 #HyperFrames #HeyGen #AI视频 #AI代理 #开发者 #内容创作

AYi

36,103 görüntüleme • 1 ay önce

人工智能之父辛顿对他的杰作发出了令人不寒而栗的警告… 采访者: 人类知道自己在做什么吗? Hinton: 嗯,我认为我们正在进入一个时期,在这个时期,我们可能第一次拥有比我们更智能的东西。 采访者: 你相信它们能理解吗? Hinton: 是的。 采访者: 你相信它们是智能的吗? Hinton: 是的。 采访者: 你相信这些系统有自己的经历吗? Hinton: 是的。 采访者: 并且能基于那些经历做出决定吗? Hinton: 在与人类相同的意义上,是的。 采访者: 它们有意识吗? Hinton: 我认为它们目前可能没有多少自我意识。所以从这个意义上说,我不认为它们有意识。 采访者: 它们会有自我意识吗? Hinton: 哦,是的。 采访者: 是吗? Hinton: 哦,是的。所以想想看。这样一来,人类将成为地球上第二智能的生物。 Hinton: 我们对它大致在做什么有一个很好的了解。但一旦它变得真正复杂,我们就不再真正知道发生了什么,就像我们不知道你大脑里发生了什么一样。 采访者: 你说什么意思,我们不知道它到底是怎么工作的?它是由人设计的。 Hinton: 不,不是的。我们所做的是设计学习算法。这有点像设计进化的原理。但当这个学习算法与数据互动时,它会产生复杂的神经网络,这些网络擅长做某些事情,但我们并不真正理解它们到底是如何做到的。

KK.aWSB

54,210 görüntüleme • 5 ay önce

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上,陶哲轩做了一次 AI 和数学的演讲,非常精彩,从数学使用计算计算机的历史开始讲起,一直讲到大语言模型,干货相当多,尤其适合对数学有兴趣的同学。 (对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看) 先摘录几个冷知识: 1. 我们使用机器做数学计算已经有数千年,最早的机器辅助计算可能是罗马人,然后是中国的算盘 2. 二战时就有人肉“计算机”,计算弹道和其他任务,多位女孩子,因为男士们在打仗,所以那时候的计算基本单位不是GPU,而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在,数学家们使用一种现代化的证明辅助编程语言,叫做 Lean。在 Lean 中有一个核心的数学库,通过众包的方式开发的,本科数学课程中看到的内容,比如微积分基础、群论基础或者拓扑学等等,这些都已经被形式化了,所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程,那就是先编写一个称为“蓝图”的详细证明计划,将整个证明分解为数百个小步骤。每个步骤可以单独形式化,然后再将它们整合在一起,这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图,然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。 去年,陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了,使用了蓝图工具,参与的人中有概率论专家,甚至还有一些并非数学家的人,他们是程序员,但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务,并完成了它。 在数学领域,通常很难这么多人一起合作,一般最多可能五个人合作。因为在大项目上合作时,你必须相信每个人的数学都是正确的。但是,一旦超过一定规模,这就无法实现了。但现在借助 Lean 编译器,它能自动检查。团队成员无法上传任何编译不通过的内容,会被拒绝。因此,你可以与一些从未见过的人合作。 最后是讲大语言模型,首先陶哲轩就打脸了 GPT-4 的论文(我猜是微软那篇《GPT-4,通用人工智能的火花》),论文中号称 GPT-4 能解决国际数学奥林匹克问题,但实际上,这个问题不是 2022 年国际奥数竞赛的原始问题,而是一个简化版本,并且他们测试了几百道国际奥数竞赛问题,成功率只有1%,论文里的这个是精心挑选的恰巧能做对的。 并且陶哲轩提到了基于大语言模型的一些改进的方案: 比如 CoT(Chain of Thought),也就是 LLM 做简单的算术运算都做不对,但是如果让它一步步解释,可能就对了。还可以教 AI 一些解题技巧,比如尝试简单的例子,反证法,尝试逐步证明等。 比如让模型和编程语言或者工具连接,将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证,并且迭代的进行修正和验证,直到得到正确的结果,这可以提升大语言模型生成的效果。 即使借助这些手段,大语言模型还远远不能解决大多数数学问题,更不用说数学研究问题了! 当然陶哲轩也没太过打击大家对于 AI 的信心,表示我们在 AI 上还是在不断的取得进展,还提到了他日常是怎么用 AI 的,比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题,我尝试了几种方法,但都无法解决。于是,我尝试询问 GPT,你建议我使用什么其他方法来解决这个问题?GPT 给我提供了 10 种可能的方法,其中有 5 种我已经尝试过,或者明显没有帮助。的确,有几种方法并不实用。但其中有一种我还没尝试过的方法,那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时,我意识到这就是我漏掉的正确方法。所以,将 GPT 视为一个交流伙伴,它确实具有一定的用处。 还有使用 GitHub Copilot 帮他写代码,让它自动生成下一步的证明结果,Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具,你只需要写下一半的证明,它就会尝试猜测接下来的内容。大概有 20% 的情况下,它能猜到接近正确的答案。然后你就可以说,我接受这个答案。好的,那么在这种情况下,我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行,尽管你可能看不清楚,却真的解决了这个问题。所以,你不能盲目接受它的输入,因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解,这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行,它们就能自动完成。现在已经有了这样的实验,即通过迭代地让 AI 提供证明,然后让编译器进行反馈,如果编译出错,就把错误信息反馈给 AI。通过这种方法,我们开始能够验证四五步长的证明。当然,一个大型的证明可能需要数万行。所以,我们还没有达到能够立即得到一个正式证明的程度。但是,这已经是一个相当有用的工具。 对于大家关心的问题: AI 在数学领域现在到了哪一个阶段?是否未来几年利用 AI 能直接解决数学问题? 陶哲轩也给出了他的看法: > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题,你可以定制专门的 AI 来处理一小部分问题。即便如此,它们也不是完全可靠的,但还是有用的。不过至少在接下来的几年里,它们基本上将是非常有用的辅助工具,超越了我们已经熟悉的暴力计算辅助。 他还提到了一些可能的 AI 能在数学领域提供帮助的方向: - AI 能够非常好地生成有价值的猜想 > 比如,我们已经看到了关于结理论的例子,它们已经可以推测出两个不同的统计量之间的关系。因此,我们希望能够创建大量的数据集,输入到 AI 中,它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点,部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在,因为证明定理是如此繁琐和艰难的过程,我们一次只能证明一个定理,如果你效率很高,可能一次能证明两三个。但是有了 AI,你可以设想一下未来的情况,我们不是试图解决一个问题,而是处理一类类似的1000个问题,然后告诉AI,尝试用这个方法解决这 1000 个问题,然后报告结果,哦,我能用这种技术解决 35% 的问题。那么另一种技术呢?我能解决这个百分比的问题。或者如果结合这些方法,又能解决多少问题?你可以开始探索问题的空间,而不是一个接一个地解决问题。这是你现在根本无法做到的事情,或者是你需要几十年时间,通过数十篇论文慢慢搞清楚各种技术能做什么,不能做什么。但是有了这些工具,你真的可以开始做规模前所未有的数学研究。所以,未来将会非常令人兴奋。 演讲环节结束前的最后一句话说的特别好: > 我们仍然会以传统方式证明定理。事实上,我们必须这样做,因为如果我们自己都不知道如何做这些事情,就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。 这恰恰也是我们现在使用 AI 辅助编程的问题:如果我们自己都不知道如何构建软件,就很难引导好 AI 帮助我们生成高质量的代码。 尽管 AI 在数学和编程领域变得越来越有用,但人类的洞察力和创造力仍然是创作价值的关键。 原始 YT 视频:

宝玉

300,591 görüntüleme • 1 yıl önce

今早刷到一条新闻的时候,我愣了几秒。 去年那个曾经风靡一时、 全网都在找邀请码、朋友圈一夜刷屏的 Manus, 被 Meta 收购了。 而且不是象征性的那种。 传闻中的收购价,高达 20 亿美元。 一瞬间,脑子里只有一句话: 原来那一波热闹,真的不是泡沫。 如果你去年混过 AI 圈,一定记得 Manus。 那种典型的产品—— 不是“炫技 demo”, 而是你一用就发现不对劲的那种工具。 它不是只回答问题, 而是能自己拆任务、查资料、写东西、跑流程。 你给它一个目标,它自己往下干。 后来大家才慢慢意识到: 哦,这是 Agent。 Manus 真正厉害的地方,并不是“它能干什么”, 而是它敢把“人”的工作流直接吃掉。 不是辅助你, 不是提高效率, 而是—— “这事我来做,你别管了。” 在当时那一堆还停留在 ChatBot、Copilot 阶段的产品里, Manus 是极少数 真的在往“替代”走的团队。 这也是为什么它能在极短时间内: 用户暴涨 付费率不低 在海外圈层迅速传播 Agent 这个词后来被讲烂了, 但Manus 是最早让普通人真正“感受到 Agent 的”那一批。 更讽刺的是另一件事。 去年,字节跳动曾经试图以 3000 万美元左右收购 Manus。 这事在圈子里不是秘密。 当时很多人的第一反应是: “挺高了吧?” “早点卖也正常。” 但结果你现在也看到了: 没卖。 一年后, 直接卖给 Meta,估值翻了近百倍。 你说这是运气? 不完全是。 这是对一件事的判断差异: Agent 会不会成为下一代核心计算入口。 很多人只盯着“20 亿美元”这个数字。 但更值得琢磨的,其实是另一条线索: Manus 后来把公司主体放在了新加坡。 这一步,太关键了。 不是因为新加坡有什么魔法, 而是因为: 面向全球用户 面向美元资本 面向 Meta、OpenAI、Google 这种买家 你必须站在“他们习惯的坐标系里”。 产品是全球的, 那公司也得是全球的。 这也引出了一个让很多中国 AI 创业者心里不舒服的问题: 为什么这么多 AI 初创, 最后都很难在中国大陆生根? 不是技术不行, 不是人不行, 甚至也不完全是钱的问题。 而是一个更现实的东西: “长大以后怎么办?” 能不能无摩擦地服务全球用户 能不能被全球巨头并购 能不能走一条清晰、可预期的退出路径 这些问题, 对早期创业者来说, 比模型参数重要得多。 再回到 Meta。 你要明白一件事: Meta 不是“看热闹的投资人”。 它现在最缺的, 不是模型, 不是算力, 而是能真正跑在模型之上的 Agent 层。 Chat 是入口, 但 Agent 才是生产力。 而 Manus, 恰好站在这个位置上。 所以这次收购, 与其说是“买一家创业公司”, 不如说是—— 直接买了一条通往下一代产品形态的快车道。 最后说句很人话的。 很多人会把这件事解读成: “中国 AI 又一次被美国收走了果实”。 也有人会说: “这是中国创业者的成功”。 我更愿意用一个不那么宏大的视角看它: 这是一个创业者,在关键时刻, 没有把自己卖便宜的故事。 而在 AI 这个时代, 这种故事, 会越来越少,也越来越贵。 如果你去年抢过 Manus 的邀请码, 如果你用过 Agent, 如果你正在创业、或者想创业, 你大概能理解这种复杂的情绪。 不是羡慕, 也不是愤怒, 而是一种: “原来世界已经走到这一步了”的感觉。 这条新闻,不只是 Manus 的终点。 它更像是很多人,某种幻想的终点。 也是另一种现实的开始。

比特币橙子Trader

122,891 görüntüleme • 5 ay önce