
AYi
@AYi_AInotes • 49,501 subscribers
大厂组织发展专家 × 心理学硕士(QS30) × AI 实用主义 分享有用的 AI 实践,也分享工具之外的深度认知 AIGC | Prompt Engineering | 商业思维 丨职场丨认知心理学 🐈 喜欢健身,玩游戏,和 4 只猫一起生活和工作
Shorts
Videos

苹果、Intel、AMD、高通, 今晚大概率睡不好了。 统治了 PC 整整 30年的 Wintel 王朝,今天被一个卖显卡的,连桌子一起掀了。 NVIDIA 的 RTX Spark,一块 3nm 的 SoC, 把 ARM CPU、Blackwell GPU、128GB 统一内存焊进同一颗芯片, 塞进 14mm 的超薄本, 本地跑 120B 大模型, 1440p 满帧跑 3A, 拔了电源帧数硬是一格没掉。 但真正让那四家睡不着的,还不只是这些参数。 过去三十年的 PC, 像一群车厂在比谁的排量大, 所有人盯着 CPU 跑分, Intel Inside 就是品质保证,竞争全在同一套规则里打。 NVIDIA 今天开进来一辆电动车, 直接说规则换了, 以后比的是 AI 算力和谁的软件生态更深, 而它那张生态网,叫 CUDA,已经铺了二十年。 这一下,每一家被点到的,都得正面回应: Intel 和 AMD 还能追性能、追制程,追不上的是那二十年攒下的开发者。 苹果 2020 年就用 M 系列证明了 ARM 加统一内存能有多强, 可它把 CUDA 拦在门外, NVIDIA 干脆绕开,在 Windows 这边复刻了一遍, 还多带了苹果永远不肯给的东西, 完整 GPU 生态、3A 游戏、CUDA 全栈。 高通的 Snapdragon X 先跑了一年 Windows on ARM,没有 GPU 生态撑腰,整个故事还只讲了一半,没想到今天这个位置被人抢了 当然,发布会上说的,和真正用起来之间,向来隔着一段距离。 ARM 版 Windows 的兼容层跑老软件掉多少、满载久了降不降频、这套东西最后卖什么价,老黄一个都没交代。 但方向似乎已经钉死了, 过去你买电脑,Intel Inside 是贴在机身上的那张品质标签, 但是往后这张标签,得换人贴了。 NVIDIA 今天卖的不只是一颗芯片,还有下一个三十年 PC 行业的入场券。
AYi744,040 views • 2 days ago

这可能是你这辈子能见到的最顶级的安保力量。 就是这个北京街头刷屏的车队, 拍摄的路人全程在喊卧槽, 一长串黑色重型SUV,警灯闪烁,绵延几百米。 全网都在刷这个场面有多夸张, 但其实90%的人都看错了, 这根本不是特朗普的主车队。 只是整个安保体系里,最不起眼的后勤支援部分。 这次特朗普访华, 7架C-17环球霸王提前飞抵北京, 运来了500多吨物资和全部车辆。 2017年他第一次来,只来了3架。 特勤局直接调动了100-200名精锐特工, 贴身环绕的钻石阵型, 重武装的反突击队, 部署在所有高点的反狙击手, 还有专门的电子战和反无人机小队。 每一辆你看到的Suburban, 都是8英寸厚装甲的移动堡垒, 能扛AK-47和火箭筒, 轮胎打爆了还能高速跑几公里, 自带核生化密封舱和独立空气系统。 以前的安保是保护人, 现在的安保是移动的堡垒。 是一整套能独立运行的作战系统。 这还只是冰山一角, 真正的主车队里,那辆9吨重的The Beast, 连车窗玻璃都打不开, 里面有总统专属血库,氧气,还有一整套武器库。 #特朗普访华 #安保
AYi4,873,253 views • 21 days ago

Damn!老黄这波操作真TMD封神了,竟然复刻了乔布斯的第五口袋, 这是要正式接过乔布斯的接力棒,做定义下一个计算时代人的节奏啊😲 昨晚Computex 2026, 黄仁勋穿着他标志性的黑色皮衣 复刻了乔布斯2005年最经典的"第五口袋"桥段, 从牛仔裤的小表袋里掏出了N1X芯片, 那一刻全场沸腾, 21年前, 乔布斯也是从牛仔裤口袋里掏出了iPod Nano, 说"现在我们知道这个口袋是干嘛的了" 他把1000首歌放进了你的口袋 彻底改变了音乐产业, 21年后 老黄从同一个口袋里掏出了N1X 说"这是人类有史以来最惊人的芯片" 他把整个数据中心放进了你的口袋 即将彻底改变个人计算, 没错这确实是一波对乔布斯的致敬, 但没人看懂老黄背后真正的野心, 这个复刻黄仁勋不是简单的抄作业, 更像是一次权力交接的宣言, 乔布斯定义了个人计算的第一个时代, 而老黄正在定义个人计算的第二个时代, N1X到底有多恐怖? 台积电3nm工艺 20核Arm CPU+6144个CUDA核心Blackwell GPU 128GB统一内存 1 Petaflop AI算力 能本地流畅跑120B参数的大模型, 能同时运行几十个Agent, 能跑所有Windows应用和CUDA生态 功耗只有45-80W, 这意味着什么? 意味着你的下一台电脑, 不再是一个需要你亲手操作的工具 而是一个24小时为你工作的AI员工, 你出门的时候 它在家里帮你写代码、做研究、处理邮件, 你用手机给它发个指令, 它就能在后台完成所有工作, 这回英特尔和AMD肯定都要慌了, 因为他们卖了几十年的CPU, 突然变得不重要了,
AYi140,259 views • 1 day ago

Damn,有点炸裂啊,一颗葡萄用了6660张宏观照片训练3DGS, 模型只有43万个高斯点, 压缩完不到50MB, 但你可以在手机上看它360度旋转, 连果肉里透出来的光都还原了, 更炸的是老哥回复里那句话,有人问底部怎么拍到的,他甩了张gif说“Like this”, 但玩笑归玩笑,真正重要的信息其实都藏在技术参数里: 90个焦点堆栈,每个74张, 全角度覆盖,底部也拍进去了, 半透明物体是3DGS最难搞的测试对象,他偏偏选了最难的那个, 逻辑也很简单:最难的通了,比它简单的任何东西就已经在射程之内了, 我理解这颗葡萄的本质不是炫技,而是一份写在技术参数里的产品化路线图, 下一个被数字化的可能不是葡萄,可以是任何你舍不得让它烂掉的东西 逻辑很简单,如果连葡萄这种最难的都跑通了,比它简单的任何东西,手办、珠宝、人脸、文物,都已经在射程之内, 以前做这种级别的3D数字资产,需要专业扫描仪加建模师加后期手动修,成本和时间劝退绝大多数人, 现在这套流程是,宏观镜头加照片堆,进3DGS自动训练,出来就是20到50MB的可分发模型, 门槛从专业团队降到了一个人加一台相机,这是我觉得真正炸的地方, Dany自己还在开发miqula工具,明显在把这套流程进一步封装成产品, 他用一颗葡萄,相当于给整个行业画了一张产品化路线图。
AYi2,852,424 views • 17 days ago

同样站在 2009 年那个路口,有人只看见一块显卡, 有人看见了往后二十年整个计算的样子。 那年 Nvidia 市值 40 亿,是 Intel 的零头, 所有人都笑黄仁勋不过是个卖游戏配件的。 那时候 Nvidia 市值 40 亿,Intel 1000 亿,差了 25 倍。 他说了句在场没人当回事的话:PC 的杀手应用是 Word 和 Excel,所以串行架构的 CPU 是王者,但未来电脑要处理的不是打字和算数,是图像、3D 虚拟世界、艺术表达。 这些东西全是并行任务,CPU 搞不定。 17 年后,Nvidia 5 万亿,Intel 五千多亿,25 倍的劣势,变成了接近 10 倍的反超。 但我看了两遍才发现,这条视频最狠的不是老黄预测对了 AI,他 2009 年根本没提 AI。 他预测对的是另一件事:异构计算的必然性。 CPU 管串行,GPU 管并行,两个都要,但 GPU 的相关性在上升,这个判断后来成了现代计算的铁律——手机 SoC、AI PC、数据中心,全是这个逻辑。 而且他在 2005-2006 年就把 CUDA 押上去了,一个显卡公司搞通用计算平台,投资人觉得他疯了。 打个比方,就像在一片荒地上挖了口井,当年所有人都在笑,自来水不香吗你挖什么井,但十几年后城市盖起来了,才发现只有你这口井挖到了最深的蓄水层——所有房子的水管都只能接你这一口。 CUDA 就是这口井,黄仁勋挖了二十年。 他没去追 Intel 的赛道,默默在在修自己的路,从图形到科学计算到深度学习到生成式 AI 到物理世界模拟——每一步迁移,这条路都在变宽,十七年后,所有的车都拐上了他修的这条路。 远见从来不稀缺,酒桌上人人都有。 稀缺的是认准之后,肯花十年时间,把一句没人信的判断,亲手浇筑成一条别人绕不过去的护城河。 今天这个路口也站满了人,有人在盯更强的模型,有人在看下一个计算平台长在哪。 我们最该盯的其实不是市值曲线,应该是创始人嘴里那个词,黄仁勋在访谈里反复说 relevance——他不纠结谁更大,只纠结自己做的事跟未来还相关吗。 我觉得这句话比任何技术判断都值钱。 2009 年人人都说 Nvidia 就是个做显卡的,跟今天有人说某家 AI 公司就是个做 XX 的一模一样。 但真正的 alpha,永远藏在对工作负载演进方向的预判里。
AYi112,583 views • 1 day ago

Damn,这个必须卧槽一下了,Karpathy 的 CLAUDE.md 只有 65 行, 居然能把 AI 编程准确率从 65% 拉到 94%, 以22 万星标登顶 GitHub 趋势榜,而且绝大多数开发者还没读过, 里面没有一行奇技淫巧,4 条规则全是同一个方向: → 先想清楚再写代码 陈述假设,不确定就问,杜绝猜测 → 从最简方案入手 只写能解决问题的最少代码,不加任何多余抽象 → 像手术一样精准修改 不碰与需求无关的代码,每行改动都对应明确要求 → 以目标驱动执行 写第一行代码前,把模糊指令转化为可验证的成功标准 65 行,4 条规则,每一条都在对抗开发者“先写再说”的本能, 本质上是把慢下来这件事变成硬规则, 趁别人还没保存,赶紧先存好 👇
AYi1,059,651 views • 12 days ago

Claude团队的工程师,已经彻底抛弃Markdown了。 不是Markdown不好用, 是AI变得太快,它已经跟不上了。 以前AI写10行笔记,Markdown刚刚好, 现在AI能一次性输出1000行计划、复杂流程图、完整代码审查, 密密麻麻的纯文字墙谁有耐心看得完? 作者自己都说,他从来没完整读完过100行以上的AI生成MD文件。 更要命的是:现在都是AI写,我们只看不改。 Markdown最大的优点“易手动编辑”,现在已经彻底没用了。 而HTML,才是AI时代真正的沟通语言, 它能做到的事,Markdown想都不敢想: • 直接生成带颜色的表格、SVG流程图、可点击的原型 • 加滑块调参数、拖拽排序任务、实时预览Prompt效果 • 改完一键导出成代码或Prompt,喂回给AI继续迭代 • 发个链接别人点开就能看,不用下载任何工具 作者直接放出了20个现成示例: 从代码审查的彩色diff, 到可拖拽的任务看板, 从动画参数调试器, 到一键生成的幻灯片。 每一个都是能直接用的生产力工具。 最爽的三个用法,现在就能抄: 1. 代码审查:让AI把PR生成带注释的彩色diff+模块调用图 2. 做计划:生成带时间线、风险表、流程图的交互式项目页 3. 临时工具:让AI写一个Prompt调参器,改完直接复制结果 当然它也有缺点: 多花一点token,生成时间长2-4倍,版本控制不如MD干净。 但作者说:体验提升了10倍,这些代价完全值得。 本质上不是格式之争,而是人机协作方式的升级。 因为Markdown是给人写给人看的, 而HTML是给AI写给人用的。 随着当AI越来越聪明,我们需要的不再是文字墙,而是能互动、能操作、能思考的界面。 现在打开Claude,输入“帮我做一个HTML文件……”,你会打开一个全新的世界。
AYi1,389,205 views • 26 days ago

17岁的Kai Trump(特朗普孙女),一句话戳破了整个美国教育系统最虚伪的谎言。 她在播客里说,现在高中所有人都在用ChatGPT写论文,老师都气炸了。 但她问,为什么不呢?学生就该用世界给你的资源。 学校不该禁止它,该教大家怎么把它变成自己的优势。 最讽刺的是,她自己GPA4.0,是实打实的优等生。 所以这根本不是什么作弊的问题,纯粹是代际认知的鸿沟。 老一辈把手写论文、死记硬背当成“真学习”。 但对凯这一代AI原住民来说,ChatGPT就像他们小时候的计算器、图书馆、Google一样,是默认的基础设施。 当年禁止学生用计算器学乘法的老师,现在看来可笑至极。 今天禁止学生用ChatGPT写论文的老师,十年后也会是同一个笑话。 其实真正危险的从来都不是AI, 是教育系统一边假装AI不存在, 一边逼着学生偷偷摸摸用它。 结果就是,会用的学生偷偷把效率拉满,不会用的还在熬夜抄书。 没有人教他们怎么提出高质量的问题,怎么验证AI的幻觉,怎么把AI的输出变成自己的深度洞见。 而这些,才是未来10年最值钱的能力。 我相信AI不会让学生变笨, 它只会放大差距。 会用AI的人,一个人能顶以前一个团队。 不会用AI的人,会被时代甩得连尾灯都看不见。 我们的教育还在教学生怎么在没有AI的世界里生存, 但他们未来要面对的,是一个AI无处不在的世界。 所以这种拒绝变革的教育,最终只会培养出一批“在AI时代不会用AI”的人。 这才是对下一代未来最大的作弊。
AYi692,437 views • 1 month ago

卧槽,6个月→15天! 森马用AI把整个服装行业的底裤都扒了。 真的兄弟们,看完森马的 AI 落地,我直接懵了, 光2025年,AI就给森马带来几个亿的确收回款, 节省视觉、营销、样衣研发等成本数千万, 上新周期从 6 个月,直接压到了 15 天。 这才是真正的AI落地啊,能对业务带来增量价值, 而不是瞎折腾消耗token重复造轮子! 很多人以为传统企业用 AI,就是拍个图写个文案, 没想到森马直接把 AI 做成了全链路基础设施, 覆盖供应链、库存、直播、运营、物流、客服、财务。 整整 400 多个场景。 连整个经营逻辑都重构了, 最狠的是 AIGC 视觉, 以前拍一组模特图要等两个月, 改个背景换个动作,还要再等两个月, 现在 AI 几分钟出图, 效果不输实拍,成本几乎为零, 所有款式全量覆盖,不用再只赌几个爆款, 传统上新是串行的, 一个环节等一个环节, 现在 AI 介入后全并行推进, 不用空等,不用排队, 以上这些都是 2025 年已经跑通的真实案例, 一年带来几亿回款, 省了几千万的成本。 通过森马这个案例让我们看到了, 其实AI 不只是替代人工干活, 还能挖出那些我们根本想不到的隐性成本, 把以前不可能的事,变成日常。 我感觉以后所有传统企业,都会被逼着走这条路啊。 视频大家收好,非常值得收藏和学习! #森马 #AI落地 #服装行业 #AIGC #企业数字化
AYi474,083 views • 23 days ago
0:53
Sensitive content
This media may contain sensitive content.

卧槽!SpaceX 这个构想直接给我看傻了🤯 在地球和月球之间拉一张光网, 近地轨道的Starlink,对接月球轨道的中继星座, 以后月球上的人刷X、打视频电话,和地球没有任何延迟, 我尼玛,这哪是商业公司干的事啊, 简直就是在给人类铺星际互联网啊, Elon Musk I want to say, 最近发生的事,对我来说最震撼的不是是火箭和这个月球星链, 是你总在所有人还在争论能不能去月球的时候,已经在铺去了之后怎么生活的路, 谢谢你总在提醒我们,人类的边界从来不是地球, 等以后有人在月球上刷到这条推的时候,我想他一定会记得今天这个视频的,Always respect,地表最帅最强的男人🫡
AYi154,853 views • 10 days ago

这可能是今年AI圈最清醒的一条推文, Yann LeCun 是当今 AI 领域最有影响力的科学家之一,深度学习三大教父之一,2018 年图灵奖获得者, 他直接怼了Anthropic CEO Dario的著名言论, Dario说未来一到五年,一半的科技法律咨询金融岗位会被彻底干掉。 LeCun说你错了,而且不仅Dario错了,所有的AI实验室CEO 和一众大佬包括Sam Altman,Yoshua Bengio,Geoff Hinton,也包括他自己。 他说在技术革命如何影响就业这个问题上,全都是外行,别听我们瞎BB。 去听真正研究了几十年这个问题的劳动经济学家。 最狠的其实是这一点,他没跟Dario争论AI到底有多强,直接掀了桌子说,我们这群人,根本就没有资格讨论这个话题。 AI研究者只懂技术能干什么,他们不懂企业的组织流程,不懂法律合规的障碍,不懂市场的供需关系,更不懂人类社会复杂的运行逻辑。 那些被LeCun点名的经济学家,研究了过去两百年所有的技术革命,他们得出的结论是整份工作不会消失,工作里的任务会被重构。 ATM发明的时候,所有人都以为银行柜员要失业,结果柜员的数量反而增加了,因为他们从数钱的人,变成了卖理财做服务的人。 AI现在也一样,它会干掉大量重复的可预测的任务,但同时也会创造出大量新的任务。 短期的取代效应确实存在,尤其是入门级的白领岗位,但长期的生产力效应和新岗位创造效应,往往要强得多。 还有一个所有人都忽略的事实,AI能干一件事,和公司真的会用AI把人换掉。 这中间至少差两到五年,数据管道,组织架构,员工培训,法律风险。 每一个都是巨大的障碍。 我觉得 LeCun其实是在反对AI圈泛滥的末日营销,很多AI大佬喜欢用失业恐慌来博眼球,要么为了融资,要么为了呼吁监管,要么为了显得自己的产品很厉害。 但这种恐慌会误导公众,会误导政策,所以咱们也别再被那些五年后一半人失业的言论吓住了,真实的世界从来都不是非黑即白的,它是缓慢的,混乱的,充满了各种意外和机会的。 也别总担心被AI取代,有那个时间多想想怎么用AI让自己变得更值钱😁 Dario被 fox 采访的内容我做了中英双语字幕供大家参考。
AYi598,792 views • 1 month ago

后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲Elephant Alpha的推不是爆了吗,很多兄弟在评论区猜背后是谁,现在谜底揭晓了。 蚂蚁集团AGI团队(Ant Ling)的Ling-2.6-flash, 猜中国产大厂马甲的兄弟,你赢了。 说实话我看到架构数字那一刻,上周用它的所有体感全部对上了。 总参数104B,每次推理真正激活的只有7.4B,激活率7%,256个专家里每次只叫醒一小撮干活,其他的继续睡觉😂 这就是为啥上周我说它token消耗肉眼可见往下掉——100块钱的模型,每次推理只烧7块钱的算力,跑出了100块钱的智能,这可不是玄学啊,属于架构层面就在为效率让路。 再叠Linear Attention把传统Transformer的二次复杂度压下来,再加Multi-Token Prediction做推理加速,三件事一起上,FP8单卡341 tokens/s,Artificial Analysis实测输出215 tokens/s,和gpt-oss-120B并列第一梯队。 说实话,速度方面上周体验之后我早就服了,这回真正让我愣住的是跑分。 Artificial Analysis跑完全量评测,Ling-2.6-flash只烧了大约15M tokens,Nemotron-3-Super烧了接近10倍,Intelligence Score却拿到26,和Gemini 2.5 Flash同梯队。 都便宜到这个份上,大家下意识觉得肯定哪里凑合了,但agentic跑分直接打脸,SWE-bench Verified 62,BFCL-V4 67,TAU2-Telecom 93.86,SWE-bench测的是真实代码仓库里定位Bug加生成补丁,BFCL测的是函数调用准确性,全是硬场景,不是那种学术榜单刷分。 上周我搭那个串三个工具的小Agent跑得贼利索,现在明白了,这模型从训练阶段就是奔着Agent去的,别人做Agent是改装车,它是原厂出的Agent专用机。 所以我上周说的那套玩法现在有了官方解释——Claude管架构和规划调一次,Ling-2.6-flash管分步执行跑一百次,成本砍到十分之一,不是我瞎搭的野路子,是这个模型本来就为这个场景而生。 蚂蚁的产品线逻辑也清晰,Ling做基础,Ring做推理,Ming做多模态,这次先以stealth身份在OpenRouter和Kilo上免费放出来收集反馈,后面会开源,再推商用版LingDT,还会出BF16/FP8/INT4量化版。 路径就是社区验证→开源扩散→商业落地,对开发者来说,现在就是白嫖窗口期,免费还剩几天。 用了这段时间我给它的定位很明确,它是目前最适合一直开着的模型之一,Agent持续跑、代码补全随时触发、长文档批量处理,越高频越省钱,账单每个月都会替它说话。 但极端复杂的推理链、需要反复自我纠错的长思考任务,你可能还是得上重型推理模型,它的sweet spot是够聪明+极快+极省那个三角区,日常80%的活它接得住,接得还比大多数模型便宜。 所以说2026年看模型不能再盯着单一智能分了,当Agent从偶尔问一下变成24小时不间断跑的基础设施,每个token的有效产出就是新的胜负手,Ling-2.6-flash是目前这个方向上跑得最激进、也交出实际成绩单的选手之一。 上周说过的话,这周全部兑现,挺爽的🌚 #ElephantAlpha #Ling2Flash #AntAGI #Agent #大模型
阿绎 AYi446,331 views • 1 month ago

孙哥今天这条帖, 才是真正的顶级情绪管理大师。 半年前他喊, 短期缺芯片,长期缺能源, 永远缺存储, 现在闪迪涨了35倍, HBM订单排到了2028年, 就在所有人都在拍大腿喊踏空的时候, 他说,别担心,AI时代才刚刚开始,永远都有机会, damn,这哪里是安慰啊, 简直就是把所有人的短期焦虑, 直接升级成了对十年超级周期的信仰, 孙哥说的我完全认同, 我们现在才刚刚站在AI时代的iPhone 4时刻, 想想当年iPhone 4发布的时候, 所有人都觉得移动互联网到头了, 结果后面才是微信、短视频、直播、电商的十年大爆发, 今天的大模型也一样, 只是AI时代的开胃菜而已, 真正的多模态、AI Agent、具身智能、机器人时代, 对存储、算力、能源的需求, 会是今天的几百上千倍, 我觉得未来市场最残酷的地方在于, 它会先把未来十年的想象力, 打包卖给今天最焦虑的人, 第一波冲进去追高的, 往往都是给别人提前结账的人, 因为市场的机会从来都不是先到先得的, 往往都是持续参与者得, 错过一波不是惩罚,而是一种筛选, 真正能吃到红利的人, 也从来都不是今天最急着追高的人, 是那些把AI当成新操作系统, 每天用它提升自己十倍效率的人, 所以兄弟们, 别再为错过存储这波捶胸顿足了, 存储只是燃料, Agent才是真正的引擎, AI的大幕也才刚刚拉开, 机会从来不等人, 但它永远给持续动手的人留着位置~ #AI #投资 #孙宇晨
AYi210,639 views • 21 days ago

说个最近最打动我的AI产品故事, 一个中国爸爸为女儿做了个单词App😭 2022年夏天,Ace Lee每天接女儿放学回家,女儿总会指着路边的东西问英文名字。 有一次她指着一个路牌问,他答不上来,打开翻译App,一个冰冷的机械音蹦了出来。 女儿只是轻轻说了一句噢。 那一刻他意识到,传统翻译App缺少了最重要的东西,就是温度。 于是他做了CapWords。 用相机对准任何东西,AI会自动识别物体,去掉背景,生成一个可爱的互动单词贴纸。 支持中文英文日文韩文等9种语言,还有真人发音和智能复习系统。 这个北京3人小团队的作品,直接拿下了2025年Apple设计奖, 是当年乐趣横生类别唯一的获奖App。 它最厉害的三个地方: 1. 识别准确率极高,几乎所有日常物体都能识别 2. 每个贴纸都有丝滑的动画和对应的真实音效 3. 完全没有广告,也没有内购订阅 我所以我觉得一款好的 AI产品一定不是为了融资做的, 核心是为了解决一个自己真正在乎的问题。 #AI工具 #语言学习 #Apple设计奖
AYi170,117 views • 18 days ago

说个暴论,AI界的iPhone时刻可能就要到来了。 OpenRouter上最近杀出来一个匿名模型,把所有Agent开发者都打懵了。 它叫Elephant Alpha,没有发布会,没有营销通稿,连开发者是谁都不知道😂 纯靠用户口口相传,一周就冲到了平台日活前十,token使用量暴增377%。 我自己测了三天,结论是这他么才是2026年AI该有的样啊! 速度快到离谱,不是那种一个字一个字蹦的慢输出,是你刚敲完回车,一整段带注释的代码直接完整输出,体感和Grok 4 Fast差不多,但代码质量高一个档次。 最夸张的是智效比,同一份任务,完全相同的输出质量,它的token消耗是Claude Opus的一半,GPT-5.4的三分之一,账单是真的肉眼可见地往下掉。 它不是啥全能思考型模型,更像一个纯粹到极致的执行机器,跨十几个文件找Bug,256K上下文稳如狗,一点不丢引用。 几十页合同直接转成结构化的条款表,会议记录转待办,群聊转摘要,网页转初稿,所有你不想干的脏活累活,它干得又快又好。 唯一要注意的是它不会帮你脑补,指令越清晰,约束越明确,输出质量越爆炸,模糊的需求很容易得到平庸的结果,也不适合复杂的多步长链规划,知识时效性需要自己注入上下文。 最反直觉的地方来了,以前我们总觉得,什么活儿都得用最好的旗舰模型 ,但实际上你每天80%的工作,根本不需要Claude或者GPT的深度思考能力,你只是需要一个东西,能准确、快速、便宜地把事做完。 现在OpenClaw和Hermes社区已经形成了标准玩法,Claude管整体规划和架构设计,只调用一次。 Elephant管分步执行、局部修复、批量生成,跑一百次,整体效率翻三倍,成本直接砍到原来的十分之一甚至更低。 这才是Agent经济真正的突破口啊,以前Agent跑不起来,不是因为不够聪明,是调用一次太贵,延迟太高😟 当执行层的成本趋近于零的时候,所有自动化才真正变得可行。 更有意思的是匿名模型这个趋势,以后最好用的模型,可能都不是大厂发布会吹的那些。 OpenRouter的盲测机制,让模型纯靠真实使用数据说话,没有品牌溢价,没有营销滤镜,谁好用谁就会被用户用脚投票选出来。 社区普遍猜测这是某国产大厂的马甲在全球盲测,也侧面说明中国AI在推理优化赛道已经跑在了前面。 现在它还在盲测期,完全免费,256K上下文,32K输出,函数调用,结构化输出,全开放。 OpenRouter和Kilo Code上都能用,建议兄弟们把所有日常重复任务都切过去,把省下来的预算,留给真正需要深度推理的场景。 Elephant Alpha 是不是下一个ChatGPT 呢,我觉得不是,它更像是AI从偶尔炫技变成每天省事省钱的基础设施。 所以别再用大炮打蚊子了,模型分层才是2026年AI玩家的核心竞争力啊, 咱们工作流里有哪些活儿,其实根本不需要用旗舰模型🌚 #AI #大模型 #OpenRouter #ElephantAlpha #开发者 #Agent
AYi422,876 views • 1 month ago

图灵奖获得者、 AI 三大教父之一的 LeCun在达沃斯的发言,算是把整个硅谷的遮羞布扯了。 他说现在整个行业都被LLM彻底洗脑了,所有人都在同一条赛道上互相挖人,谁敢偏离主流谁就被骂落后。 这也是他离开Meta的真正原因,连Meta都已经LLM-pilled,他不想再跟风了。 最扎心的一句话是:纯生成式架构,不管是LLM、VLM还是VLA,永远造不出哪怕猫级的智能体。 因为它们本质上只是下一个token预测机,只能在文字和像素的空间里做统计关联,从来没有真正理解过这个世界的因果。 它们不会预测行动的后果,不会真正的规划,更没有常识。 当然,我不是说LLM没用,短期来看,scaling LLM+微调+工具调用,已经能吃掉80%的白领工作,硅谷所有人往这里冲,也算是完全理性,毕竟钱和机会就在这里。 但长期来看,这是一条有天花板的路。因为你永远不可能在文字地图上,开出一辆真正的车。 机器人、具身智能、长期自主代理、真正的科学发现,这些坎,纯LLM永远跨不过去。 LeCun说,真正的智能必须有世界模型。就是说给定当前的状态和你要做的动作,你要能准确预测下一秒世界会变成什么样。不是简单的像素级的生成,还需要对物理规律和因果关系的抽象建模。 最近Figure、特斯拉、谷歌的机器人项目,其实都在偷偷补这一课,只是没人愿意公开说,LLM不是万能地基。 我理解未来真正的智能,一定是混合栈,LLM负责语言交互和符号推理,世界模型负责因果预测和长期规划,执行层负责把计划变成动作。 LeCun从来没说过要抛弃LLM,他只是反对把LLM当成一切的答案。 硅谷现在最可怕的问题不是卷,是所有人都在同一条赛道上卷得太狠,以至于忘了终点其实根本不在这条赛道上。 世界模型这道坎,迟早要跨。 而谁先跨过去,谁就是下一个时代的赢家。 #YannLeCun #世界模型 #AGI #大模型 #具身智能
AYi335,726 views • 1 month ago

喵的太魔幻了,有点 Claude 干翻 Google 的感觉😂 这个程序员老哥 Tom Turney只用7天,就把谷歌砸翻全球内存股的十亿级算法,干成了比官方承诺还快的开源实现, 谷歌只发了颠覆性的KV缓存压缩论文,半行代码都没放出来, Tom Turney啃完论文里的数学公式,打开终端靠着Claude辅助, 7天就走完了大厂几个月的路, 前三天写完核心算法, 搭好141个测试用例, 跑通Python原型, 中间两天直接移植到llama.cpp, 写完Metal GPU内核, 最后两天疯狂优化, 把推理速度从739 tok/s干到了2747 tok/s, 纯工程优化就实现了3.7倍的提速, 他还在谷歌的方案上, 加了三项自己的研究创新, 长上下文跳过90%的value解压, 非对称K/V压缩保留key精度狠压value,老token自动降低精度, 最终成果是35B大模型,在普通MacBook上就能流畅跑,KV缓存直接压缩4.6倍,开源仓库上线一周就拿到613个星标,而谷歌到现在, 都没放出自己的官方代码, 说实话,这才是2026年最真实的写照,一个普通人加AI,就能把大厂攥在手里的核心技术,直接干成人人能用的开源工具,真的牛逼🤙 github 地址评论区自取👇
AYi517,596 views • 2 months ago