Loading video...

Video Failed to Load

Go Home

OpenAI没选NVIDIA。 Sam Altman亲手选了AMD,用来做AI推理。 他和苏姿丰一起,从头参与了MI450芯片的设计。 这不是合作,这是共建。 MI450最大优势是啥?推理效率,特别是大模型低功耗推理。 你以为GPU只卷训练?2024之后,比的是谁能推得更省、更快、更稳。 OpenAI已经开始在MI300X运行模型了,MI450只是更激进的延续。 接下来的大模型,不一定长在N卡上。

107,298 views • 9 months ago •via X (Twitter)

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

白宫加密政策主管David Sacks: 四年内AI 大模型能力将增长一百万倍 ! “我认为目前至少在三个关键维度上,进步的速度都是指数级的。” “首先是算法本身。模型每年提升的速度大概是 3-4 倍。” “它们不仅仅是在速度和性能上更快更好,而且将从量变到质变。” “接着是推理模型。” “我们甚至还没有真正进入智能代理时代,但这将是继推理模型之后的下一个重大飞跃。” “在这个领域,我们才刚刚开始(推理算力增加带来的能力增加也将是倍数增长)。” “接下来是芯片。” “根据多种衡量标准,每一代芯片的性能可能比上一代提高 3-4 倍。” “不只是单个芯片在不断进步,他们还在研究如何将这些芯片联网在一起。” “就像 NVL72 系统,它类似于一个机架系统,可以在数据中心级别大幅提升性能。” “计算能力是第三个你会看到基本上呈指数级进步的领域。” “只需要看看数据中心中部署的 GPU 数量。” “当马斯克最初开始训练 Grok 时,我认为他们大概有 10 万块 GPU。现在已经有 30 万块 GPU,而且正朝着百万块 GPU的目标迈进。OpenAI 的数据中心 Stargate 也是同样的情况。” “在接下来的几年中,他们可能会发展到 500 万、1000 万块 GPU。” 1,000,000 倍的增长是怎么得出的: “算法、芯片和数据中心的扩展和改进速度都是每年 3-4 倍。” “也就是说,每两年进步 10 倍。” “很多人没有理解指数级进步的含义:如果每两年提升 10 倍,并不意味着四年后你只是提升 20 倍。” “这实际上意味着提升 100 倍。” “把这些因素相乘:算法、芯片,以及可用于 AI 的原始计算能力。” 100 倍模型 🧠 × 100 倍芯片 💾 × 100 倍计算能力 ⚡️ = 1,000,000 倍的 AI 大模型🤖 “你所谈论的就是 1,000,000 倍的能力增长。” “但这种变革的影响将是绝对巨大的。” “我觉得人们还没有充分认识到这一点,因为他们不了解指数级进步的意义。”

夜谈

25,895 views • 1 year ago

今天好郁闷,发生了一点不愉快的事情!人生第一次为了自己的愚蠢进了叔所! 期待明天的好结果!!! ⸻ AI 的下一关,不在能力,而在可被证明 在模型规模不断被刷新纪录的阶段,有一个问题始终被刻意回避: AI 的结论,是否真的来自它声称的计算过程? Inference Labs 选择从这个问题切入。 他们关注的不是模型性能,而是推理行为本身是否可信、是否可复现、是否可审计。 Proof of Inference 的意义,在于把“我相信模型没问题”变成“模型必须给出证明”。 通过零知识证明,系统可以在不暴露模型结构和参数的前提下,确认一次推理: •确实由指定模型完成 •计算过程未被替换或篡改 •输出结果与真实推理一致 这不是提高透明度,而是引入约束。 在工程层面,DSperse 做的事情同样关键。 它把原本高度定制化、专家依赖的 zkML 开发流程,拆解为可复用组件, 使“可验证 AI”从研究范畴,进入实际应用范畴。 否则,再正确的理念也只能停留在白皮书。 目前,可验证推理在性能上的代价仍然明显, 但这更像早期加密系统的计算成本问题,而不是路线错误。 融资的用途,也正是针对这一层进行系统级优化。 如果说过去的 AI 竞争是“谁能算得更快”, 接下来的竞争,很可能是: 谁的推理能被证明、被追溯、被承担责任。 Inference Labs 所搭建的,不是价值观, 而是一层让 AI 输出进入现实系统所必需的验证基础设施。 #KaitoYap Kaito AI 🌊 #Yap Inference Labs

董小姐

303,504 views • 5 months ago