Video yükleniyor...

Video Yüklenemedi

Bu video yüklenirken bir sorun oluştu. Bu geçici bir ağ sorunundan kaynaklanıyor olabilir veya video kullanılamıyor olabilir.

Ana Sayfaya Dön

昨天发了一个视频，看到评论里有人问：你都在用 Claude Code 了，为什么还要用国内的 Coding Plan？对我来说，这不是一个二选一的问题，而是一个补充题。大家都知道御三家的硬实力更强，这点没什么好争议的。但很多日常场景里，国产模型其实已经能在速度、质量、成本之间取得一个不错的平衡。比如文本处理、资料整理、基础 coding、简单 agent 任务，这类占日常 80% 的工作，很多时候并不一定非要上最贵的模型。对大多数中国用户来说，国产模型更顺手，速度也够，价格还低不少。还有一个经常被忽略的点，其实是处理速度。我自己实测下来，国内这些模型在一些简单任务上，接口响应和首字速度都很快。像翻译、语音输入后的文本修正、基础润色、简单改写这类高频小任务，用起来其实很舒服。你并不需要每一次都把最贵、最强的模型拉出来跑一遍。另外我觉得，现在国内头部几家 AI 厂商，已经不是“能不能做”的问题了。无论是阿里还是字节，一方面有足够的算力和基础设施，另一方面本身也有持续做模型研发和产品迭代的能力。所以在很多高频、日常、成本敏感的场景里，把国产模型纳入自己的工具链，本来就是很自然的事。所以我现在的看法一直都不是“国产替代”或者“二选一”，而是按场景分工：复杂、高价值任务交给最强模型；大量日常、重复、成本敏感的任务，用国产模型做补充，我觉得这反而是更现实、也更科学的用法。

luolei

61,051 subscribers

32,330 görüntüleme • 2 ay önce •via X (Twitter)

Anya Rossi• Live Now

Private livecam show

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

100块的AI，如何帮我接单月赚12万？这次做这个项目给我的感受是国产模型真的能用了！其实我一直都是用最好的模型，Claude 4.5 + Claude Code也一直是我的AI编程主力，但真的被封麻了。每天重新搞Claude的时间都有一两个小时，这次用GLM4.6来平替效果还真可以。虽然它下午高峰期时不时会卡，而且偶尔指令遵循确实比GPT-5差不少，可90%的开发任务都还不错，返工率也可以接受。我现在的最好的实践就是，保留20美金的Cursor用顶级模型，再来个GLM4.6干活，很香！

100块的AI，如何帮我接单月赚12万？这次做这个项目给我的感受是国产模型真的能用了！其实我一直都是用最好的模型，Claude 4.5 + Claude Code也一直是我的AI编程主力，但真的被封麻了。每天重新搞Claude的时间都有一两个小时，这次用GLM4.6来平替效果还真可以。虽然它下午高峰期时不时会卡，而且偶尔指令遵循确实比GPT-5差不少，可90%的开发任务都还不错，返工率也可以接受。我现在的最好的实践就是，保留20美金的Cursor用顶级模型，再来个GLM4.6干活，很香！

Yihui

74,834 görüntüleme • 7 ay önce

国产最新的多模态模型来了！！前两周我刚体验过国产的阶跃星辰大模型，没想到这么快他们的新模型 Step 3.7 Flash 就出了。现在大模型一发布必卷 benchmark 分数，但真正做 Agent 的人都清楚：跑分高 ≠ 能把活干完。所以这次阶跃星辰的新模型 Step 3.7 Flash 它再不追求单点最聪明、也不只是单次最快，而是主打“生产任务端到端执行效率”。一个真实的 Agent 任务从来不是一次问答，而是规划 → 搜索 → 工具调用 → 代码生成 → 多模态理解 → 反复校验的完整闭环，Step 3.7 Flash 这次升级的重点是整条链路的效率，而不是某个孤立指标。提几个我觉得挺务实的点： 1. 原生多模态模型：它可以直接处理 UI 截图、图表、仪表盘、文档，原生读懂并转成结构化输出和可执行步骤，不需要像一些模型那样外挂视觉理解 MCP，而且现在多模态是顶级模型的标配。 2. 推理加入搜索和视觉检索：网页搜索、图像搜索、视觉验证、多源信息比对，让 Agent 在开放任务里边查边验证边行动，而不是事后再接个外部工具。 3. 198B MoE、约 11B 激活参数，最高 400 TPS：稀疏激活 + 这个速度，意味着高频交互、多步工作流、反复工具调用的场景下，单位任务的成本和延迟都压得很低——快和省是一起来的。 4. 开源、可部署：生产环境要的不只是 API，还有透明度、可控性和部署灵活性。如果你在做 AI Agent、coding 工作流、搜索类应用或多模态系统，值得用 StepFun 试试这款新模型的能力。想看更进阶的平台能力，可以了解 Step Plan。海外平台：国内平台：

国产最新的多模态模型来了！！前两周我刚体验过国产的阶跃星辰大模型，没想到这么快他们的新模型 Step 3.7 Flash 就出了。现在大模型一发布必卷 benchmark 分数，但真正做 Agent 的人都清楚：跑分高 ≠ 能把活干完。所以这次阶跃星辰的新模型 Step 3.7 Flash 它再不追求单点最聪明、也不只是单次最快，而是主打“生产任务端到端执行效率”。一个真实的 Agent 任务从来不是一次问答，而是规划 → 搜索 → 工具调用 → 代码生成 → 多模态理解 → 反复校验的完整闭环，Step 3.7 Flash 这次升级的重点是整条链路的效率，而不是某个孤立指标。提几个我觉得挺务实的点： 1. 原生多模态模型：它可以直接处理 UI 截图、图表、仪表盘、文档，原生读懂并转成结构化输出和可执行步骤，不需要像一些模型那样外挂视觉理解 MCP，而且现在多模态是顶级模型的标配。 2. 推理加入搜索和视觉检索：网页搜索、图像搜索、视觉验证、多源信息比对，让 Agent 在开放任务里边查边验证边行动，而不是事后再接个外部工具。 3. 198B MoE、约 11B 激活参数，最高 400 TPS：稀疏激活 + 这个速度，意味着高频交互、多步工作流、反复工具调用的场景下，单位任务的成本和延迟都压得很低——快和省是一起来的。 4. 开源、可部署：生产环境要的不只是 API，还有透明度、可控性和部署灵活性。如果你在做 AI Agent、coding 工作流、搜索类应用或多模态系统，值得用 StepFun 试试这款新模型的能力。想看更进阶的平台能力，可以了解 Step Plan。海外平台：国内平台：

耳朵

12,058 görüntüleme • 21 gün önce

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

歸藏(guizang.ai)

46,883 görüntüleme • 1 ay önce

Openclaw开发者Peter Steinberger：你很快就不需要App了有一说一现在的App确实非常臃肿，页面里全是各种复杂的菜单、会员、广告。Openclaw创始人预测的未来里，用户只用做一件事：说出你的需求，Agent就能现场为你造出一个专属工具。这就是我说的：所有的产品都值得用大模型重做一遍。但重做不是简单的加个对话框，是把核心逻辑变成按需生成，这才是真正的AI Native。

Openclaw开发者Peter Steinberger：你很快就不需要App了有一说一现在的App确实非常臃肿，页面里全是各种复杂的菜单、会员、广告。Openclaw创始人预测的未来里，用户只用做一件事：说出你的需求，Agent就能现场为你造出一个专属工具。这就是我说的：所有的产品都值得用大模型重做一遍。但重做不是简单的加个对话框，是把核心逻辑变成按需生成，这才是真正的AI Native。

傅盛

75,038 görüntüleme • 4 ay önce

自从马云重新现身后，蚂蚁集团一直猛冲AI，大动作不断！像是卯足劲在追赶阿里QWEN！最近更是连发两款实用拉满的模型！！！先是百B级的 Ling 2.6 Flash，盲测阶段就冲上 OpenRouter 趋势榜第一，直接火到了海外！！还不算完，Ant Ling 今天又甩出一张底牌： Ling 2.6 1T ！名字就能看得出来，这个模型能力会更强！！但有一个误区：能力强的不一定是思考模型！ Ling 2.6 1T 不靠拉长推理链条来显得"很聪明"，而是把 token 更多花在理解、规划和输出上。换句话来说：它的核心定位，是面向复杂任务，是精准指令下的执行模型！！ 1M 超长上下文，能把会议纪要、群聊记录、项目文档、零散资料一次性扔进去统一处理。强工具调用能力，可以接进 OpenClaw、Hermes、LangGraph、Dify 等跑工作流。真实问题处理，不只生成漂亮 demo，而是能够读懂已有代码，按照你的要求去干活。 Token 效率更高，不默认展开超长思考，成本控制到最低。最近一段时间都是免费用，不用白不用，我拿了几个真实任务跑了一遍，感受超级明显—— 如果是模糊的指令，它可能不太适合。但如果是比较详细的指令，给它一个工作流，就完全起飞了！！没有了推理过程，感觉非常丝滑，这一点，就挺重要的！！减少了很多“AI自作聪明”的麻烦！！说回蚂蚁这两款模型，完全是冲着落地应用来的，几乎把简单和复杂的应用场景全部包圆。 1T 负责理解复杂目标、拆解任务、整理材料、制定计划。 Flash 负责快速执行、快速改写、快速补全。这精准切入了现在大多数人用AI的“痒点”：总想着用一个“最强模型”解决所有的事情。但我认为真正重要并且正确的是：让对的模型干对的事。这样无论是速度、成本、还是结果一致性，都更能符合预期。

自从马云重新现身后，蚂蚁集团一直猛冲AI，大动作不断！像是卯足劲在追赶阿里QWEN！最近更是连发两款实用拉满的模型！！！先是百B级的 Ling 2.6 Flash，盲测阶段就冲上 OpenRouter 趋势榜第一，直接火到了海外！！还不算完，Ant Ling 今天又甩出一张底牌： Ling 2.6 1T ！名字就能看得出来，这个模型能力会更强！！但有一个误区：能力强的不一定是思考模型！ Ling 2.6 1T 不靠拉长推理链条来显得"很聪明"，而是把 token 更多花在理解、规划和输出上。换句话来说：它的核心定位，是面向复杂任务，是精准指令下的执行模型！！ 1M 超长上下文，能把会议纪要、群聊记录、项目文档、零散资料一次性扔进去统一处理。强工具调用能力，可以接进 OpenClaw、Hermes、LangGraph、Dify 等跑工作流。真实问题处理，不只生成漂亮 demo，而是能够读懂已有代码，按照你的要求去干活。 Token 效率更高，不默认展开超长思考，成本控制到最低。最近一段时间都是免费用，不用白不用，我拿了几个真实任务跑了一遍，感受超级明显—— 如果是模糊的指令，它可能不太适合。但如果是比较详细的指令，给它一个工作流，就完全起飞了！！没有了推理过程，感觉非常丝滑，这一点，就挺重要的！！减少了很多“AI自作聪明”的麻烦！！说回蚂蚁这两款模型，完全是冲着落地应用来的，几乎把简单和复杂的应用场景全部包圆。 1T 负责理解复杂目标、拆解任务、整理材料、制定计划。 Flash 负责快速执行、快速改写、快速补全。这精准切入了现在大多数人用AI的“痒点”：总想着用一个“最强模型”解决所有的事情。但我认为真正重要并且正确的是：让对的模型干对的事。这样无论是速度、成本、还是结果一致性，都更能符合预期。

沐阳

116,421 görüntüleme • 2 ay önce

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

karminski-牙医

12,255 görüntüleme • 15 gün önce

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

karminski-牙医

30,708 görüntüleme • 9 ay önce

星爷讽刺了世间一切，唯独没有讽刺爱情，: 原来是如此的隐喻，到现在才明白，感谢星爷，只是我们弄脏了爱情。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。懂你意思了，这版我会刻意留下不完美、主观判断和情绪停顿，像是你自己琢磨出来的，而不是“写给别人看的技术解读”。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。懂你意思了，这版我会刻意留下不完美、主观判断和情绪停顿，像是你自己琢磨出来的，而不是“写给别人看的技术解读”。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。#KaitoYap Kaito AI 🌊 #Yap Inference Labs

星爷讽刺了世间一切，唯独没有讽刺爱情，: 原来是如此的隐喻，到现在才明白，感谢星爷，只是我们弄脏了爱情。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。懂你意思了，这版我会刻意留下不完美、主观判断和情绪停顿，像是你自己琢磨出来的，而不是“写给别人看的技术解读”。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。懂你意思了，这版我会刻意留下不完美、主观判断和情绪停顿，像是你自己琢磨出来的，而不是“写给别人看的技术解读”。 —— 我之前一直对 zkML 有点矛盾。逻辑上它很美：模型是对的，而且你还能证明它是对的。但每次真去看实现，基本都会卡在同一个地方——跑不起来。不是“慢一点”，而是那种一看资源占用就知道不可能进生产的跑不起来。模型稍微大点，电路直接失控，内存、时间全都爆表，最后只能留在论文和 demo 里自嗨。所以我第一次认真看 Inference Labs 的时候，关注点反而不在“zk”，而在他们是不是愿意承认：这玩意本质是工程问题。 DSperse 给我的感觉，就是终于有人不再执念“一次性证明整个模型”。模型切开、并行跑、只验证关键路径，听起来很朴素，但恰恰是工程师会选的路。不是最优雅，但能活。 JSTprove 则更现实。你不需要懂零知识、也不用研究电路怎么写，把 ONNX 模型丢进去，能转、能跑、能验，这点其实比很多“性能提升 10%”更重要。这两块拼在一起之后，zkML 才第一次让我觉得：它不是在证明“我可以”，而是在回答“你要不要真用”。对我来说，zkML 的拐点从来不是密码学突破，而是有没有人愿意为“跑得起来”妥协设计。 Inference Labs 看起来，至少选了这一边。#KaitoYap Kaito AI 🌊 #Yap Inference Labs

董小姐

35,879 görüntüleme • 6 ay önce

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

karminski-牙医

35,801 görüntüleme • 5 ay önce

很多人一聊到选哪条链？第一反应都是：热度高不高？补贴多不多？生态有没有流量？但今天听了 Talus 🐸 CEO Mike Hanono 和 The Rollup 的视频会议，我反而有种感觉：这不是在给 Sui 站台，更像是一场技术自白。首先Talus 选 Sui，真的不是因为它现在火。而是因为 Talus 想做的这件事，在别的链上，很难跑得像样。先说清楚一点：Talus 要做的不是一个 AI 应用，也不是几个 bot、几个策略脚本。它想做的是——一个大规模、自主运行的代理网络：成千上万个代理同时运行、同时决策、同时交互。光是这个前提，就把底层链的门槛直接拉满。为什么是 Sui？我听下来，核心其实就三点。第一，并行执行。代理世界不是排队点菜，不是你先我后那种单线程逻辑。代理一多，如果底层还是串行执行，结果只有一个：越跑越卡，最后只能做 demo。Sui 的并行执行，本质上就是为“多主体同时操作” 这种系统准备的，这点和 Talus 的形态非常贴合。第二，高吞吐量。代理不是偶尔动一下，而是持续、高频地产生状态变化。TPS 要是撑不住，所有“自主”“实时”都会变成慢动作回放。对 Talus 来说，吞吐量不是加分项，是能不能活下来的前提条件。第三，移动端和安全模型。这一点很多人会忽略。未来代理不只在服务器、交易后台跑，它一定会越来越靠近用户。Sui 在账户模型和安全设计上，本身就更像现代应用，而不是早期 DeFi 那套「钱包就是一切」的逻辑。所以当 gmike 说“我们一直都是 SUI Maxis”，我反而觉得这句话挺克制的。这不是情绪站队，而是工程师视角下的现实选择。至于多链？我自己的理解是：Talus 不是不懂多链，而是很清楚——在基础设施阶段，过早多链只会把复杂度放大。尤其是代理这种高度耦合、强调协同的系统，先把一个底层跑通、跑稳，比到处铺点重要得多。很多项目喜欢先讲“未来多链叙事”，但真正做底层的人，往往会先问一句：现在这个系统在哪条链上能真正跑到规模？从这个角度看，Talus 的选择是理性的，也是偏长期的。不追热点，不抢流量，先把代理世界里最难的那一块解决掉。这种项目短期不一定最热，但一旦真跑起来，后面的持续热度，反而会非常高。 Kaito AI 🌊 #Yapping #MadewithMoss MOSS #Starboard Galxe River River4FUN 🐝

很多人一聊到选哪条链？第一反应都是：热度高不高？补贴多不多？生态有没有流量？但今天听了 Talus 🐸 CEO Mike Hanono 和 The Rollup 的视频会议，我反而有种感觉：这不是在给 Sui 站台，更像是一场技术自白。首先Talus 选 Sui，真的不是因为它现在火。而是因为 Talus 想做的这件事，在别的链上，很难跑得像样。先说清楚一点：Talus 要做的不是一个 AI 应用，也不是几个 bot、几个策略脚本。它想做的是——一个大规模、自主运行的代理网络：成千上万个代理同时运行、同时决策、同时交互。光是这个前提，就把底层链的门槛直接拉满。为什么是 Sui？我听下来，核心其实就三点。第一，并行执行。代理世界不是排队点菜，不是你先我后那种单线程逻辑。代理一多，如果底层还是串行执行，结果只有一个：越跑越卡，最后只能做 demo。Sui 的并行执行，本质上就是为“多主体同时操作” 这种系统准备的，这点和 Talus 的形态非常贴合。第二，高吞吐量。代理不是偶尔动一下，而是持续、高频地产生状态变化。TPS 要是撑不住，所有“自主”“实时”都会变成慢动作回放。对 Talus 来说，吞吐量不是加分项，是能不能活下来的前提条件。第三，移动端和安全模型。这一点很多人会忽略。未来代理不只在服务器、交易后台跑，它一定会越来越靠近用户。Sui 在账户模型和安全设计上，本身就更像现代应用，而不是早期 DeFi 那套「钱包就是一切」的逻辑。所以当 gmike 说“我们一直都是 SUI Maxis”，我反而觉得这句话挺克制的。这不是情绪站队，而是工程师视角下的现实选择。至于多链？我自己的理解是：Talus 不是不懂多链，而是很清楚——在基础设施阶段，过早多链只会把复杂度放大。尤其是代理这种高度耦合、强调协同的系统，先把一个底层跑通、跑稳，比到处铺点重要得多。很多项目喜欢先讲“未来多链叙事”，但真正做底层的人，往往会先问一句：现在这个系统在哪条链上能真正跑到规模？从这个角度看，Talus 的选择是理性的，也是偏长期的。不追热点，不抢流量，先把代理世界里最难的那一块解决掉。这种项目短期不一定最热，但一旦真跑起来，后面的持续热度，反而会非常高。 Kaito AI 🌊 #Yapping #MadewithMoss MOSS #Starboard Galxe River River4FUN 🐝

百里 🌊RIVER | MemeMax⚡️|🧠SENT

13,710 görüntüleme • 6 ay önce

【Manus季逸超：六个月后，基本每一家头部的应用公司都有做模型的能力】最近看了Manus联合创始人季逸超的访谈，很多人诟病 Manus 早期没有自己的模型、只是个套壳，但看完视频就会发现，Manus的逻辑是有道理的。一般的思维模式是先练模型（鸡），再顺便出个产品（蛋），这叫“沿途下蛋”。但这种方式是以模型为中心的，它的风险在于，蛋的形状取决于鸡能生出什么。模型能做到哪，产品才能做到哪，产品只能迁就技术。 Manus的路子是以产品为中心“借鸡生蛋”：早期直接用现成的模型。别管鸡是谁的，先让产品跑起来，看用户愿不愿意买单，找到PMF。等产品逻辑通了、用户量大了，发现现有的模型太贵、太慢、或者不够适配，再反过来去倒逼技术，优化出一种特定的模型。以Cursor为例，它一开始就是个代码编辑器，接入的是别人的接口。但等到它成为程序员的刚需后，为了追求极致的速度和更准的代码逻辑，它才跳出来做了自研模型。说到底是应用先于模型，需求定义底座。

【Manus季逸超：六个月后，基本每一家头部的应用公司都有做模型的能力】最近看了Manus联合创始人季逸超的访谈，很多人诟病 Manus 早期没有自己的模型、只是个套壳，但看完视频就会发现，Manus的逻辑是有道理的。一般的思维模式是先练模型（鸡），再顺便出个产品（蛋），这叫“沿途下蛋”。但这种方式是以模型为中心的，它的风险在于，蛋的形状取决于鸡能生出什么。模型能做到哪，产品才能做到哪，产品只能迁就技术。 Manus的路子是以产品为中心“借鸡生蛋”：早期直接用现成的模型。别管鸡是谁的，先让产品跑起来，看用户愿不愿意买单，找到PMF。等产品逻辑通了、用户量大了，发现现有的模型太贵、太慢、或者不够适配，再反过来去倒逼技术，优化出一种特定的模型。以Cursor为例，它一开始就是个代码编辑器，接入的是别人的接口。但等到它成为程序员的刚需后，为了追求极致的速度和更准的代码逻辑，它才跳出来做了自研模型。说到底是应用先于模型，需求定义底座。

傅盛

89,082 görüntüleme • 5 ay önce

年前多关注ai板块吧中国人参与多的就会有买单！就会有市场🤟 中国开源模型下载量首超美国，一场新的科技竞速正式打响！还在觉得全球 AI 只看硅谷？ MIT × Hugging Face 最新联合报告告诉你：过去一年，全球开源 AI 模型下载量中，中国占比 17% —— 首次超过美国的 15.8%。这不是一个小数点的变化，这是 AI 格局的一声惊雷。意味着一个事实正在出现：中国 AI，不再只是“追赶者”，而是实实在在的“生态领跑者”。一、为什么这个数据爆炸性这么强？开源模型下载量，是 AI 世界最真实的“民意投票”。谁被用、谁被复用、谁被拿去做产品，下载量不会说谎。它比论文数量更接地气，比发布会更诚实，比概念 PPT 更真实。下载量高 = 模型真的“好使”“好用”“好落地”。而这一回，中国冲到第一名，意味着什么？全球开发者正在越来越多地选择中国模型。中国模型正在成为国际生态的一部分，而不是“区域性产品”。中国的 AI 创新正在进入全球循环，而非单向输入。一句话：中国不只在做模型，而是在影响世界开发者。二、为什么中国能“后来居上”？三大原因让人无法忽视 ① 模型数量爆发式增长：百花齐放，开发者用不过来过去一年，中国的开源模型生态堪称“井喷式”增长：中小模型、大模型、多模态、语音、图像…… 能开的都开了，能放的都放了。数量足够大，就能吸引足够多的开发者。 ② 性价比 + 轻量化：世界都在找中国模型“省钱神器” 不是每个团队都训练得起千亿级大模型。但每个团队都想部署一个能跑的模型。而中国模型的特质就是四个字：轻、快、省、能打。全球开发者当然爱。 ③ 中文生态的辐射效应：从东亚扩散到整个亚洲中文模型强，意味着东亚、东南亚用户都能直接受益。更大的人群、更高的需求，带来了更快的下载增长三、美国依然很强，但“唯一主导”时代正在改变必须说，美国仍然拥有：世界最顶级的基础研究算力、芯片、科研体系的深度优势 OpenAI / Google / Meta 等头部力量但这一次的反超给了全球一个清晰的信号： AI 生态不再是“一家独大”。多极化时代正在加速到来。全球开发者的选择，正在慢慢从“硅谷中心论”转向“多中心协作”。四、全球 AI 正进入“群雄争霸”时代这次排名变化背后，是全球 AI 赛道进入全新阶段的标志： ① 从“技术竞赛”升级为“生态竞赛” 谁的模型被更多人用，谁就占据未来话语权。 ② 开源力量影响全球，而中国是关键节点中国模型从“区域下载”变成“全球下载”，这是过去没有出现过的格局。 ③ 创新不再只来自单一地区 AI 正在走向：中国能打、美国能打、欧洲能打、世界都能打。这种竞争更健康，也更刺激。五、结语：这不是终点，而是 AI 全球化的真正开始中国开源模型首次登顶，并不是“谁碾压谁”的故事。它真正意味着：全球 AI，正在进入一个更开放、更多样、更具创造力的新纪元。当中国模型被全球开发者下载、复用、再创造这才是 AI 生态最值得期待的未来。

年前多关注ai板块吧中国人参与多的就会有买单！就会有市场🤟 中国开源模型下载量首超美国，一场新的科技竞速正式打响！还在觉得全球 AI 只看硅谷？ MIT × Hugging Face 最新联合报告告诉你：过去一年，全球开源 AI 模型下载量中，中国占比 17% —— 首次超过美国的 15.8%。这不是一个小数点的变化，这是 AI 格局的一声惊雷。意味着一个事实正在出现：中国 AI，不再只是“追赶者”，而是实实在在的“生态领跑者”。一、为什么这个数据爆炸性这么强？开源模型下载量，是 AI 世界最真实的“民意投票”。谁被用、谁被复用、谁被拿去做产品，下载量不会说谎。它比论文数量更接地气，比发布会更诚实，比概念 PPT 更真实。下载量高 = 模型真的“好使”“好用”“好落地”。而这一回，中国冲到第一名，意味着什么？全球开发者正在越来越多地选择中国模型。中国模型正在成为国际生态的一部分，而不是“区域性产品”。中国的 AI 创新正在进入全球循环，而非单向输入。一句话：中国不只在做模型，而是在影响世界开发者。二、为什么中国能“后来居上”？三大原因让人无法忽视 ① 模型数量爆发式增长：百花齐放，开发者用不过来过去一年，中国的开源模型生态堪称“井喷式”增长：中小模型、大模型、多模态、语音、图像…… 能开的都开了，能放的都放了。数量足够大，就能吸引足够多的开发者。 ② 性价比 + 轻量化：世界都在找中国模型“省钱神器” 不是每个团队都训练得起千亿级大模型。但每个团队都想部署一个能跑的模型。而中国模型的特质就是四个字：轻、快、省、能打。全球开发者当然爱。 ③ 中文生态的辐射效应：从东亚扩散到整个亚洲中文模型强，意味着东亚、东南亚用户都能直接受益。更大的人群、更高的需求，带来了更快的下载增长三、美国依然很强，但“唯一主导”时代正在改变必须说，美国仍然拥有：世界最顶级的基础研究算力、芯片、科研体系的深度优势 OpenAI / Google / Meta 等头部力量但这一次的反超给了全球一个清晰的信号： AI 生态不再是“一家独大”。多极化时代正在加速到来。全球开发者的选择，正在慢慢从“硅谷中心论”转向“多中心协作”。四、全球 AI 正进入“群雄争霸”时代这次排名变化背后，是全球 AI 赛道进入全新阶段的标志： ① 从“技术竞赛”升级为“生态竞赛” 谁的模型被更多人用，谁就占据未来话语权。 ② 开源力量影响全球，而中国是关键节点中国模型从“区域下载”变成“全球下载”，这是过去没有出现过的格局。 ③ 创新不再只来自单一地区 AI 正在走向：中国能打、美国能打、欧洲能打、世界都能打。这种竞争更健康，也更刺激。五、结语：这不是终点，而是 AI 全球化的真正开始中国开源模型首次登顶，并不是“谁碾压谁”的故事。它真正意味着：全球 AI，正在进入一个更开放、更多样、更具创造力的新纪元。当中国模型被全球开发者下载、复用、再创造这才是 AI 生态最值得期待的未来。

加密大师兄

22,361 görüntüleme • 7 ay önce

这段蔡崇信的采访，真正有意思的不是阿里又说自己 All in AI。而是他说了一个很现实的问题：欧洲最担心的，可能不是模型够不够强，而是“开关在谁手里”。美国闭源 API 模式解决了能力问题，但也把数据、成本和控制权交了出去。 Qwen 开源这条路，打的其实是“主权牌”。以后 AI 竞争，可能不只是看谁模型更强，而是看谁能让别人放心把底座建在你上面。

这段蔡崇信的采访，真正有意思的不是阿里又说自己 All in AI。而是他说了一个很现实的问题：欧洲最担心的，可能不是模型够不够强，而是“开关在谁手里”。美国闭源 API 模式解决了能力问题，但也把数据、成本和控制权交了出去。 Qwen 开源这条路，打的其实是“主权牌”。以后 AI 竞争，可能不只是看谁模型更强，而是看谁能让别人放心把底座建在你上面。

Vincent | 信号＞噪音

46,917 görüntüleme • 5 gün önce

Claude Code 的创造者 Boris 讲了一个很关键的转变： “我现在不再给 Claude 写 prompts。我写 loops 然后让 loops 去完成工作我的工作，就是写 loops。” 这其实也是很多人用 Claude Code 卡住的地方他们还在把它当聊天工具用：输入一个需求等一次回答然后手动继续改但 Boris 在 30 分钟里展示的是他真实的 daily setup： Claude Code loops dynamic workflow 核心不是让 Claude 一次性给出完美答案而是把任务拆进一个可以反复执行、检查、修正的循环里模型不只是回答你它会在 workflow 里持续推进任务这类内容，可能比很多 $500 的 vibe-coding 课程更有价值因为它讲的不是“怎么写一句更好的 prompt” 而是怎么把 Claude Code 变成一个能持续工作的系统 AI coding 的关键，是 prompt 写得更漂亮，还是你能不能设计出让模型自己推进的 loop？

Claude Code 的创造者 Boris 讲了一个很关键的转变： “我现在不再给 Claude 写 prompts。我写 loops 然后让 loops 去完成工作我的工作，就是写 loops。” 这其实也是很多人用 Claude Code 卡住的地方他们还在把它当聊天工具用：输入一个需求等一次回答然后手动继续改但 Boris 在 30 分钟里展示的是他真实的 daily setup： Claude Code loops dynamic workflow 核心不是让 Claude 一次性给出完美答案而是把任务拆进一个可以反复执行、检查、修正的循环里模型不只是回答你它会在 workflow 里持续推进任务这类内容，可能比很多 $500 的 vibe-coding 课程更有价值因为它讲的不是“怎么写一句更好的 prompt” 而是怎么把 Claude Code 变成一个能持续工作的系统 AI coding 的关键，是 prompt 写得更漂亮，还是你能不能设计出让模型自己推进的 loop？

0x_Miko

186,793 görüntüleme • 22 gün önce

Claude Opus 4.8 出了之后，我的第一反应是：想试。第二反应是：算了，token 这东西真的不经烧。结果看到 ZenMux 现在可以体验 Opus 4.8，就拿它试了一个我最近一直想做的小东西。我自己有个很真实的问题：脑子里经常冒出各种产品想法。但每次真要开始做，就会卡住。用户是谁？第一版到底做什么？哪些功能应该先砍掉？怎么定价？第一周从哪一步开始？上线后怎么找第一批用户？想法很多，执行很散。所以我让 Claude Opus 4.8 做了一个「一人公司作战室」。需求我写得也挺直接：输入一句产品 idea。自动拆出产品定位、MVP、开发任务、定价方案。再生成落地页文案、冷启动实验、风险清单和本周计划。最好不是一个静态页面，而是真的能点、能改、能导出。然后我就把这段话丢给 Claude Opus 4.8。出来的效果比我预期好不少。它真的把“一人公司怎么从想法走到执行”这件事拆开了。左边输入产品想法。中间生成产品蓝图、MVP 范围、定价和官网文案。右边是任务看板和本周计划。底部还有冷启动实验、风险雷达和 Markdown 导出。最让我觉得有意思的是，它不是一味堆功能。比如我输入“给小红书博主做 AI 选题助手”，它会主动判断：第一版必须做什么。哪些功能看起来高级，但现在应该先别碰。怎么找第一批真实用户。哪些风险可能让这个项目做不下去。这点就很能体现 Opus 4.8 的能力。普通模型经常是：你要什么，我全给你加上。最后页面很热闹，但产品判断是空的。 Opus 4.8 更像是在帮你收敛：先想清楚用户、场景和第一步，再把它变成可以执行的工作台。我是在 ZenMux 上试的。它比较方便的一点是，一个 Key 就能切不同模型，新模型上线也很快。 Opus 4.8 拿来做这种带产品判断、交互状态和复杂信息结构的网页，确实挺顺。想试 Claude Opus 4.8 的，可以从这里进：

Claude Opus 4.8 出了之后，我的第一反应是：想试。第二反应是：算了，token 这东西真的不经烧。结果看到 ZenMux 现在可以体验 Opus 4.8，就拿它试了一个我最近一直想做的小东西。我自己有个很真实的问题：脑子里经常冒出各种产品想法。但每次真要开始做，就会卡住。用户是谁？第一版到底做什么？哪些功能应该先砍掉？怎么定价？第一周从哪一步开始？上线后怎么找第一批用户？想法很多，执行很散。所以我让 Claude Opus 4.8 做了一个「一人公司作战室」。需求我写得也挺直接：输入一句产品 idea。自动拆出产品定位、MVP、开发任务、定价方案。再生成落地页文案、冷启动实验、风险清单和本周计划。最好不是一个静态页面，而是真的能点、能改、能导出。然后我就把这段话丢给 Claude Opus 4.8。出来的效果比我预期好不少。它真的把“一人公司怎么从想法走到执行”这件事拆开了。左边输入产品想法。中间生成产品蓝图、MVP 范围、定价和官网文案。右边是任务看板和本周计划。底部还有冷启动实验、风险雷达和 Markdown 导出。最让我觉得有意思的是，它不是一味堆功能。比如我输入“给小红书博主做 AI 选题助手”，它会主动判断：第一版必须做什么。哪些功能看起来高级，但现在应该先别碰。怎么找第一批真实用户。哪些风险可能让这个项目做不下去。这点就很能体现 Opus 4.8 的能力。普通模型经常是：你要什么，我全给你加上。最后页面很热闹，但产品判断是空的。 Opus 4.8 更像是在帮你收敛：先想清楚用户、场景和第一步，再把它变成可以执行的工作台。我是在 ZenMux 上试的。它比较方便的一点是，一个 Key 就能切不同模型，新模型上线也很快。 Opus 4.8 拿来做这种带产品判断、交互状态和复杂信息结构的网页，确实挺顺。想试 Claude Opus 4.8 的，可以从这里进：

Joruno

15,532 görüntüleme • 27 gün önce

发现 Minimax 更新了 Speech-02 音频模型试了一下现在咋这么强！训的我自己的语音模型我已经分不出来了你现在拿一段我的音频问我是不是我说的，我都迷糊 👇下面是详细的测试内容：

发现 Minimax 更新了 Speech-02 音频模型试了一下现在咋这么强！训的我自己的语音模型我已经分不出来了你现在拿一段我的音频问我是不是我说的，我都迷糊 👇下面是详细的测试内容：

歸藏(guizang.ai)

106,336 görüntüleme • 1 yıl önce

今晚如果你本来打算刷 2 小时 Netflix 不如看这个 40 分钟 masterclass 来自一家 $20B 中国 AI company 的 Kimi founder 它最有价值的地方不是“讲 AI 很强” 而是把 Agent Swarms 和 AI systems 到底怎么在规模化场景里运作，讲得非常清楚不管你从来没搭过 agent，还是已经每天都在用 Claude，这个内容都值得看真正有意思的是：很多人还在把 AI 当单个工具用但 Agent Swarms 讨论的是另一件事： -- 多个 agent 如何分工 -- 如何协作 -- 如何把任务拆开 -- 如何在系统层面持续运行这也是为什么我把里面的关键思路整理成了一份 practical guide 重点不是单纯理解概念而是怎么真正用 Kimi 去 build

今晚如果你本来打算刷 2 小时 Netflix 不如看这个 40 分钟 masterclass 来自一家 $20B 中国 AI company 的 Kimi founder 它最有价值的地方不是“讲 AI 很强” 而是把 Agent Swarms 和 AI systems 到底怎么在规模化场景里运作，讲得非常清楚不管你从来没搭过 agent，还是已经每天都在用 Claude，这个内容都值得看真正有意思的是：很多人还在把 AI 当单个工具用但 Agent Swarms 讨论的是另一件事： -- 多个 agent 如何分工 -- 如何协作 -- 如何把任务拆开 -- 如何在系统层面持续运行这也是为什么我把里面的关键思路整理成了一份 practical guide 重点不是单纯理解概念而是怎么真正用 Kimi 去 build

0x_Miko

16,020 görüntüleme • 1 ay önce

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

karminski-牙医

11,723 görüntüleme • 1 ay önce

美国国务卿卢比奥表示：中国是一个大国，拥有十几亿人口，是全球第二大经济体，而且还拥有核武器。对美国和中国来说，如果彼此不建立关系、不进行互动，那将是非常荒谬、也极不理性的事情。任何国家或经济体都不应在关键领域对单一来源形成高度依赖，更不应在诸如关键供应链这样的问题上，把 90% 的需求寄托在一个国家身上。这是一个基本的现实。我们的目标是推动全球供应链多元化，这一点已经讲得非常清楚。这并不是针对中国，而是基于一个简单的事实，对单一来源的过度依赖并不健康，尤其是在过去各方都曾表现出将这种依赖当作相互施压工具的情况下。

美国国务卿卢比奥表示：中国是一个大国，拥有十几亿人口，是全球第二大经济体，而且还拥有核武器。对美国和中国来说，如果彼此不建立关系、不进行互动，那将是非常荒谬、也极不理性的事情。任何国家或经济体都不应在关键领域对单一来源形成高度依赖，更不应在诸如关键供应链这样的问题上，把 90% 的需求寄托在一个国家身上。这是一个基本的现实。我们的目标是推动全球供应链多元化，这一点已经讲得非常清楚。这并不是针对中国，而是基于一个简单的事实，对单一来源的过度依赖并不健康，尤其是在过去各方都曾表现出将这种依赖当作相互施压工具的情况下。

加美财经caus.com

17,826 görüntüleme • 4 ay önce