Загрузка видео...

Не удалось загрузить видео

На главную

如果去可视化ClaudeCode的工作轨迹 可以看到 AI agent 在真实代码库中浏览、审查结构、做决策并提交修改的过程 软件开发正进入新的阶段,并非传统意义上的自动化,而是Agent能理解上下文、应对复杂情况、并做出有意义贡献的系统。 虽然目前仍处于vibe coding的早期阶段,但这个趋势毋庸置疑:人类和Agents正在进行人机协同的合作来构建未来

36,855 просмотров • 7 месяцев назад •via X (Twitter)

Комментарии: 0

Нет доступных комментариев

Здесь появятся комментарии из оригинального поста

Похожие видео

Refly 正式进入新篇章!🎉 我们正式发布全球首个开源的 「Vibe Workflow」平台,并同时登录云服务和开源社区版!🚀 现在你可以直接动动嘴就能构建复杂的 Workflow 并生成多模态工作结果如 PPT、网页、播客、视频等💥 后续我们还将支持 Workflow 一键运行并输出成 API 💪 此次 v0.7.0 更新超过 50000 行代码的重大版本中,我们将用户与 Agent 协作完成工作任务的体验推向了下一个阶段,给全球的 Vibe Coder 带来了如下令人振奋的能力: 1️⃣ 首创 「Vibe Workflow」,让工作过程真正「起飞 Refly😋」,用户动动嘴就能够完成复杂工作流搭建并直接完成工作结果交付 2️⃣ 最独特的是🤯,你还能修改 Agent 生成的 Workflow 的中间节点实现对结果的精细化微调,完成生产可用结果交付的最后一公里 💥 3️⃣ 提供可能是业界首个支持自由配置的 MCP 的 AI 画布产品,结合 Agent + MCP 自由配置+自由画布上下文组织能力,探索 AI 创作无限可能 作为首创开源 Agent + 自由画布的先行者, 我们后续将持续在多模型,多模态产物交付、Agent、MCP 和 Vibe Workflow 上积累工程和体验能力,为社区注入活力🥳💪 目前 Refly 已收获了数万名用户的私有化部署或云端使用,并且得益于 Refly 独特的产品能力,我们已经实现了真正的正向盈利☄️ 为了迎接接下来 Refly 新阶段的发展,我们提出全新使命,我们坚信「让 Workflow 不再神秘,变成每个人都真正可用的强大 AI 创作工具!」🌈 期待与社区的大家一起探索「Vibe Workflow」的能力边界🚀! 去 Github 中了解 Refly v0.7.0 👉 在云服务中直接体验 Refly Agent + MCP 带来的强大「Vibe Workflow」能力 👉 #Refly #VibeCoding #VibeWorkflow #Agent #MCP #Workflow

Tom Huang

31,772 просмотров • 1 год назад

今年,AI机器人赛道真的是火得不行。 从家里用的扫地机器人到工业上的自动化设备,甚至现在都可以上台跳舞了,不得不说一句牛逼! 但是现在机器人和AI系统大多被少数几家大公司掌控,创新的步伐虽然快,却往往伴随着技术封闭性和使用限制。 OpenMind 却正在打破这种局限,提出了一个非常具有前瞻性的解决方案——开源的机器人操作系统。 这种做法不仅仅是技术上的创新,它从根本上重新定义了谁能控制机器人的智能,以及谁能参与到技术创新中去。 OpenMind的核心理念是开放和去中心化——这意味着不再是只有少数几家公司有能力和资源控制机器人的发展和应用。通过开源操作系统OM1,OpenMind赋予了全球开发者和创新者在机器人生态系统中发挥更大作用的机会。任何有创意、有技术的团队,都可以基于OM1平台构建自己的机器人应用,这种开放生态不仅能加速创新,还能促进更广泛的合作和资源共享。 最关键的是,OpenMind没有像传统公司那样将机器人生态系统封闭在一个小圈子里,而是推动它向全球开发者开放,鼓励他们参与并共同塑造机器人的未来。这不仅能避免技术的垄断,更能确保机器人系统的多样性和适应性——每个开发者、每个小团队都能贡献自己的智慧,推动机器人技术在各个行业中的应用。 这背后折射的是OpenMind对于去中心化理念的深刻理解和执行力。与传统企业垄断不同,这种去中心化的思维让更多的人和团队能通过开源平台参与进来,这也让机器人技术有了更多的可能性。 未来的机器人技术, OpenMind 无疑为其注入了一股新鲜的力量。在这场关于机器人智能的创新竞赛中,去中心化和开源将不仅仅是一个趋势,更是能让全球每个人都参与进来的机会。 #OpenMind

阿乐

60,904 просмотров • 5 месяцев назад

当 UI 不再是产品,软件的护城河还剩什么?——a16z 深度解析 Agent 时代的 SaaS 终局 过去二十年,SaaS 公司的护城河很大程度上是建立在“界面(UI)”之上的。Salesforce 卖给客户的,其实是一套管理销售团队的仪表盘、视图和操作流;护城河的核心是人类用户长年累月形成的“肌肉记忆”和迁移成本。 但最近,Salesforce 宣布推出 headless(去界面化)产品,这意味着它在押注:在 AI Agent 时代,软件的核心价值不再是 UI,而是底层数据。 当 AI Agent 可以绕过 UI,直接通过 API 读取数据、执行动作时,传统记录系统(System of Record)的护城河将如何转移?a16z 给出了最新洞察,以下是核心观点的拆解: 一、过去:为什么记录系统如此难以替代? 在“人类点击软件”的时代,旧软件之所以换不掉,主要靠以下几个“粘性”指标: 高频的双向使用习惯: 销售每天都在 CRM 里录入并查看数据,习惯难以连根拔起。 大量未被文档化的潜规则: 比如“大客户折扣季末才能批”,这些业务上下文都沉淀在旧系统的复杂设置里。 盘根错节的系统依赖: 替换一个 ERP,就像在病人跑马拉松的同时给他做开胸手术。 合规和审计的红线: 薪酬、财务系统牵涉监管,不能随便动。 二、现在:UI 消失后,Agent 时代的竞争新标准 当 Agent 开始接管任务,人类的“肌肉记忆”将被抹平。新一代 AI 原生软件或自建系统正在重新定义护城河: 1. 从“数据存储”到“专有数据生成” 未来的护城河不是你存了多少数据(因为 AI 重建数据表越来越容易),而是你的产品能否持续生成新的“数据尾迹”。好的产品不只是储存数据,而是因为处在执行流程中,能不断记录下响应率、异常模式和 Agent 的执行轨迹。数据,本身就是上下文。 2. 从“记录层”走向“动作层”与“现实世界” 旧世界只管存记录;新世界里,谁能形成“执行闭环”谁就赢。 如果你的软件能不仅记录支出,还能直接审批、核对发票、触发打款; 或者更进一步,将软件闭环延伸到现实世界(如派遣人员、物流、现场履约); 这种能直接“干活”的系统,移除成本极高,极难被替代。 3. 从“单机版”走向“网络效应” 过去的系统往往只在公司内部流转。但在 Agent 时代,如果一个系统能成为买家、卖家、审计师等多方 Agent 交互和交易的“信任枢纽”,它就不再只是个数据库,而是市场的协作基础设施。 4. 权限与对象模型的彻底重构 未来的软件里,“对象”不再只是商机、工单,而是任务、意图和策略。权限体系也不再是管理“人”,而是管理“哪些 Agent 被授权代表谁,在什么策略下执行什么动作”。谁能做好这个“Agent 信任架构”,谁就拥有了结构性优势。 总结:数据退居幕后,行动成为主角 Salesforce 的 headless 化是一个强烈的信号。既有巨头在押注数据层,但对于创业者来说,游戏规则已经变了。 未来真正有壁垒的软件,不再只是记录人类工作结果的数据库,而是能够捕捉上下文、发起任务、协调 Agent,甚至指挥现实世界行动的行动系统。价值不再仅仅是谁拥有数据,而是谁能围绕数据组织行动。

比特币橙子Trader

78,596 просмотров • 1 месяц назад

今天好郁闷,发生了一点不愉快的事情!人生第一次为了自己的愚蠢进了叔所! 期待明天的好结果!!! ⸻ AI 的下一关,不在能力,而在可被证明 在模型规模不断被刷新纪录的阶段,有一个问题始终被刻意回避: AI 的结论,是否真的来自它声称的计算过程? Inference Labs 选择从这个问题切入。 他们关注的不是模型性能,而是推理行为本身是否可信、是否可复现、是否可审计。 Proof of Inference 的意义,在于把“我相信模型没问题”变成“模型必须给出证明”。 通过零知识证明,系统可以在不暴露模型结构和参数的前提下,确认一次推理: •确实由指定模型完成 •计算过程未被替换或篡改 •输出结果与真实推理一致 这不是提高透明度,而是引入约束。 在工程层面,DSperse 做的事情同样关键。 它把原本高度定制化、专家依赖的 zkML 开发流程,拆解为可复用组件, 使“可验证 AI”从研究范畴,进入实际应用范畴。 否则,再正确的理念也只能停留在白皮书。 目前,可验证推理在性能上的代价仍然明显, 但这更像早期加密系统的计算成本问题,而不是路线错误。 融资的用途,也正是针对这一层进行系统级优化。 如果说过去的 AI 竞争是“谁能算得更快”, 接下来的竞争,很可能是: 谁的推理能被证明、被追溯、被承担责任。 Inference Labs 所搭建的,不是价值观, 而是一层让 AI 输出进入现实系统所必需的验证基础设施。 #KaitoYap Kaito AI 🌊 #Yap Inference Labs

董小姐

303,504 просмотров • 5 месяцев назад

有一个超级暴论: 现阶段的 OpenClaw 根本不适合团队协作!! 折腾过的人,应该都有类似的感受! OpenClaw 本质上其实是一个很强的 Agent 底座! 你可以把它接入到自己的团队工作流里, 把 Agent 搭起来,把渠道接进去,把能力跑通, 每个人都能让Agent干事情, 但是再进一步就会发现真正的问题: 团队怎么一起用? 中间产出和最终结果都沉淀在哪? 前面做过的分析、写过的文档、跑过的方法,怎么变成团队可复用资产? 新的成员进来,怎么接着往下做,而不是从头再来一遍? 这些,落到实际的应用中,都是坑! 最近,Flowus团队开发了一个新产品: Kollab Kollab 似乎解决了上面这些问题,它的思路很直接: 把 Agent 直接变成工作流的一部分。 这是什么意思呢? OpenClaw 解决的是:我个人怎么拥有一个随叫随到、能力很强、自己可控的 AI。 而 Kollab 解决的是:怎么让 AI 参与真实的团队工作,让做过的事能留下来,方法能复用,团队能协作。 对于内容团队、研究团队、小型创业团队来说,一定知道这其中的区别!! 你可以很简单的建立不同的项目组,或者工作空间, 每个项目组里都有 Agent,项目推进的全过程中, 所有的工作流、产出和方法论,都会沉淀在这个空间里。 当下次遇到同类型的B项目时,就可以一键复用A项目沉淀下来“工作资产”。 我觉得,这才是团队协作里最有价值的部分, 尽可能减少重复劳动!! 不管是传统团队协作,还是AI时代的团队协作,都如此。 所以,AI 产品真正的分水岭, 不是谁更像人,也不是谁接了更多更强的模型。 而是,到底能不能提供一个能沉淀、能协作、能推进的工作空间。

沐阳

50,949 просмотров • 2 месяцев назад

Ilya——塑造世界的人工智能科学家 如今,AI 是一项伟大的科技,因为 AI 将解决我们现在面临的所有问题。它能解决就业问题,能治疗疾病,能消除贫困,但同时它也会带来新的问题。假新闻将会愈演愈烈,网络攻击将变得更加严重,我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。 今天早晨,关于人工智能威力的警告再次响起,超过 1300 位科技产业领军人物、研究者及其他人士正呼吁暂停人工智能的发展,以便认真考虑其带来的风险。 扮演上帝,科学家们被指责这么做已经有一段时间了,但我们正在创造的东西确实与我们迄今为止创造的任何东西都截然不同。是的,我们绝对有能力创造出具有自我目标的全自主实体。而且,这些实体变得比人类聪明的时候,确保它们的目标与我们的目标保持一致将变得至关重要。 什么激励我?我喜欢思考根本问题,基本问题。我们的系统不能做什么,而人类却可以做到?我几乎以哲学的方式去思考这些问题。比如,什么是学习?什么是经验?什么是思考?大脑又是如何运作的呢? 我感觉技术就仿佛一种自然力量。在我看来,技术与生物进化之间有许多相似之处。生物进化的过程其实很容易理解,我们有基因的变异,自然选择的过程。我们保留那些有利于生存的变异,随着时间的推移,这个过程将使生物体变得极其复杂。我们不能因为理解了生物进化就能理解人体是如何运作的,但我们可以大概理解这个过程。 我认为目前的机器学习也处在类似的阶段,特别是深度学习,我们有一个非常简单的规则,它从数据中提取信息,并将这些信息输入到模型中,我们只需不断重复这个过程。这个过程的结果就是将数据的复杂性转化为模型的复杂性。因此,最终的模型会变得非常复杂,我们并不能完全了解它的运作机制,需要进行大量的研究,但实现这一切的算法其实很简单。 也许你听说过 ChatGPT,如果你还没听说过,那就做好准备。你可以把它看作是暴风雨来临之前的零星细雨。我们需要对此保持高度警觉,因为我认同这是一个意义重大的时刻。ChatGPT 被誉为颠覆性的创新,在许多方面,它确实做到了,比如在测试中得分超过人类。微软最近的一项研究得出结论,GPT4 是一个初级阶段的,但尚未完全形成的通用人工智能系统。 这就是通用人工智能。通用人工智能,这是一个可以胜任人类能做的任何工作或任务的计算机系统,而且可能做得更好。有可能在短时间内实现通用人工智能,也可能需要更长的时间。但我认为,由于通用人工智能可能在不久的将来出现,这个可能性足够大,我们应该给予它足够的重视。这一点至关重要要确保这些超级智能的系统能按照我们的最大利益去行动。 最初的通用人工智能可能就是大型数据中心,这些中心中充满了大量并行运行的专用神经网络处理器,紧凑、高热、能耗大,其消耗的能量可能相当于一千万个家庭的用电量。这些系统的智能程度可能会大幅提升,我相信它们将对社会产生深远影响。不过,人类真的会从中获益吗?谁会获益,谁又会付出代价呢? 首批通用人工智能的信念和欲望将极为重要,所以我们必须正确地编程这些系统。如果我们做不到这一点,那么就会出现这样的情况:进化的本质,即自然选择,将使这些系统优先考虑自己的生存。并不是说它们会主动对人类产生敌意,甚至想要伤害人类,但它们将变得过于强大。我认为,一个恰当的类比就是人类对待动物的方式。我们并不是憎恨动物,实际上人类往往对动物怀有深深的爱意,但当我们需要在两座城市之间修建高速公路时,我们并不会征求动物的意见,而只是因为这对我们来说非常重要而去做。我认为这也是我们与通用人工智能(AGI)之间的默认关系,那些能真正自主运作并为自己目标服务的 AGI。 许多机器学习领域的专家这些知识渊博和经验丰富的人士,对通用人工智能(AGI)抱有许多疑虑。他们对 AGI 可能出现的时间以及是否真的能够实现表示怀疑。目前,这还是一个鲜为人知的问题。用于神经网络和人工智能的计算机速度可能在未来几年内增加 10 万倍。如果多个团队处于竞相开发通用人工智能的军备竞赛态势中,他们就会没有足够的时间来确保他们构建的通用人工智能会真正关心人类。因为在我看来,这就像是通用人工智能发展的雪崩,一发不可收拾。 我认为将来整个地球的表面很可能布满太阳能板和数据中心。考虑到这些担忧,未来的通用人工智能的建设应该是多国间的合作项目。不论如何,人工智能的未来都将是美好的。如果这同样也能给人类带来福祉,那就更加理想了。 视频来源:

宝玉

45,172 просмотров • 2 лет назад

什么是 AI 智能体?(双语字幕) 为了解释这一点,我们必须看一看在生成式 AI 领域看到的各种转变。 *** 从单一模型向复合 AI 系统的转变 单一模型受限于其训练数据,这影响了它们对世界的认知以及它们可以解决的任务类型。而且,这些模型也难以适应变化。尽管可以对模型进行微调,但这需要大量的数据和资源投资。 **** 示例:查询假期天数 例如,我想要为今年夏天计划一次假期,想知道我有多少假期天数可以用。我可以将我的查询输入到一个可以生成回应的模型中。然而,答案会不正确,因为模型并不知道我的身份,也无法访问我的个人信息。因此,模型本身可能对一些任务有所帮助,例如总结文档、撰写电子邮件初稿和各种报告初稿。 但当我们围绕模型构建系统,并将模型集成到现有流程中时,魔力便显现出来。设计一个系统来解决前面提到的问题,需要让模型能访问存储我假期数据的数据库。这样,虽然输入到语言模型中的查询相同,但模型会被提示创建一个搜索查询,这个查询可以访问我的数据库。程序会获取信息并得到答案,再将答案输入语言模型中,生成回答句子,如:“Maya,你的假期数据库里还剩下十天。”这样,我能得到正确的答案。 *** 复合 AI 系统的模块化设计 “系统”意味着有多个组件,因此系统本质上是模块化的。我可以有一个模型,选择微调模型、大语言模型、图像生成模型,但也可以有围绕它的程序化组件。可以有输出验证器、解析查询的程序、与数据库搜索结合的工具、与不同工具结合的程序等。 当我们谈论系统方法时,我可以分解希望程序完成的任务,选择合适的组件来解决问题。这比微调一个模型要容易得多,使过程更快、更方便。 **** 检索增强生成(RAG) 一个流行的复合 AI 系统例子是检索增强生成(RAG)。如果我提出一个完全不同的查询,如问天气情况,这会失败,因为程序的运行路径总是搜索假期数据库,而这与天气无关。因此,复合 AI 系统的大部分都有程序控制逻辑,这些逻辑由人类定义。 *** AI 智能体的作用 另一种控制复合 AI 系统的逻辑方式是让大语言模型负责,这在大语言模型的推理能力显著提高时才可能实现。大语言模型可以处理复杂问题,能根据提示词要求将问题分解并制定解决计划。 在一个极端,我要求系统快速思考,按照设定的规则行动。在另一个极端,可以让系统慢慢思考,制定计划,逐步解决每一部分,理解困难点并调整计划。 当让大语言模型负责逻辑时,就是在采取一种以智能体为中心的方法。 *** 大语言模型智能体的组成部分 **** 推理能力 推理能力将模型置于解决问题的核心位置,在设定计划的过程中对每一步进行推理。 **** 行动能力 行动能力通过称为“工具”的外部程序实现。这些工具是程序的外部模块,模型可以确定何时及如何调用它们以便最有效地解决提出的问题。例如,网络搜索工具、数据库搜索工具、计算器工具、操纵数据库的程序代码、翻译任务的模型等。 **** 访问记忆的能力 “记忆”可以表示几种含义。模型可以通过程序进行思考,类似于自言自语的内部日志,可以存储并随时取用。这也可以是与智能体互动的对话历史,使体验更加个性化。 *** ReACT 方法 配置智能体的受欢迎方法之一是 ReACT 方法,将推理和行动组件结合在一起。 **** 示例:度假计划 例如,我计划下个月去佛罗里达,想知道需要带多少瓶两盎司的防晒霜。这是个复杂的问题,有多步计划: 1. 我打算休多少天假? 2. 我计划在阳光下待多少小时?查看佛罗里达的天气预报。 3. 尝试了解每小时在阳光下的推荐防晒剂剂量。 4. 进行数学运算,确定防晒霜数量。 这个系统非常模块化,可以解决更复杂的问题。 *** 复合 AI 系统的未来 复合 AI 系统将一直存在,2024 年将看到它们变得更加智能。你可以根据问题的复杂程度在 AI 自治程度上做出权衡。对于狭窄、定义明确的问题,程序化方法更有效。而对于需要独立解决复杂任务的系统,智能体方法更有帮助。 大多数情况下,人工仍会参与以提高准确性。 原始视频来源:

宝玉

44,356 просмотров • 1 год назад

强烈推荐大家看下关于OpenClaw作者Peter Steinberger 的访谈 附:用remotion剪了几段高亮片段,并用whisper转写带上了中文字幕 里面有几个观点很打动我: 1️⃣Clawdbot(OpenClaw)的由来: 经常在电脑上让AI Agent 运行长耗时任务。 痛点就是:出去吃饭或休息,又想监控电脑进展,于是就花了半小时开发了clawdbot的雏形:将 WhatsApp 连接到了他的本地代码环境(Cloud code/Terminal)。 然后还讲了这个agent如何通过一张推特截图自动修复 Bug,并自动回复推文的过程(具体可查看视频),在当时看很魔幻 2️⃣ 工程思维才重要: 现在非技术人员也可以vibe一个项目,但是如果缺乏系统级思维,可能走不远。这个系统思维主要包括: a.品味:毫无疑问这个是最关键的,人类需要提升审美和判断力来掌舵; b. 对架构与结构的理解(你要明白如何运用架构思维实现大型的项目、企业级项目如何设计); c. 技术选型:能判断该建立在哪些依赖项之上(比如合适该用中间件、数据库、模型、网关等等)。 所以一个新手vibe 和一个老手vibe 出来时两个不同的东西的,作者Peter就是最佳例证,看了视频才知道人家在iOS 和 Mac OS(整个苹果生态系统) 领域深耕了 20年 3️⃣ OpenClaw的影响: openclaw实践在技术上没有创新,但这个模式是必由之路,让作者踩中了,这种模式肯定会持续下去。 作者预言:这可能会融化掉你手机上80%的应用。这个岚叔是认同的,单一的应用应该根本不需要,有AI就够了,今早看新闻A I引发软件股抛售,市值蒸发 3000 亿美元,简单的 CRUD 软件、功能单一的软件、或者静态页面将必然被 AI 取代 4️⃣ 实践路径: 总结下视频里作者关于vibe的心得:就是要主动去玩的AI 产品,不要设想一开始开发一个精美的软件。动手去写,去报错,去 Debug。只有在与 AI 深度磨合的“人机循环”中,你才能真正练就一种驾驭它的“手感”(Product Sense),知道如何引导它交出最好的结果

岚叔

15,011 просмотров • 4 месяцев назад