
劳伦斯
@LawrenceW_Zen • 12,725 subscribers
AI 独立开发者|专注 AI Agent 实操|BUILD IN PUBLIC |写给想入门、想做得更好的人 | 先完成再完美 🌏联系方式wx:lawrencewzen
Videos

最近拿 StepFun 的 Step 3.7 Flash 跑了一次完整的自动编程流水线,从需求文档到能用的工具,65 分钟,中间没碰键盘。 先说模型。Step 3.7 Flash 的定位是把 Agent 工作流从头跑到尾:规划、写代码、跑测试、审代码、出错重试,看的是整条流程跑完的综合效率。原生多模态,开源可部署。Agent 循环一次要调几百次模型,快和便宜在这里不是锦上添花,是能不能跑得起的问题。 再说项目。hero-coding 是我用 Go 写的一个自动编程流水线:输入一份 Markdown 需求文档,四个 Agent 执行——Planner 把需求拆成带依赖关系的小任务,Worker 在独立的 git worktree 里写代码提交,Verifier 跑测试出硬证据,Reviewer 审 diff,通过就合入主干,不过就打回重做。四个角色全部由 Step 3.7 Flash 驱动,区别只是 system prompt 和工具权限。 这次给它的需求:做一个 Agent 运行日志分析工具,读日志文件,统计每个 Agent 的调用次数、成功率、平均耗时、token 消耗,找出最慢和最不稳定的 Agent。 实际跑下来: · Planner 把需求拆成 6 个任务,自动排好依赖顺序 · 6 个任务全部自动交付,逐个合入主干 · 期间 Reviewer 打回 5 次——有测试全绿但被审出正确性问题的,有只改测试期望值想糊弄过去被拒收的,全部在重试轮次内自动修复 · 不是一个模型在自言自语,是多个 Agent 在互相检查,而且检查真的拦住了东西 · 最终产出的 CLI 直接能用,视频结尾是它分析真实日志的输出 视频是完整过程的运行日志。 国内: 海外: StepFun
劳伦斯51,010 просмотров • 12 дней назад

Antigravity CLI 已经推出了,比 Gemini CLI(太拉了) 快N倍。 除了快就是快,天下武功唯快不破! 生成一个自我介绍网页几十秒全搞定。 可以看视频演示。
劳伦斯55,821 просмотров • 1 месяц назад

👏扣子3.0 发布了。这版我最期待的两个功能:一是"多人多 Agent 协作"——把不同的 Agent 拉进同一个项目,@ 来 @ 去分工干活;二是能把本地的 Claude Code、Codex 直接接进去托管。 我平时主力就用 Claude Code,自己还折腾过几个让多 Agent 协作的小工具: - multi-agent:用 tmux 分屏把 Claude、Codex 拉起来,按顺序调度 - hero-coding:一个 Go 写的小程序,让 Agent 写完代码自动跑测试、再过一遍审查 - roundtable:让几个不同的模型对着同一个问题互相辩论,出一个结论 我第一时间就上手了。 先接入:本地配好的 Claude Code、Codex 点几下就接进来托管,不用重配;一个项目里我拉三个 Agent —— 本地的 Claude Code、本地的 Codex、Coze Agent。 然后我在项目里 @ Claude Code,让它读我本地那个 hero-coding,它确实能读到内容,而且不单单是能读文件。 我又让它调我本地的 imgen SKILL(我自己写的文生图工具)生成一张图,再通过我自己的 coze-bridge 把图发回聊天里——图真出来了,一张未来感城市夜景。也就是说,我电脑上的整套工具链、skill 它都能调起来用,云端和本地直接打通。
劳伦斯26,809 просмотров • 17 дней назад
Больше нет контента для загрузки