劳伦斯's banner
劳伦斯's profile picture

劳伦斯

@LawrenceW_Zen12,725 subscribers

AI 独立开发者|专注 AI Agent 实操|BUILD IN PUBLIC |写给想入门、想做得更好的人 | 先完成再完美 🌏联系方式wx:lawrencewzen

Videos

LawrenceW_Zen's profile picture

最近拿 StepFun 的 Step 3.7 Flash 跑了一次完整的自动编程流水线,从需求文档到能用的工具,65 分钟,中间没碰键盘。 先说模型。Step 3.7 Flash 的定位是把 Agent 工作流从头跑到尾:规划、写代码、跑测试、审代码、出错重试,看的是整条流程跑完的综合效率。原生多模态,开源可部署。Agent 循环一次要调几百次模型,快和便宜在这里不是锦上添花,是能不能跑得起的问题。 再说项目。hero-coding 是我用 Go 写的一个自动编程流水线:输入一份 Markdown 需求文档,四个 Agent 执行——Planner 把需求拆成带依赖关系的小任务,Worker 在独立的 git worktree 里写代码提交,Verifier 跑测试出硬证据,Reviewer 审 diff,通过就合入主干,不过就打回重做。四个角色全部由 Step 3.7 Flash 驱动,区别只是 system prompt 和工具权限。 这次给它的需求:做一个 Agent 运行日志分析工具,读日志文件,统计每个 Agent 的调用次数、成功率、平均耗时、token 消耗,找出最慢和最不稳定的 Agent。 实际跑下来: · Planner 把需求拆成 6 个任务,自动排好依赖顺序 · 6 个任务全部自动交付,逐个合入主干 · 期间 Reviewer 打回 5 次——有测试全绿但被审出正确性问题的,有只改测试期望值想糊弄过去被拒收的,全部在重试轮次内自动修复 · 不是一个模型在自言自语,是多个 Agent 在互相检查,而且检查真的拦住了东西 · 最终产出的 CLI 直接能用,视频结尾是它分析真实日志的输出 视频是完整过程的运行日志。 国内: 海外: StepFun

劳伦斯

51,010 просмотров • 12 дней назад

LawrenceW_Zen's profile picture

手把手教你过Claude Code + DeepSeek V4 的保姆级教程

劳伦斯

85,897 просмотров • 25 дней назад

LawrenceW_Zen's profile picture

闲来无事弄个最近很火的水波纹手势交互。

劳伦斯

11,919 просмотров • 21 дней назад

Больше нет контента для загрузки