Loading video...

Video Failed to Load

Go Home

给各位看一下这周使用Dify和Windsurf做的半成品: 🧾易收据 EasyReceipt 起因是之前财务同学问能不能用Dify优化表单录入,于是为了方便到家我直接用windsurf写了iOS App,拍照后执行Dify工作流,使用LLM视觉识别并且使用变量提取节点提取变量,手动编辑后提交到飞书表格中 但是,我低估了移动开发的难度,claude一直写不出来像样的swift代码,今天则是卡在发布上,到现在也没弄好🫠 目前只做好了签收单识别和火车票识别,电子发票很快也会支持(已经写好后端了),如果大家有非常需要的场景也可以告诉我 如果需求量很大的话,或许可以卖SaaS服务? repo见评论区,在发布之前大家先点个star关注一下

24,247 views • 1 year ago •via X (Twitter)

9 Comments

Steven Lynn's profile picture
Steven Lynn1 year ago

此外感谢@vanillaCitron 老师借我开发者账号,虽然我不会用😭

Steven Lynn's profile picture
Steven Lynn1 year ago

在此之前我做了个Ionic的版本,但是iOS一直没发生成项目文件,安卓版本倒是可以跑

BM's profile picture
BM1 year ago

不瞒你说,Windsurf可能写swiftUI不太行,但是写flutter是真的厉害

Steven Lynn's profile picture
Steven Lynn1 year ago

感谢提醒,我后面试试

jingfelix's profile picture
jingfelix1 year ago

识别文档的代码可以参考这个,可以用上 iOS 原生扫描功能

365VPN's profile picture
365VPN1 year ago

可以用ios视觉能力识别出字符串给llm分析,效率高很多

Gracewillbe's profile picture
Gracewillbe1 year ago

财务小姐姐表示很赞👍🏻

Lb.'s profile picture
Lb.1 year ago

soul app灵魂社交 Mbti receipt

Steven Lynn's profile picture
Steven Lynn1 year ago

不错👍

Related Videos

从国产SOTA走向世界SOTA? GLM-5.1 实测! 给大家带来 GLM-5.1 编程能力实测! 本次测试涵盖了前端, 后端, Agent 能力, 前端主要面向空间建模, 场景, 材质, 粒子效果等, 后端能力主要面向数据结构与算法, 体系结构, 性能优化, 内存和并发管理, 性能热点分析与调优, 面向编辑器方向的Agent能力(因为AI要自己改代码). 直接说结论, 本次测试前端方面粒子效果和光影鲜果略有提升, 剩下空间理解(甚至感觉下降了)和前端美学上没看到有什么提升, 只能说是提升了一点点. 但是后端性能上有巨大的提升, GLM-5.1 在我的 vector-db-bench 中直接秀了一手量化, 把原本32bit精度的数据量化到了8bit, 然后使用SIMD实现了一个指令周期内计算32个向量, 在我测试的其他模型中(包括Claude-opus-4.6, GPT-5.4-Pro(xhigh)) 都没有实现, 直接来到了榜首. 另外Agent能力上也有不小的提升, 同样是我写的让大模型模拟送外卖的硅基骑手测试, 其他大模型的优化还停留在看一个店能不能取两单上, GLM-5.1 已经优化到了我送餐的顺路还能再接一单, 并且仅用了大概GLM-5 1/4的 token 用量就超越了 GLM-5 的测试总分. 当然本次测试过程也很坎坷, 首先是我周末抢了2天都没抢到 coding plan (目前只有coding plan 能用这个模型), 我最后找智谱的同学给我开了个权限. 以及测试中发现白天API不是很稳定, 偶尔输出速度会掉到10tps, 以及会出现乱码文字(我的规避方法是让它输出英文, 然后再找个便宜模型翻译过来). 总结, 各位前端同学估计会失望, 因为无论是从工程还是页面效果上都看不到提升, 甚至可能会有点倒退, 但果写后端代码或者复杂Agent应用可以试试这个新模型, 会有很大的提升. #GLM51 #智谱 #GLM #AIAgent #大模型编程

karminski-牙医

19,630 views • 3 months ago

最牛叉的 polymarket 自动交易机器人!! 我个人在用,已实现不错盈利和交易量!! [15分钟、5分钟加密货币涨跌交易] >>> (自动跳转TG) 首先,我个人不反对使用 polymarket 跟单交易机器人,但是也不支持。 原因,前两天我在老外区找到了一个使用人数接近2w人的跟单交易机器人。 看到很多老外在推特上晒出的聪明钱包,我也想着跟单一手,然后高高兴兴的去睡觉了。 结果醒来一看,曹尼玛,200美金直接飞了,麻痹,感情全给这些所谓的聪明钱包抬轿子了。 那时候我就想,既然跟单是行不通了,那么机器人直接自动交易呢? 这不,我发现了这款 polymarket 自动交易机器人。 用到现在,不到三天,但是我真的很想给它点个赞,给创始人点个赞。 >>> 其实使用起来,我也是走了不少歪路的。 使用的第一天,没有把止损设置好(那个按钮默认显示✅️,我以为就是设置好了的,但其实需要设置为❌️,才能真正的止损),这也导致了我才使用不到5小时,50美金直接全部亏光光,麻痹。(其实亏光光的原因还有一点,我没有设置好参数) 然后第二天我就暂停使用了,因为我以为是机器人本身的问题。好在我在群里发现了其他一些人的比较好的参数,并且同时!!!发现了我的止损没有设置好。 接着第二天这个时候我把参数设置好、止损设置好后,没有着急跑实盘交易,而是先用模拟盘跑了大约12个小时。 第三天看了一下模拟盘战绩,感觉5分钟的不太好,于是启动了15分钟的交易(今天凌晨1.30分左右),初始放了30美金进去,现在来到了80美金,收获了盈利,也收获了接近4000美金的交易量。 >>> 这个号单次下单金额为5美金,同时还做了另外一个号,单次下单金额为10美金(其它参数一样),两个号都有的赚,10美金那个号当然交易量会更多。 虽然说现在感觉还不错(实现了盈利+交易量),但是我也不知道后面的情况到底会如何,毕竟市场和交易是谁也没法预判的…… 不过有想体验一下的,可以从上面进,就是一个TG交易机器人,建议设置好参数后(可以先模拟盘交易,也可以问我要参数),也是从少量成本做起,毕竟心急吃不了热豆腐的。 [Do Your Own Research]

金麦飞JMF🪯

52,029 views • 4 months ago

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 views • 7 months ago

用了两天的Fable-5,得到了一个与大部分人截然相反的结论,实测体验如下: 速度:非常慢,尤其是开始分析和规划的时候能感受到像乌龟慢爬 价格:我是Max5订阅用户,虽然输入输出定价为Opus的两倍,但是实际消耗量并没有像流水一样,消耗速度确实变快了,但命中缓存后消耗没有特别高,没有人传人的消耗那么离谱的快 所以铺天盖地说消耗非常快的只有三种可能: 第一种是Pro订阅账号容量本来就小, 第二种是没自己账号纯造谣, 第三种是本来对Opus的消耗没有感知,看到别人说fable消耗快自己也一用发现消耗快于是觉得是真的消耗快了。本身Opus的消耗就非常快嘛,现在只不过是变为了原来的大概1.5x 对于我来说,我通常只用Opus,所以这个1.x倍Opus的消耗量能够接受。实际使用中建议把缓存重建修改为1小时。 能力:能力强体现在思维边界更广,架构能力更强。 对于前端能力测试确实是有很大提高,尤其是创意能力。真正落地到工程项目中,我的体感是能够真正发现GPT-5.5的问题了,不会再像之前基本一直认为GPT的分析是对的。 实际能力类似于Claude Opus4.6++与GPT-5.5++的结合版,目前没有到非常惊艳的程度 结合价格和6月22之后就没了,我也没有升级Max20的打算,Max5+GPT-5.5乃至即将出现的5.6我觉得完全够用。也建议大家理性消费。如果想走按量体验可以看下评论区。 最后给大家看一下昨晚用Fable简单构建的前端的效果,关于为什么我吐槽过还要做前端,是因为我也需要在抖音小红书炸裂搞流量,人作为视觉动物,前端是最开始抓住注意力的开头的。 视频如下,网站部署在verel地址放在评论区了,大家可以自行查看

雪踏乌云

23,404 views • 22 days ago

刚刚过去的一天整个ai行业又有大事发生! Claude code重磅更新!今天凌晨推出了自动修复功能,现在claude code可以自己完成代码修复,自动持续提交pr以及修改bug等功能,确保代码的审核修改和上交都在自动化的过程中可以完成,这也是自周初推出自动研究功能后,本周推出的第二个自动化功能。 AI自动化写代码改代码提交代码,本周也是上升到了一个新的维度。 同时谷歌也是在今天凌晨发布了gemini3.1 flash live版本,这是一个语音输入的大模型,现在用户可以通过语音输入的方式,指导用户写代码。我觉得这种语音输入的大模型后续可以方便残疾人使用ai,这也是ai技术进步对于人类温情的体现。 谷歌也发布了一个音乐生成模型 lyria,这是一个可以帮助用户更方便的制作音乐的模型,也可以通过图片文字和视频更好的生产新的音乐,目前在谷歌ai studio已经可以使用。 Openai宣布其广告收入的年化收入也已经超过了1亿美金,他们从今年1月开始为部分美国用户提供了广告,并且和600多家公司签订了合同。如果这条路径能走通,也将为openai获得一个新的收入渠道,不过之前anthropic也已经多次嘲讽过openai的广告太多,希望不要成为下一个百度。 更多具体内容请看视频!感谢大家点赞关注支持!谢谢!

Vic TALK

14,528 views • 3 months ago

很多人觉得 AI编程门槛太高,不愿意使用,那么你们有福了!!! 扣子发布2.0版本 带Skills 功能,非常有幸拿到 Coze Skills 的内测。 试了一下,对于不会用Claude Code,或者惧怕使用的人来说,真是太友好了! 如果说:Claude的Skills很强,还需要懂一点技术的话,那么扣子把这个门槛降到了零。 对话就能创建 零代码创建 普通人也能拥有AI超能力。 我做了个论文一键转公众号的 Skill,还能自动配图,自动发布! 1. 支持从论文/文章 PDF 或链接中一键提取核心内容 2. 智能解析:自动提取论文的标题、摘要、核心创新点、实验数据和结论。 3. 文风转换:不是生硬的翻译,而是根据公众号读者的阅读习惯,将晦涩的学术语言转化为通俗易懂的各种文风。 4. AI 自动配图:这是最酷的地方!它会根据论文主题,自动调用绘图模型生成一张吸睛的高清封面图,并且在文章正文中根据段落内容自动插入合适的插图。 5.一键发送草稿箱:连复制粘贴都省了,直接对接公众号 API,生成的图文直接躺在你的公众号草稿箱里,只需要最后确认一下就能发布。 同时扣子也正式推出了 Skills 技能,及技能商店。 我的技能已经免费分享到coze的技能商店!搜索:公众号配图生成技能 就能找到! 来讲一下如何操作: 技能入口在扣子 2.0 版本的扣子编程这里就可以看到,窗口右上角的“技能”。 在扣子编程中的不需要太多技巧, 直接使用自然语言的方式就可以创建技能,它会完全按照你的意思去生成和调试,非常方便! 并且支持在线调试预览开发好的技能, 然后还支持一键部署和发布到扣子。 关键是一边预览,左侧还能让它修改 可以打开文件夹,看到 skill 自定义文件、脚本、引用来源等信息。结构和CC非常像,其实我觉得都完全没有必要打开看。 我很多文件,都是从Claude Code里面的skills直接copy过来,上传上去,居然直接能用,省了好多力气,直接可以搬移Claude Skill了! 技能开发完成后,点击部署,在技能商店中可以看到自己刚刚部署和安装的技能,并支持一键发布到技能商店给所有人使用。 可以发布为免费技能也可以发布为付费技能,想赚钱直接发布成付费就行。 发布完后,所有人都能在技能商店使用你的技能,如果是付费的,用户可以很方便的对技能进行付费,技能开发者也能快速变现。 使用直接 @你的技能 就可以,详细请看视频 Skills 还是太火了,所有的媒体平台都有在讨论 Skills。扣子也第一时间,支持了 Skills 的无代码开发以及技能商店。 目前Coze商店里的技能,我看了一下绝大多数都是免费的,赶紧来找一下你要的? 用AI工具快两年了,从最开始的"哇,它能写东西",到后来的"嗯,但还是得我自己改",再到现在的"它真的能帮我干活了"。 AI不再是一个聊天工具,而是一个真正的同事。 它知道我的工作方式,它能交付我需要的成品,它甚至能主动帮我完成重复性工作。 这才是AI应该有的样子。

huangserva

28,909 views • 5 months ago

给大家带来 MiniMax-M3 实测! 本次测试包含了复杂前端, 后端 Agentic Coding, Agent 能力测试, 以及我的使用经验总结. 来看结论: 前端能力上, 可以完全适配 KCORES2026p2 的前端测试题目, 无论是空间理解, 建模精确度, 场景美学都十分在线, 其中我最满意的是美学部分, 它的颜色运用非常好. 不足的地方主要体现在复杂需求不能一次性写对(比如光追引擎), 需要迭代一下就可以了. 后端能力测试这次也是突飞猛进, 得分超过了 deepseek-v4-pro 和其他一众国产大模型, 略逊于 GPT-5.4-Pro(xhigh). Agent 能力上表现同样亮眼, 达成了榜单第二的接单量, 证明它的规划能力特别强。 下面是我在测试和实际使用中, 总结出来的 M3 使用经验, 供大家参考: 我的体感是 M3 特别喜欢推理, 它可以单次执行超长的推理. 在咱们的这些前端测试中, 它最长的输出甚至达到了我规定的 64k token上限, 所以, 不要上来就写一个超级复杂的 prompt 让它执行, 而是需要先把需求形成 plan, 然后让 agent 蜂群去执行, 这样才能得到理想的效果, 所以 M3 先天适合放在带 plan 模式的 Coding Agent 中使用. 如果把它嵌入到 Agent 框架中使用, 那么 prompt 编排就一定要做好, 不要一股脑把大量的 tool call 或者超大的 system prompt 丢给它. 还是需要下功夫好好编排一下的. 本次 M3 相比之前的 2.7 版本有了大幅度的提升, 模型偏好上来看, M3 是一个规划能力极强的模型, 所以特别适合用在一些规划性质的 Agent 框架中, 比如任务拆分, 日程管理, 流程设计等. 而本次暴露出来的不足则是执行过程中约束不够强, 比如 prompt 中设置的复杂规则, 一定要增加代码级别的 harness 闭环流程来进行约束, 而不能只靠模型本身来管理自己的行为. #minimaxm3 #minimax #agenticcoding #aiagent #harness

karminski-牙医

18,694 views • 29 days ago

OMG!只用了 3 个小时不到,我竟做出了自己真正意义上交互完整且完全可用的第一个 web app! 太666了!如果不是因为浪费了很多时间找 API,估计更快能够做完😎 从最早用 claude3 opus,到后来用 cursor 写web app,写插件,对于我这样一个毫无coding 基础的小白来说,写到能用的程度就已经欢呼雀跃,根本不敢多提一点要求,审美要求更是直接放弃,因为不知道它修改了什么,就可以把整个应用,彻底搞崩溃,所以,只求 50 分万岁!当然,更不要提部署,到这一步直接投降! 几周前刚推出来我就试了一下,发现效果并不好,遇到问题,让它处理,它仍然会 down 掉,可是今天当我再次尝试用它给我们家娃写一个英语单词查询和记录工具时,竟表现得如此完美!不得不感叹,过去四周的迭代,真的很 AI 速度啊!! 其实,我们仔细去观察,每一波 coding 应用起来的时候,web app 其实都是一个非常高频的场景, container 技术,加上 Sonnet3.5的能力,专注在web app场景, 从开发到部署,整个实现端到端闭环。而在这个场景中,对于小白来说,最痛的两个痛点:debug+部署,也都解决的近乎完美,真的是「一键的事儿」! 记得前几天,Anthropic 的Dario在访谈中还提到,Claude在真实世界编程任务(SWE Bench)上,从2024年1月的3-4%提升到10月的50%,预计未来 10 个月将有可能提升到 90%。而这也一定会带来质的改变,很是期待! 直接上线,欢迎试用😉

Janet

174,659 views • 1 year ago