
huangserva
@servasyy_ai • 33,614 subscribers
古早程序员 | AI出海 | 自由职业 机车游侠&机速购&骑享租创始人 15年前 freelance 起步 → 连续创业者 → 亏过1个亿,逆风翻盘中 分享创业,AI,读书,生活,健身 Official X channel of SERVASYY LLC
Shorts
Videos

兄弟们!答应你们晚上开源,它来了 image to 3D模型目前只对接了线上: 你们也可以改其他家,或者本地模型 记得点赞关注,用的好GitHub也给一颗小星星👇
huangserva907,000 просмотров • 1 месяц назад

肝了几天,来回打磨了快 30 遍, 一次性把最新的 Claude Code 的 Workflow 给你完全拆解清楚 有人说它的伟大程度,不亚于 MCP 和 Skill。 第一眼我是不信的,直到拆开看它内部怎么跑: 这不是"问一句答一句"的对话,而是一个能自己跑起来的任务系统:后台持续执行、可监控、可保存进度, 还能一口气派出几十上百个 agent 分头干活/合并汇总。 核心就三个角色: Claude 拆任务、定计划; Runtime 管调度和状态; 每个 agent 只啃一个子任务,配上并发池和队列,有节奏地推进。 它代表的是一种新的工程编排方式:智能负责规划,Runtime 负责执行,状态独立保存,模型按需调度。 最反直觉的一点:它能扩展到上百个 agent,靠的不是模型变强,而是"状态外置"—中间结果全交给执行系统保存,主上下文只看摘要和关键判断。这才是复杂任务能跑稳的真正原因。 这条视频直接给了你把它搬进自己系统的方法: 先用 Claude Code 做高质量规划、拆任务定阶段; 再把 workflow 转成自己的执行格式,按任务难度路由到不同模型池,简单的走便宜模型,复杂的才上高阶模型。 这条视频,值得反复看几遍👇
huangserva140,426 просмотров • 7 дней назад

Codex太让我震惊了! 直接Codex通过GPT Images 2做 UI 设计 , 并且一整套自己完成代码编写上线 有趣的互动科学 App 我试着生成了 3D 生物结构,并做了一个可以互动探索它们的 App。 演示 👇
huangserva524,518 просмотров • 1 месяц назад

🐮太好用了,这个工具!!! 这绝对是我用过最好用的远程工具,没有之一。 最近在做一套记忆系统,但经常不在电脑旁又想操控电脑,之前用的 Hermes 远程对屏幕操作一直达不到要求。 结果在高级龙虾群,朋友推荐说他:网易 UU 远程配合 DMIT 使用,速度超快,效率提升很大,我就开始用了起来。 我2台 Mac 都装上了,设置也很简单: 下载后打开屏幕和操控2个授权, 然后在设置→安全里打开“同账号控制本设备”就行。 画质丝滑,超清4K,完全没有那种模糊感,延迟也超低,点哪到哪,就像在本地操作。 我用折叠手机,大屏展开后操作起来特别舒服。 终端功能对我来说很实用, 直接在手机上敲命令,查日志、看 GPU 状态,移动网络也不卡,能跳过图形界面直接用命令行操作,命令执行完再切回桌面看就行。 还有个端口映射,不用写配置就能做内网穿透,比我之前折腾 frp 简单太多了。 远程的时候还能一键黑屏,防止别人看到我屏幕,这个细节我也挺喜欢的。 最让我意外的是,这么专业的工具居然完全免费,没广告,不限速 我已经离不开它了 离不开 AI 的友友们,可以看看,反正免费
huangserva214,451 просмотров • 18 дней назад

Hermes + ChatGPT image2 + Seedance2.0 做了一套「三角洲游戏」Skill工作流,效果炸裂! 第一步:剧本规划 将120秒拆分成8个15秒片段,设计完整叙事:潜入(0-30s) → 1挑3 Boss连杀(30-90s) → 爆炸撤离(90-120s)。 第二步:关键帧板设计 用GPT Image 2为每个片段生成3×3九宫格故事板,每格是一个游戏画面关键时刻,包含FPS游戏UI元素(血条、准星、弹药),参考您提供的真实游戏截图风格。 第三步:视频生成 使用关键帧模式(keyframe mode),将9宫格图片作为first_frame_image输入,配合详细prompt描述画面转换、动作细节、游戏风格,AI模型据此生成15秒流畅视频。 第四步:质量控制 依次生成8个片段,发现问题立即重制或者修改。 最终用Hermes skill自动剪辑8个视频,剪掉9宫格,或者视频出bug的部分等,最后拼接成完整成品。 核心优势:模块化制作、故事板先行、风格统一、灵活修改,自动裁剪拼接
huangserva193,897 просмотров • 1 месяц назад

效果!炸裂啊!!🔥 新发的扣子2.5第一时间来评测一下,发现这已经不是一个“聪明的对话框”了 🤯 我直接让它自己做了个「视频完美复刻」Skill:上传视频,全程自主分析、生成、优化,直接调用 Seedance 2.0 还不用排队!(实际效果在评论区) 从需求到交付,它像一个真正的视频制作人一样独立完成全流程。 这就是“满配 Agent”的能力 👇 ✅ 智能提取关键帧 - 人脸特写、动作密集片段一个不漏 ✅ 场景切换检测 - 自动识别转场类型 ✅ 动作序列追踪 - 记住每个动作的完整流程 ✅ 连贯性提示词 - 每一帧都记得上一帧的状态 ✅ 高清生成 + 音频处理 - 分辨率翻倍,智能配音 你上传一个视频,它能分析风格、场景、角色、动作,然后生成相似的新视频:镜头连贯、人物一致、动作流畅。满意度:优秀 ✨ 扣子 2.5,这是一个更大的 Agent 世界:AI 是全新个体,有满配装备、满配技能、满配人格。
huangserva97,478 просмотров • 2 месяцев назад

卧槽!Windows党这回真翻身了! 桌面级AI Agent,这方向Claude Cowork出来后就被验证了,潜力巨大。 但讲真,Windows用户一直很憋屈,好用Agent不是Mac专属,就是网络、订阅门槛卡死。这痛点,谁懂啊? 最近我试了Skywork桌面版,但是这次Windows党真翻身了! 它直接原生支持Windows,告别Mac专属,直接在我电脑里跑。更关键的是,它内置Gemini系模型,还能智能路由,任务处理速度明显快于Claude Cowork! AI自己帮你选最适合的模型,效率和精准度大幅提升! 它能干的事,确实令人惊喜: ✅ 全能文件管家: 直接看懂你电脑里所有文件,无论是文档、表格、图片还是视频,都能自动整理、分析、甚至生成新产物。 ✅ 视觉能力出色: 它的图片/视频生成质量非常高,相比Claude Cowork,视觉表现力更强,做演示、宣传素材,效果令人满意! ✅ 本地安全放心: 所有操作都在本地虚拟机里,数据不上传云端,隐私和文件安全感瞬间拉满。 说真的,这种把繁琐工作交给AI,自己专注核心的感觉,让人非常满意!而且这性价比,也确实很突出。 推荐给所有想提高效率的Windows朋友们! 地址: 感受国产AI的创新实力!
huangserva134,972 просмотров • 4 месяцев назад

🔥熬了一晚,你们想要的remotion skill的案例来了! 用remotion做了一个产品广告宣传片 Gemini的模型审美更强 过程中用了多个skill配合 1.先用Gemini模型做策划出30秒视频方案 2.用方案去寻找对应的素材(要配合文案优化关键词才会精准匹配,用media-download skill) 3.同时用TTS skill生成配音 4.根据配音长度自动剪辑视频, cc+remotion就可以 5.最后让CC配上符合文案和主题的BGM 要求动态效果,封面,结尾这些都是remotion能做的事 一开始自己需要走完一遍流程,调试和效果 做好了之后,再做类似了,换词就能做到一键成片了
huangserva121,644 просмотров • 4 месяцев назад

按照烟花老师的方法,我用remotion skill 也完成了一个top5音乐视频 关于配音,我自己的方法: 1. 要先做TTS的稿, 2.然后生成每段的长度精确到0.1秒 3.通过每段声音的长度,来裁剪视频的长度适配
huangserva81,841 просмотров • 4 месяцев назад

卧槽,我有工蜂团队了 口号:不养闲龙虾 早上让我的龙虾团队,自己动手革自己的命 过程很惊险,多亏了“智库”指出问题! 结果生出了一堆的工蜂,完美融合了: 动态夺舍,DNA共享,临终反哺三大功能!
huangserva71,530 просмотров • 3 месяцев назад

很多人问我这个remotion做的广告宣传片,TTS怎么选择? 其实我现在TTS主力用几家: Index TTS2:克隆音质非常好,情感表达可以调节并且非常丰富,缺点是需要GPU,生成速度慢 Qwen3-TTS:可以克隆声音,但是对声音的原声音要求高。情感表达也挺丰富,也可以调节。最好的是,可以用CPU去生成,即便用CPU速度也可以接受。 edge-tts:英文还可以,中文就比较AI音了,有点拉垮。 这个视频里面英文配音用的就是edge-tts 还有很多家还没有尝试,比如F5-TTS,MiniMax,等有空了要好好测试一下。
huangserva36,531 просмотров • 4 месяцев назад

很多人觉得 AI编程门槛太高,不愿意使用,那么你们有福了!!! 扣子发布2.0版本 带Skills 功能,非常有幸拿到 Coze Skills 的内测。 试了一下,对于不会用Claude Code,或者惧怕使用的人来说,真是太友好了! 如果说:Claude的Skills很强,还需要懂一点技术的话,那么扣子把这个门槛降到了零。 对话就能创建 零代码创建 普通人也能拥有AI超能力。 我做了个论文一键转公众号的 Skill,还能自动配图,自动发布! 1. 支持从论文/文章 PDF 或链接中一键提取核心内容 2. 智能解析:自动提取论文的标题、摘要、核心创新点、实验数据和结论。 3. 文风转换:不是生硬的翻译,而是根据公众号读者的阅读习惯,将晦涩的学术语言转化为通俗易懂的各种文风。 4. AI 自动配图:这是最酷的地方!它会根据论文主题,自动调用绘图模型生成一张吸睛的高清封面图,并且在文章正文中根据段落内容自动插入合适的插图。 5.一键发送草稿箱:连复制粘贴都省了,直接对接公众号 API,生成的图文直接躺在你的公众号草稿箱里,只需要最后确认一下就能发布。 同时扣子也正式推出了 Skills 技能,及技能商店。 我的技能已经免费分享到coze的技能商店!搜索:公众号配图生成技能 就能找到! 来讲一下如何操作: 技能入口在扣子 2.0 版本的扣子编程这里就可以看到,窗口右上角的“技能”。 在扣子编程中的不需要太多技巧, 直接使用自然语言的方式就可以创建技能,它会完全按照你的意思去生成和调试,非常方便! 并且支持在线调试预览开发好的技能, 然后还支持一键部署和发布到扣子。 关键是一边预览,左侧还能让它修改 可以打开文件夹,看到 skill 自定义文件、脚本、引用来源等信息。结构和CC非常像,其实我觉得都完全没有必要打开看。 我很多文件,都是从Claude Code里面的skills直接copy过来,上传上去,居然直接能用,省了好多力气,直接可以搬移Claude Skill了! 技能开发完成后,点击部署,在技能商店中可以看到自己刚刚部署和安装的技能,并支持一键发布到技能商店给所有人使用。 可以发布为免费技能也可以发布为付费技能,想赚钱直接发布成付费就行。 发布完后,所有人都能在技能商店使用你的技能,如果是付费的,用户可以很方便的对技能进行付费,技能开发者也能快速变现。 使用直接 @你的技能 就可以,详细请看视频 Skills 还是太火了,所有的媒体平台都有在讨论 Skills。扣子也第一时间,支持了 Skills 的无代码开发以及技能商店。 目前Coze商店里的技能,我看了一下绝大多数都是免费的,赶紧来找一下你要的? 用AI工具快两年了,从最开始的"哇,它能写东西",到后来的"嗯,但还是得我自己改",再到现在的"它真的能帮我干活了"。 AI不再是一个聊天工具,而是一个真正的同事。 它知道我的工作方式,它能交付我需要的成品,它甚至能主动帮我完成重复性工作。 这才是AI应该有的样子。
huangserva28,909 просмотров • 4 месяцев назад

太牛逼了!!🤯🚀 正在看 PixVerse R1 的发布会直播,太可怕了! 这绝对是生成式 AI 历史上的里程碑时刻! 别再盯着Skill跑了,PixVerse 这次发的 R1 根本不是传统的视频模型,而是真正的实时交互世界模型! 三个字总结:快、活、神! 1️⃣ 真·实时(Real-time):告别进度条! 基于全新的 IRE 瞬时响应引擎,1-4 步采样,延迟直接压缩到毫秒级。 演示里改一个词,画面立马变,完全是所想即所见! 2️⃣ 可交互(Interactive):这是最恐怖的。 不再是生成一段 4 秒视频,而是无限流式生成! 只要不喊停,世界就一直演化。 最神的是中途能随意改戏。“猫变老虎”、“晴天变雨天”,画面平滑过渡,不需要切镜头。 MD,简直是在玩弄现实世界! 3️⃣ 全能架构(Omni Native): 文本、视觉、音频统一 Token 流,实时生成的竟然是 1080P 原生画质! 视频生成真的进入“以秒计”的时代了。 今晚过后,AI 视频的游戏规则彻底变了!🔥 #PixVerseR1 #科技圈大地震
huangserva28,873 просмотров • 4 месяцев назад

相比较起来,我更喜欢玩这种视频 Droid 里面选Gemini模型: Media-Download Skill + Remotion Skill (动画+字幕)+ Index TTS2 Skill + BGM Skill
huangserva18,327 просмотров • 4 месяцев назад