卡尔的AI沃茨's banner

卡尔的AI沃茨

@aiwarts • 17,123 subscribers

分享一些好用优雅的 AI 、工作流和创作方式，边学边做，前阿里coder, Al and tech Educator, LearnPrompt founder

Shorts

下午体验了网易有道新开源的LobsterAI（有道龙虾），据说这是国内版OpenClaw，我用Grok找了三个OpenClaw做全网信息流的case测测性能，有从Reddit频道总结每日信息的，也有用skill last 30 days获取X和Reedit上30天内对某件事的社区看法的，还有从109个信息源（不是常规的网页爬取，包括RSS / GIthub / X）做日报的。 LobsterAI目前用下来最好的就是自带一个沙箱，新收到一个任务会先在沙箱跑，跑不动再用本地环境，能保证安全。一、Reddit每日总结（1/7）

下午体验了网易有道新开源的LobsterAI（有道龙虾），据说这是国内版OpenClaw，我用Grok找了三个OpenClaw做全网信息流的case测测性能，有从Reddit频道总结每日信息的，也有用skill last 30 days获取X和Reedit上30天内对某件事的社区看法的，还有从109个信息源（不是常规的网页爬取，包括RSS / GIthub / X）做日报的。 LobsterAI目前用下来最好的就是自带一个沙箱，新收到一个任务会先在沙箱跑，跑不动再用本地环境，能保证安全。一、Reddit每日总结（1/7）

29,995 görüntüleme

AI视频现在一个画面可以放下六个角色了。。。这是我给Vidu Q1参考生视频的极限测试，目前Q1最多可以上传7张图片作为参考，七仙女、七个葫芦娃、七龙珠我还整理了使用方法，以及清晰度、一致性、画面稳定性等，量大管饱👇 Vidu AI （1/7）

AI视频现在一个画面可以放下六个角色了。。。这是我给Vidu Q1参考生视频的极限测试，目前Q1最多可以上传7张图片作为参考，七仙女、七个葫芦娃、七龙珠我还整理了使用方法，以及清晰度、一致性、画面稳定性等，量大管饱👇 Vidu AI （1/7）

58,637 görüntüleme

字节新视频模型Seedance1.5 pro有个很牛🍺的点，目前只有它能做。可以一句话复刻经典影视片段、热门片段，做出同款名场面效果，甚至人物的动作和台词都能直接复用，比如我做的这个经典你过来啊（沈腾熊猫版）我还测试了X个cases （1/4）

字节新视频模型Seedance1.5 pro有个很牛🍺的点，目前只有它能做。可以一句话复刻经典影视片段、热门片段，做出同款名场面效果，甚至人物的动作和台词都能直接复用，比如我做的这个经典你过来啊（沈腾熊猫版）我还测试了X个cases （1/4）

24,172 görüntüleme

Videos

Anya Rossi

sweetdream.ai

SweetDream.ai•Sponsored•Livecam

Watch Anya Live

Anya is streaming live right now! Join her private show and enjoy exclusive content.

Exclusive private shows

1.2k viewers online

Private Show

Join now for exclusive access

Free preview available • Premium content

Seedance 2.0开放API后，我用OiiOii一口气做出了5分钟的AI漫剧集，真的是一句话👇 Prompt：给我制作一个极寒末世降临，暴雪冰封了整个城市，我却意外重生，靠提前囤好的物资在地下城安静苟活的完整爽剧动漫为了顺利播放压到720P切成五集了，实际上直出1080p 第一集👇 （1/8）

Seedance 2.0开放API后，我用OiiOii一口气做出了5分钟的AI漫剧集，真的是一句话👇 Prompt：给我制作一个极寒末世降临，暴雪冰封了整个城市，我却意外重生，靠提前囤好的物资在地下城安静苟活的完整爽剧动漫为了顺利播放压到720P切成五集了，实际上直出1080p 第一集👇 （1/8）

卡尔的AI沃茨

66,114 görüntüleme • 3 ay önce

现在红果前30的短剧里面就有4个是纯AI做的，而且个人也可以把自己做的短剧上传到果了！

现在红果前30的短剧里面就有4个是纯AI做的，而且个人也可以把自己做的短剧上传到果了！

卡尔的AI沃茨

46,377 görüntüleme • 3 ay önce

商汤的短剧Agent Seko出了一个新功能，可以直接出100集分好剧集的短剧，不需要二次剪辑。里面的Seedance 2.0不限速，然后是1.2块/秒。我尝试用它来做了一下👇 1. 非遗动漫 2. 两种风格的真人短剧 3. 音乐MV 第一集、布老虎觉醒（1/6）

商汤的短剧Agent Seko出了一个新功能，可以直接出100集分好剧集的短剧，不需要二次剪辑。里面的Seedance 2.0不限速，然后是1.2块/秒。我尝试用它来做了一下👇 1. 非遗动漫 2. 两种风格的真人短剧 3. 音乐MV 第一集、布老虎觉醒（1/6）

卡尔的AI沃茨

35,641 görüntüleme • 3 ay önce

Nano Banana Pro甚至还可以一张图延伸出9张图然后直接可灵2.6图生视频做成片（直接在gemini app上做出来的9张图要后期裁剪，但在Lovart上可以直接并发出9张🎉）提示语嘎嘎好使👇

Nano Banana Pro甚至还可以一张图延伸出9张图然后直接可灵2.6图生视频做成片（直接在gemini app上做出来的9张图要后期裁剪，但在Lovart上可以直接并发出9张🎉）提示语嘎嘎好使👇

卡尔的AI沃茨

60,430 görüntüleme • 7 ay önce

激情下单gemini ultra后，跑出来的打印机效果，跟ai studio里用Build搭出来的效果几乎一样。

激情下单gemini ultra后，跑出来的打印机效果，跟ai studio里用Build搭出来的效果几乎一样。

卡尔的AI沃茨

60,646 görüntüleme • 7 ay önce

可口可乐太头铁了，24年25年都用AI做广告，还是同一个题材。我直接就是公开一个完整的工作流，用ai复刻他们23年最有创意的实拍视频《杰作》👇 看看能不能认出来哪个是AI （1/9）

可口可乐太头铁了，24年25年都用AI做广告，还是同一个题材。我直接就是公开一个完整的工作流，用ai复刻他们23年最有创意的实拍视频《杰作》👇 看看能不能认出来哪个是AI （1/9）

卡尔的AI沃茨

50,406 görüntüleme • 8 ay önce

美团这个ai浏览器tabbit越用越好用，已经取代我的Arc了。目前内测状态所有模型都免费用，智能标签页分组，分屏协作就是常规操作。它有一个能力叫妙招，我可以把高频使用的提示词，脚本，Agent保存为妙招，下次只需输入「/」即可快速调用。比方说让Tabbit 用SWOT法分析我的账号的优势和改进建议，还给出了具体行动计划，数据建议。（1/5）

美团这个ai浏览器tabbit越用越好用，已经取代我的Arc了。目前内测状态所有模型都免费用，智能标签页分组，分屏协作就是常规操作。它有一个能力叫妙招，我可以把高频使用的提示词，脚本，Agent保存为妙招，下次只需输入「/」即可快速调用。比方说让Tabbit 用SWOT法分析我的账号的优势和改进建议，还给出了具体行动计划，数据建议。（1/5）

卡尔的AI沃茨

27,675 görüntüleme • 4 ay önce

“用嘴PS”的Gemini2.0五档难度实测！原生多模态做图像生成、修图、抠图、连续对话有多强？Google Gemini OpenAI没做出来的DALLE4被做出来了！这次我分五档难度、12个真实案例做了一套AI生图新测试： 1️⃣ 视频分镜创作：一键生成分镜脚本和图片，实现高一致性，并能针对具体某一分镜进行多次修改 2️⃣ 连续一致性：多轮对话中，模型对图片上下文的理解、记忆和一致性维护能力。 3️⃣ 复杂性与细节：模型处理复杂场景、精细物体、以及多重修改的能力。 4️⃣ 创造性与风格化：模型在不同艺术风格、设计理念下的创作能力。 5️⃣ 实用性与专业性：模型在专业领域（如物品设计、建筑设计）的辅助能力。 gemini2.0 X vidu2.0 Vidu AI 做出来的钢铁侠大战超人🦸‍♂️，烂番茄指数🍅99% （1/9）

“用嘴PS”的Gemini2.0五档难度实测！原生多模态做图像生成、修图、抠图、连续对话有多强？Google Gemini OpenAI没做出来的DALLE4被做出来了！这次我分五档难度、12个真实案例做了一套AI生图新测试： 1️⃣ 视频分镜创作：一键生成分镜脚本和图片，实现高一致性，并能针对具体某一分镜进行多次修改 2️⃣ 连续一致性：多轮对话中，模型对图片上下文的理解、记忆和一致性维护能力。 3️⃣ 复杂性与细节：模型处理复杂场景、精细物体、以及多重修改的能力。 4️⃣ 创造性与风格化：模型在不同艺术风格、设计理念下的创作能力。 5️⃣ 实用性与专业性：模型在专业领域（如物品设计、建筑设计）的辅助能力。 gemini2.0 X vidu2.0 Vidu AI 做出来的钢铁侠大战超人🦸‍♂️，烂番茄指数🍅99% （1/9）

卡尔的AI沃茨

71,503 görüntüleme • 1 yıl önce

昆仑万维的skywork出了个天工国内版，最大的特点是把PPT，Word，Excel查看器，生图画布，视频剪辑都加到他们内置里面了，就还可以加图标，以及调整HTML PPT的字号字体和字间距。。。（1/5）

昆仑万维的skywork出了个天工国内版，最大的特点是把PPT，Word，Excel查看器，生图画布，视频剪辑都加到他们内置里面了，就还可以加图标，以及调整HTML PPT的字号字体和字间距。。。（1/5）

卡尔的AI沃茨

14,587 görüntüleme • 2 ay önce

🚨 商汤的视频Agent Seko把Nano Banana、即梦4.0都限免了，Veo3 API还打五折。做个人IP动画一绝，我整理了5个使用技巧👇 （1/6）

🚨 商汤的视频Agent Seko把Nano Banana、即梦4.0都限免了，Veo3 API还打五折。做个人IP动画一绝，我整理了5个使用技巧👇 （1/6）

卡尔的AI沃茨

43,761 görüntüleme • 10 ay önce

Agent一次性能运行多少个子任务？Agent浏览器Fellou2 Fellou 呢？上个强度吧！ “跨境电商监控谈价任务：监控 SalesSmartly，回答用户的问题，引导用户完成下单，当用户询问价格的时候，按价格表给到报价，当用户询问物流时间的时候，根据物流时间表给到预计的配送时间，当用户砍价的时候，不能低于我们的底价，预计低价持续的和用户沟通，用户确认订单后立刻生成一个下单的 csv 表（包含：商品名称 + 商品数量 + 商品的单价）。” 再来几个离谱案例👇：产品推广、音频生成、Logo、Gmail自动回复、自动投简历。。。（1/5）

卡尔的AI沃茨

53,399 görüntüleme • 1 yıl önce

AI+录音是什么体验？出门问问TicNote开箱测评，给音频笔记加上自动总结+打标签、思维导图生成、自带深度搜索来补充背景知识和扩展阅读、额外生成AI播客，还能定时复盘、总结日程安排。先来看看它的本体：厚度只有3毫米、自重29g、有64G内存。一个超小的 OLED屏、一个圆形的开机/录制按钮、一个模式切换按钮，能连续录音20+小时几乎没什么学习成本，屏幕是用来显示当前处于什么模型和是否正在录音，用多了甚至可以“盲操”，因为开始录音的时候会带来微弱的震动反馈，提醒我已经开始录制了。自带的双模式 1️⃣ 听筒模式：通过感知手机震动实现精确录音，解决手机录音容易被打断的问题 2️⃣ 扬声器模式：可以手持或者将TicNote放在桌面上开始录音我前后测试了OpenAI的双人播客、苹果的WWDC发布会、一门高数课，以及我随手录下的一段今天早上跟小伙伴总结进度的录音👇 （1/6）

AI+录音是什么体验？出门问问TicNote开箱测评，给音频笔记加上自动总结+打标签、思维导图生成、自带深度搜索来补充背景知识和扩展阅读、额外生成AI播客，还能定时复盘、总结日程安排。先来看看它的本体：厚度只有3毫米、自重29g、有64G内存。一个超小的 OLED屏、一个圆形的开机/录制按钮、一个模式切换按钮，能连续录音20+小时几乎没什么学习成本，屏幕是用来显示当前处于什么模型和是否正在录音，用多了甚至可以“盲操”，因为开始录音的时候会带来微弱的震动反馈，提醒我已经开始录制了。自带的双模式 1️⃣ 听筒模式：通过感知手机震动实现精确录音，解决手机录音容易被打断的问题 2️⃣ 扬声器模式：可以手持或者将TicNote放在桌面上开始录音我前后测试了OpenAI的双人播客、苹果的WWDC发布会、一门高数课，以及我随手录下的一段今天早上跟小伙伴总结进度的录音👇 （1/6）

卡尔的AI沃茨

50,469 görüntüleme • 1 yıl önce

内测了一把阿里新出的安全版OpenClaw，悟空，钉钉这把从底层重新设计了两个东西，一个叫RealDoc的文件系统，一个叫DingTalk CLI的命令行界面。 RealDoc 它让Agent精准地操作文件，按行号定位，按关键词锚点，只动需要动的地方。AI每执行一步，系统都会自动保存一个快照，就像游戏里的自动存档，随时可以回到之前的任意版本。 DingTalk CLI，就是把钉钉所有的能力，从沟通，协同，到各种软件服务，全部拆成了上万条原子化的命令行指令。这是我把权限全部都开启之后，让悟空分析B站爆款的OpenClaw视频👇

内测了一把阿里新出的安全版OpenClaw，悟空，钉钉这把从底层重新设计了两个东西，一个叫RealDoc的文件系统，一个叫DingTalk CLI的命令行界面。 RealDoc 它让Agent精准地操作文件，按行号定位，按关键词锚点，只动需要动的地方。AI每执行一步，系统都会自动保存一个快照，就像游戏里的自动存档，随时可以回到之前的任意版本。 DingTalk CLI，就是把钉钉所有的能力，从沟通，协同，到各种软件服务，全部拆成了上万条原子化的命令行指令。这是我把权限全部都开启之后，让悟空分析B站爆款的OpenClaw视频👇

卡尔的AI沃茨

20,878 görüntüleme • 4 ay önce

把杰伦给美团拍的AI广告工作流（地址在评论区）都看了一遍，在tapnow重新做了一条片子！什么Multi Angle 多角度控制器、Lens combo 专业摄像机库，动作参考库+动作控制motion ref、Point to edit焦点编辑通通拿下🥳 （1/7)

把杰伦给美团拍的AI广告工作流（地址在评论区）都看了一遍，在tapnow重新做了一条片子！什么Multi Angle 多角度控制器、Lens combo 专业摄像机库，动作参考库+动作控制motion ref、Point to edit焦点编辑通通拿下🥳 （1/7)

卡尔的AI沃茨

24,572 görüntüleme • 5 ay önce

阿里又整了个活，一个不怕被封claude sonnet 4.5和有Claude Code全功能的Cli，Qoder CLI 还有配套的编辑器Qoder IDE，共享一套账号，额度和配置信息。这个Gemini3内测同款操作系统复刻的case就是我用Qoder CLI做的👇 文件管理、文本编辑还带输入，终端也能输入、浏览器、邮件、图库、音乐播放器、剪辑、日历，甚至可以计算的计算器！（1/13）

阿里又整了个活，一个不怕被封claude sonnet 4.5和有Claude Code全功能的Cli，Qoder CLI 还有配套的编辑器Qoder IDE，共享一套账号，额度和配置信息。这个Gemini3内测同款操作系统复刻的case就是我用Qoder CLI做的👇 文件管理、文本编辑还带输入，终端也能输入、浏览器、邮件、图库、音乐播放器、剪辑、日历，甚至可以计算的计算器！（1/13）

卡尔的AI沃茨

32,931 görüntüleme • 9 ay önce

通用Agent，测了，设计Agent，测了，视频Agent，测了，能无丝分裂出Agent的母体Agent，今天刚测完🙀 MasterAgent, 它的核心玩法就是通过我的任务提示语反推，能解决这个任务都需要有什么样的能力，然后生成多个Agent，以及对应的工作流。生成后的AI团队还可以手动加人（Agent），手动给人换okr（提示语）。 Agent for Agents （1/6）

通用Agent，测了，设计Agent，测了，视频Agent，测了，能无丝分裂出Agent的母体Agent，今天刚测完🙀 MasterAgent, 它的核心玩法就是通过我的任务提示语反推，能解决这个任务都需要有什么样的能力，然后生成多个Agent，以及对应的工作流。生成后的AI团队还可以手动加人（Agent），手动给人换okr（提示语）。 Agent for Agents （1/6）

卡尔的AI沃茨

34,527 görüntüleme • 11 ay önce

终于有人做视频Agent的大横评了！六家视频Agent：AIpai、星流、纳米AI、美图 RoboNeo、Flowith、Manus，两大场景：剧情短片和产品广告！整个过程我会不掺杂任何优化，完全实测，从交互体验、画面、细节到音画匹配，都实打实展开说，看看它们到底能做到什么程度。（1/9）

终于有人做视频Agent的大横评了！六家视频Agent：AIpai、星流、纳米AI、美图 RoboNeo、Flowith、Manus，两大场景：剧情短片和产品广告！整个过程我会不掺杂任何优化，完全实测，从交互体验、画面、细节到音画匹配，都实打实展开说，看看它们到底能做到什么程度。（1/9）

卡尔的AI沃茨

34,180 görüntüleme • 1 yıl önce

👼 神级Prompt多到用不完，我用Claude将它们重构了一遍 Anthropic Anthropic 将自家的提示语生成升级成了提示语优化之后，并把整个过程拆成了五步： 1️⃣ 前三步是了解用户想要什么、生成执行的流程图、从样本里学习生成规则、这时候会生成第一版提示语。我都没有输入样本，Claude 就会主动去分析预期的样本会长什么样。 2️⃣ 后面两步就更有意思了，值得单独讲讲： - 补充执行步骤的细节：这次我优化的是长文摘要的提示语，最终生成的执行步骤从阅读文本、确定信息点、列出要素、确定目标受众、分析原文语气和风格，给出合适的hook以及原因，还限制了句子数量。说实话这比我自己写推文的思路都详细。 - 动态调整输入文本、样本、输出模块在整个提示语的顺序：打个比方，Claude 会主动推测用于总结的文章内容可能会比较长，这一part就会被移动到更前面。我把优化的过程都录制下来了👇：

👼 神级Prompt多到用不完，我用Claude将它们重构了一遍 Anthropic Anthropic 将自家的提示语生成升级成了提示语优化之后，并把整个过程拆成了五步： 1️⃣ 前三步是了解用户想要什么、生成执行的流程图、从样本里学习生成规则、这时候会生成第一版提示语。我都没有输入样本，Claude 就会主动去分析预期的样本会长什么样。 2️⃣ 后面两步就更有意思了，值得单独讲讲： - 补充执行步骤的细节：这次我优化的是长文摘要的提示语，最终生成的执行步骤从阅读文本、确定信息点、列出要素、确定目标受众、分析原文语气和风格，给出合适的hook以及原因，还限制了句子数量。说实话这比我自己写推文的思路都详细。 - 动态调整输入文本、样本、输出模块在整个提示语的顺序：打个比方，Claude 会主动推测用于总结的文章内容可能会比较长，这一part就会被移动到更前面。我把优化的过程都录制下来了👇：

卡尔的AI沃茨

49,354 görüntüleme • 1 yıl önce

Lovart现在可以把工作流打包成内置Skill了，还可以导出PSD和生成新字体。我把做品牌宣传片的流程拆解成了固定结构，再保存为一个Skill复用。左边是我手搓的，右边是换了主体之后用Skill生成的。一个是冲锋衣，一个是羽绒服。（1/3）

Lovart现在可以把工作流打包成内置Skill了，还可以导出PSD和生成新字体。我把做品牌宣传片的流程拆解成了固定结构，再保存为一个Skill复用。左边是我手搓的，右边是换了主体之后用Skill生成的。一个是冲锋衣，一个是羽绒服。（1/3）

卡尔的AI沃茨

11,535 görüntüleme • 3 ay önce

跟Cursor说拜拜，Cline 强势支持 Claude "Computer Use" 1️⃣ 实现爬虫自由，Claude能直接将“看”到的提取下来 2️⃣直接输出不同格式的文件，csv、json、markdown 3️⃣支持OpenRouter，实时展示每轮对话的token价格 4️⃣真正意义上的实时预览你的代码，还包自动测试和自动修复。Claude Canvas 还不能在预览区修改代码，Cline 先支持上了

跟Cursor说拜拜，Cline 强势支持 Claude "Computer Use" 1️⃣ 实现爬虫自由，Claude能直接将“看”到的提取下来 2️⃣直接输出不同格式的文件，csv、json、markdown 3️⃣支持OpenRouter，实时展示每轮对话的token价格 4️⃣真正意义上的实时预览你的代码，还包自动测试和自动修复。Claude Canvas 还不能在预览区修改代码，Cline 先支持上了

卡尔的AI沃茨

42,426 görüntüleme • 1 yıl önce