
卡尔的AI沃茨
@aiwarts • 16,528 subscribers
分享一些好用优雅的 AI 、工作流和创作方式,边学边做,前阿里coder, Al and tech Educator, LearnPrompt founder
Shorts
Videos

昆仑万维的skywork出了个天工国内版,最大的特点是把PPT,Word,Excel查看器,生图画布,视频剪辑都加到他们内置里面了,就还可以加图标,以及调整HTML PPT的字号字体和字间距。。。 (1/5)
卡尔的AI沃茨14,512 görüntüleme • 17 gün önce

Nano Banana Pro甚至还可以一张图延伸出9张图然后直接可灵2.6图生视频做成片(直接在gemini app上做出来的9张图要后期裁剪,但在Lovart上可以直接并发出9张🎉) 提示语嘎嘎好使👇
卡尔的AI沃茨60,360 görüntüleme • 6 ay önce

可口可乐太头铁了,24年25年都用AI做广告,还是同一个题材。我直接就是公开一个完整的工作流,用ai复刻他们23年最有创意的实拍视频《杰作》👇 看看能不能认出来哪个是AI (1/9)
卡尔的AI沃茨50,406 görüntüleme • 7 ay önce

内测了一把阿里新出的安全版OpenClaw,悟空, 钉钉这把从底层重新设计了两个东西,一个叫RealDoc的文件系统,一个叫DingTalk CLI的命令行界面。 RealDoc 它让Agent精准地操作文件,按行号定位,按关键词锚点,只动需要动的地方。AI每执行一步,系统都会自动保存一个快照,就像游戏里的自动存档,随时可以回到之前的任意版本。 DingTalk CLI,就是把钉钉所有的能力,从沟通,协同,到各种软件服务,全部拆成了上万条原子化的命令行指令。 这是我把权限全部都开启之后,让悟空分析B站爆款的OpenClaw视频👇
卡尔的AI沃茨20,878 görüntüleme • 2 ay önce

“用嘴PS”的Gemini2.0五档难度实测!原生多模态做图像生成、修图、抠图、连续对话有多强?Google Gemini OpenAI没做出来的DALLE4被做出来了! 这次我分五档难度、12个真实案例做了一套AI生图新测试: 1️⃣ 视频分镜创作:一键生成分镜脚本和图片,实现高一致性,并能针对具体某一分镜进行多次修改 2️⃣ 连续一致性:多轮对话中,模型对图片上下文的理解、记忆和一致性维护能力。 3️⃣ 复杂性与细节:模型处理复杂场景、精细物体、以及多重修改的能力。 4️⃣ 创造性与风格化:模型在不同艺术风格、设计理念下的创作能力。 5️⃣ 实用性与专业性:模型在专业领域(如物品设计、建筑设计)的辅助能力。 gemini2.0 X vidu2.0 Vidu AI 做出来的钢铁侠大战超人🦸♂️,烂番茄指数🍅99% (1/9)
卡尔的AI沃茨71,396 görüntüleme • 1 yıl önce

🚨 商汤的视频Agent Seko把Nano Banana、即梦4.0都限免了,Veo3 API还打五折。做个人IP动画一绝,我整理了5个使用技巧👇 (1/6)
卡尔的AI沃茨43,761 görüntüleme • 8 ay önce

Agent一次性能运行多少个子任务?Agent浏览器Fellou2 Fellou 呢? 上个强度吧! “跨境电商监控谈价任务:监控 SalesSmartly,回答用户的问题,引导用户完成下单,当用户询问价格的时候,按价格表给到报价,当用户询问物流时间的时候,根据物流时间表给到预计的配送时间,当用户砍价的时候,不能低于我们的底价,预计低价持续的和用户沟通,用户确认订单后立刻生成一个下单的 csv 表(包含:商品名称 + 商品数量 + 商品的单价)。” 再来几个离谱案例👇: 产品推广、音频生成、Logo、Gmail自动回复、自动投简历。。。 (1/5)
卡尔的AI沃茨53,399 görüntüleme • 1 yıl önce

AI+录音是什么体验?出门问问TicNote开箱测评,给音频笔记加上自动总结+打标签、思维导图生成、自带深度搜索来补充背景知识和扩展阅读、额外生成AI播客,还能定时复盘、总结日程安排。 先来看看它的本体:厚度只有3毫米、自重29g、有64G内存。一个超小的 OLED屏、一个圆形的开机/录制按钮、一个模式切换按钮,能连续录音20+小时 几乎没什么学习成本,屏幕是用来显示当前处于什么模型和是否正在录音,用多了甚至可以“盲操”,因为开始录音的时候会带来微弱的震动反馈,提醒我已经开始录制了。 自带的双模式 1️⃣ 听筒模式:通过感知手机震动实现精确录音,解决手机录音容易被打断的问题 2️⃣ 扬声器模式:可以手持或者将TicNote放在桌面上开始录音 我前后测试了OpenAI的双人播客、苹果的WWDC发布会、一门高数课,以及我随手录下的一段今天早上跟小伙伴总结进度的录音👇 (1/6)
卡尔的AI沃茨50,356 görüntüleme • 11 ay önce

即梦出了个新产品,Octo。主要是给Seedance2.0想剧本的。交互方式和我们之前常见的那种画布类型的 AI 视频创作工具还挺不一样的。 Octo会根据和我的对话,给我创建出了很多样的内容。比如这里,它会根据我们已经聊好的内容,创建角色和环境的看板,这个看板中其实有很多个加号,在比较复杂的剧情里,如果角色发生了变化,或者你有想要给他固定的道具之类,都可以直接添加到这个看板里。 比方说,我放入了一个狐狸的图片,但剧本里是没有狐狸这个角色的,Octo一下子就找到了这个小 bug,它告诉我狐狸没有在剧本里,并询问要不要把狐狸这个角色融入到剧本中。 跟Octo聊天的过程中,它会在关键步骤都直接给出参考的视觉效果,让你确认这是否适配你心目中想要的风格。 这是我做出来的无厘头修仙大侠下山给程序员做肩颈按摩 (1/6)
卡尔的AI沃茨11,000 görüntüleme • 1 ay önce

👼 神级Prompt多到用不完,我用Claude将它们重构了一遍 Anthropic Anthropic 将自家的提示语生成升级成了提示语优化之后,并把整个过程拆成了五步: 1️⃣ 前三步是了解用户想要什么、生成执行的流程图、从样本里学习生成规则、这时候会生成第一版提示语。我都没有输入样本,Claude 就会主动去分析预期的样本会长什么样。 2️⃣ 后面两步就更有意思了,值得单独讲讲: - 补充执行步骤的细节:这次我优化的是长文摘要的提示语,最终生成的执行步骤从阅读文本、确定信息点、列出要素、确定目标受众、分析原文语气和风格,给出合适的hook以及原因,还限制了句子数量。说实话这比我自己写推文的思路都详细。 - 动态调整输入文本、样本、输出模块在整个提示语的顺序:打个比方,Claude 会主动推测用于总结的文章内容可能会比较长,这一part就会被移动到更前面。 我把优化的过程都录制下来了👇:
卡尔的AI沃茨49,294 görüntüleme • 1 yıl önce