Загрузка видео...

Не удалось загрузить видео

На главную

有了 Gemini 3 之后,你想要什么界面就可以直接截图发给它了 我让它复刻了一下网易云音乐经典的黑胶唱片播放界面 包括旋转的黑胶和滚动的歌词 这个任务还是有点难度的,它改了四遍才改好 效果怎么样?可以点开视频看看 (前面是原版,后面的复刻)

117,991 просмотров • 7 месяцев назад •via X (Twitter)

Комментарии: 0

Нет доступных комментариев

Здесь появятся комментарии из оригинального поста

Похожие видео

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 просмотров • 7 месяцев назад

试了一下 OpenAI 新出的 Codex App,有些亮点 跟 Skills 的适配还是有点问题,模型的主要问题就是慢 OpenAI 给 Pro 和 Plus 用户的 Codex 额度在未来两个月内全部翻倍了 👇看一下详细的能力介绍: Skills 可视化管理 有一个专门的 Skills 列表界面,预置了一些官方 skills,也可以扫描你已经安装的 skills。注意这里只能扫描 NPX 安装的,本地创建的(比如在 Claude Code 里创建的)扫不出来。 还支持 Skills Creator 创建的 skills,可以直接在 APP 里用它去创建新 skills。 ------ 定时任务功能,这个挺实用的。 可以让 AI 定期执行某些任务,比如每周给你一个解决问题的报告,定期去解决某个项目的 PR 问题,或者定期 review 代码。 对于需要持续维护的项目来说,这个功能还是挺有价值的。 ------ Codex APP 现在支持计划模式了。 因为它跟 Codex CLI 共享后端,所以现在 Codex CLI 也同步支持计划模式了。这意味着 AI 会先规划任务步骤,让你确认后再执行。 ------ 用量显示的样式做得挺好的。 进度条、余量、使用情况都很清楚,一眼就能看到你还有多少额度。 还有 code review 的快捷方式,可以快速调用你的 skills。MCP 的添加也支持。 ====== 实测:用 video-wrapper skill 跑了一遍 我测试主要是让它跑了一个我最近做的 skill,可以一键给视频添加视频包装,比如卡片、花字、人物条、章节标题这些。 这个 skill 挺复杂的,所以很适合用来测试。 ------ 第一次运行的问题 可以工作,但第一次它选了 PIL 这个方案,比较差。 核心问题是什么?它跟你没有交互。 我的 skill 里边写清楚了:要先问用户要哪套方案,再给出包装方案让用户确认,用户确认了再开始包装。 但在 Codex 这里,明显没有交互。它就直接跑,把所有决定都自己做了,跑完就完了。出错了也不管,直接用降级方案。 ------ 修复后的效果 我让它修复以后,它倒是能修复。重新跑了一遍,效果也不错。 最终生成的视频包装效果还行: ▸ 左下角有人物卡片 ▸ 有花字 ▸ 有各种卡片和章节标题 ▸ 结论卡片也加上了 因为我们用前端代码约束了样式,所以它在样式上不会出什么错误。 ------ 体验总结 整个过程很不可控: ▸ 速度很慢 - Codex 本身速度就慢 ▸ 交互明显不够 - 你根本不知道进到哪个阶段了,也不知道它的方案是什么 ▸ 只管执行 - AI 一直在执行,不会停下来问你 可能是它不太适应 skills 规范,只是简单做了一下适配,没有 Claude Code 跟 skills 的适配那么好。

歸藏(guizang.ai)

30,521 просмотров • 4 месяцев назад

AI 视频制作也接近了 GPT 时刻,视频智能体背后的工作原理🧵 AI 产品都有个可用性易用性的临界点,临界点之下,属于专业玩家的玩具,需要各种提示词技巧、专业知识才能用起来;临界点之上,就真正变成了普通人也可以用起来并且有用的工具。就像 AI 聊天,在 ChatGPT 之前,我们常笑话它们是人工智障,在 ChatGPT 之后,它是真的变成了一个有帮助的助手,能帮助我们完成很多任务,所以我们通常把 AI 产品跨过可用性通用型临界点叫 GPT 时刻。 类似的比如前不久 GPT-4o 发布的图片模型,提示词很简单,不需要像 MidJourney 那样需要专业的提示词才能生成好的图片作品,普通人都可以把自己天马行空的想法变成真实有趣的作品,我这样非专业的都玩了好一段时间。 像 AI 视频类产品我一直没怎么玩,因为对于我这样的非专业人士来说,做好视频太难了,创意和提示词反倒相对容易一点,主要是得写脚本、画图、声音、多条视频,剪辑,做好一条视频要费很多时间精力。 不过上面这条视频倒是没花我多少时间,我就输入了一条提示词: > 生成视频,主题是“西游记人物自拍视频,用自拍的方式来讲述《西游记》经典场景”,视频长度为2分钟。 发送到纳米AI然后等着就成了,整体看着还挺有趣,有画面有声音有剧情。让我觉得 AI 视频终于也接近了 GPT 时刻,普通人也可以通过简单的提示词就能做出还不错的视频作品,动动嘴就能出视频。对于创作者,也可以快速制作视频 Demo,将创意想法快速落地。

宝玉

26,346 просмотров • 11 месяцев назад