
歸藏(guizang.ai)
@op7418 • 153,198 subscribers
关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design) 歸藏的 AIGC 周刊|公众号:歸藏的AI工具箱
Shorts
Videos

Windows 有救了? Codex 昨晚又发布了大量体验更新,很多都超级有用,尤其是对 Windows 用户。 大家最期待的支持了 Windows 的 computer Use,以及通过移动端的 ChatGPT 远程控制 Windows 上的 Codex。 但是 Windows 上的 Computer Use,在它控制的时候你是不能控制的。这跟 Mac 上的不太一样。 聊天记录控制功能:能够控制你的聊天记录,比如置顶、查找、创建新的归类、存档等一系列操作。 新增个人资料页面:能看到你消耗的 Token、连续登录天数、最长的任务。 ChatGPT 上的 Codex 控制,现在支持了以下功能: 侧边对话:你可以不打断主对话,新开一个分支继续跟 AI 基于当前项目或任务进行对话,输入/side 开启 一键模型切换:通过长按即可快速切换模型。 iPad 专属快捷方式:支持从快捷方式直接进入 Codex,无需通过侧边栏切换。 Git Diff 显示:对话结束后,系统会显示 Git 上的 Diff,即你代码编辑的不同部分。
歸藏(guizang.ai)34,431 views • 4 days ago

本来是想随便玩一下的。 没想到 Codex 真的用一下午帮我开发了一个非常完整的类似《杀戮尖塔》的卡牌游戏。 代码和客户端都已经开源了,大家可以试试
歸藏(guizang.ai)88,545 views • 1 month ago

妈的,终于把 Chrome 上的 Gemini 开了 录个视频教大家怎么开启 如果你也跟我一样,所有的方法都用了,还是不行,而且你是 macOS 系统的话。 你直接把系统语言改成英文,它重启后就出来了。 首先就是 Chrome 的设置: 1. 把 Gemini 相关的所有开关都打开 2. 然后再把所有的 Chrome 浏览器地区设置成美国 这个流程可以用命令行去完成,也可以用现成的项目(如下面所发)去完成 然后关于谷歌账号和系统的设置: 1. 把你的 Google 账号地区改成美国 2. 把 Google 账号语言设置成英文 3. 刚才我提到的 Google 浏览器也需要改成英文 在 macOS 上,如果想把 Google 浏览器改成英文界面,需要把你整个系统语言都设置成英文
歸藏(guizang.ai)289,319 views • 4 months ago

藏师傅的 PPT Skill 现在有动效了! 给每个版式都搭配了对应的动效,都是为了配合展示,而不是只是图炫酷 本地动效文件让你在断网情况下也可以正常演示
歸藏(guizang.ai)88,005 views • 1 month ago

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型,他们叫交互模型。 这个模型能够持续接收音频、视频、文本等原生的多模态内容,并且实时进行思考、响应和行动。 它不像之前那种 Agent 脚手架,把多个模型、多个模态的模型通过 Agent 串起来,而是所有模态都在一整个模型里。 这样就可以让用户和 AI 在任意模态下实时进行交互: 你可以随时打断它,随时进行补充,AI 会实时关注你的状态,输出结果,不会像之前一样,必须等一句话结束了才能跟模型交互。 核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分: 前台交互模型: (a) 一直在线,一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点,同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感,支持用户打断、插话,并能对屏幕和视频内容做出反应 后台推理模型: (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候,将推理模型的结果放回到对话里,不会插入突兀的内容 用户最终看到的结果,就是一个既能实时交互,又能够处理重度任务的界面。
歸藏(guizang.ai)46,760 views • 22 days ago