Video yükleniyor...

Video Yüklenemedi

Bu video yüklenirken bir sorun oluştu. Bu geçici bir ağ sorunundan kaynaklanıyor olabilir veya video kullanılamıyor olabilir.

Ana Sayfaya Dön

19秒的视频--Codex 在 ChatGPT 手机 App 上使用感受一下Codex的同步速度：手机发指令，电脑 Codex 实时执行、返回结果发任务响应速度非常快，用来审核、review 输出特别好用目前缺点是仅支持 macOS 设备（Windows 支持即将上线），作为预览版还存在一些 bug，比如同步不稳定、长线程加载卡顿、插件复杂任务仍需桌面端处理

梭哈.AI

15,288 subscribers

18,862 görüntüleme • 1 ay önce •via X (Twitter)

Anya Rossi• Live Now

Private livecam show

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

Claude Code 桌面板发布本地定时任务功能设定好任务执行的频率，Claude 会在你电脑开着的时候自动执行，无需你每次手动触发。比如：每周五下午，汇总本周进度，生成一份 Markdown 报告存到本地有几个细节值得注意：任务第一次跑完之后，Claude 会自动重写你的 Prompt，记住具体该去哪里找文件、用哪些工具，下次会更准可以开 Git Worktree 模式，每次运行在独立分支里，不会动你的主干代码如果电脑在任务时间点刚好休眠了，App 重新打开后会自动补跑，并发通知目前需要 Claude Pro 以上的付费订阅，桌面端专属，网页和手机暂不支持。怎么用在侧边栏点击 "Schedule"，再点 "+ New task" 就能创建一个定时任务。也可以在任意会话里直接描述需求，比如"帮我设置一个每天早上9点执行的代码 review 任务"，Claude 会自动完成配置。

Claude Code 桌面板发布本地定时任务功能设定好任务执行的频率，Claude 会在你电脑开着的时候自动执行，无需你每次手动触发。比如：每周五下午，汇总本周进度，生成一份 Markdown 报告存到本地有几个细节值得注意：任务第一次跑完之后，Claude 会自动重写你的 Prompt，记住具体该去哪里找文件、用哪些工具，下次会更准可以开 Git Worktree 模式，每次运行在独立分支里，不会动你的主干代码如果电脑在任务时间点刚好休眠了，App 重新打开后会自动补跑，并发通知目前需要 Claude Pro 以上的付费订阅，桌面端专属，网页和手机暂不支持。怎么用在侧边栏点击 "Schedule"，再点 "+ New task" 就能创建一个定时任务。也可以在任意会话里直接描述需求，比如"帮我设置一个每天早上9点执行的代码 review 任务"，Claude 会自动完成配置。

小互

23,651 görüntüleme • 3 ay önce

自从升级到 macOS Sonoma 后，得益于 Safari 也原生支持 Web App 了，我现在喜欢把一些常用的服务直接加到 Dock 上了。比如 ChatGPT，用起来非常顺手，还支持多窗口，支持快捷键切换。

自从升级到 macOS Sonoma 后，得益于 Safari 也原生支持 Web App 了，我现在喜欢把一些常用的服务直接加到 Dock 上了。比如 ChatGPT，用起来非常顺手，还支持多窗口，支持快捷键切换。

图拉鼎

36,336 görüntüleme • 2 yıl önce

OpenCat 支持键盘扩展啦，让您可以在任意 iOS 应用中使用 ChatGPT 快速输入！在任意 App 中输入指令，比如“写一首诗”，切换到 OpenCat 键盘，点击预设（比如翻译成英文），会根据指令和预设自动生成文本。或者复制要回复的内容，切换到键盘，点击预设（比如回复邮件）就可以让 GPT 自动回复。

OpenCat 支持键盘扩展啦，让您可以在任意 iOS 应用中使用 ChatGPT 快速输入！在任意 App 中输入指令，比如“写一首诗”，切换到 OpenCat 键盘，点击预设（比如翻译成英文），会根据指令和预设自动生成文本。或者复制要回复的内容，切换到键盘，点击预设（比如回复邮件）就可以让 GPT 自动回复。

Baye

4,062,761 görüntüleme • 3 yıl önce

在 GitHub 上发现一款能真正自主完成任务的 AI 桌面 Agent：NeuralAgent，解放我们双手，自动操作电脑。它能直接在桌面上执行各种操作，如打字、点击、浏览网页、填写表单、发送邮件，甚至可以在后台自动完成复杂任务。 GitHub：主要特性： - 桌面自动化操作，支持鼠标键盘控制和窗口管理 - 后台浏览器自动化，可自动处理网页任务 - 支持多种 AI 模型，包括 OpenAI、Anthropic、Gemini 等 - 模块化 Agent 架构，包含规划、分类、建议等专门 Agent - 多模态支持，结合文本和视觉信息理解任务 - FastAPI 后端配合 Electron 桌面应用，提供流畅操作体验搭建颇为复杂，不过提供了完整安装指南，并兼容 Windows、macOS 和 Linux 系统。感兴趣的同学可以部署运行体验下。

在 GitHub 上发现一款能真正自主完成任务的 AI 桌面 Agent：NeuralAgent，解放我们双手，自动操作电脑。它能直接在桌面上执行各种操作，如打字、点击、浏览网页、填写表单、发送邮件，甚至可以在后台自动完成复杂任务。 GitHub：主要特性： - 桌面自动化操作，支持鼠标键盘控制和窗口管理 - 后台浏览器自动化，可自动处理网页任务 - 支持多种 AI 模型，包括 OpenAI、Anthropic、Gemini 等 - 模块化 Agent 架构，包含规划、分类、建议等专门 Agent - 多模态支持，结合文本和视觉信息理解任务 - FastAPI 后端配合 Electron 桌面应用，提供流畅操作体验搭建颇为复杂，不过提供了完整安装指南，并兼容 Windows、macOS 和 Linux 系统。感兴趣的同学可以部署运行体验下。

GitHubDaily

16,761 görüntüleme • 10 ay önce

又发现一款跨设备文件分享的开源免费工具：Croc，可以放弃使用网盘或硬盘了。无需在同一网络下，允许任意两台电脑之间传输文件或文件夹，不限制大小，并提供端到端加密，更安全更快速地分享。 GitHub：除此之外，还支持多文件传输，以及中断后的断点续传功能。支持 Windows、Linux 和 macOS 一键安装使用。

又发现一款跨设备文件分享的开源免费工具：Croc，可以放弃使用网盘或硬盘了。无需在同一网络下，允许任意两台电脑之间传输文件或文件夹，不限制大小，并提供端到端加密，更安全更快速地分享。 GitHub：除此之外，还支持多文件传输，以及中断后的断点续传功能。支持 Windows、Linux 和 macOS 一键安装使用。

GitHubDaily

53,589 görüntüleme • 1 yıl önce

又在 GitHub 上发现一个专为快速构建 Web 应用的强大 AI 编程助手：Claudable。将本地 CLI 终端编程 Agent，如 Claude Code、Gemini CLI、Qwen Coder、Cursor 等，与 Lovable 结合。只需使用自然语言简单描述一下想法，就能瞬间生成完整的 Next.js 应用，并且可在编辑器里实时预览效果。 GitHub：主要功能： - 支持多种 AI 编程 Agent，包括 Claude Code、Cursor CLI、Gemini CLI 等 - 自然语言描述想法，即可生成生产级 Next.js 应用 - 实时预览功能，改动代码可实时查看结果 - 具备自动错误检测和修复，提升开发效率 - 集成 Supabase 数据库，支持用户认证和数据存储 - 生成的 Web 应用，支持一键部署到 Vercel，无需复杂配置目前工具仅支持通过本地安装部署使用，提供了详细的步骤说明，感兴趣的开发者可以看一下。

又在 GitHub 上发现一个专为快速构建 Web 应用的强大 AI 编程助手：Claudable。将本地 CLI 终端编程 Agent，如 Claude Code、Gemini CLI、Qwen Coder、Cursor 等，与 Lovable 结合。只需使用自然语言简单描述一下想法，就能瞬间生成完整的 Next.js 应用，并且可在编辑器里实时预览效果。 GitHub：主要功能： - 支持多种 AI 编程 Agent，包括 Claude Code、Cursor CLI、Gemini CLI 等 - 自然语言描述想法，即可生成生产级 Next.js 应用 - 实时预览功能，改动代码可实时查看结果 - 具备自动错误检测和修复，提升开发效率 - 集成 Supabase 数据库，支持用户认证和数据存储 - 生成的 Web 应用，支持一键部署到 Vercel，无需复杂配置目前工具仅支持通过本地安装部署使用，提供了详细的步骤说明，感兴趣的开发者可以看一下。

GitHubDaily

11,926 görüntüleme • 9 ay önce

TinyShip 的下一个基础服务功能已经开发完毕，存储服务集成完毕，使用 Unified 的云存储接口，目前接入 - 阿里云 OSS - AWS S3 - Cloudflare R2 可以轻松切换不同服务商目前支持的功能： - 文件上传/下载 - 签名 URL 生成 - 元数据管理 - 目录列表现在进度比我预想的要快。关于几个人咨询的 Cloudflare Workers 部署问题：目前暂时不支持，因为 OpenNext 目前不支持 Node.js Middleware，而我们的 middleware 使用了 Node.js runtime，我不想推翻现在的设计，所以要等 OpenNext 支持 Node.js Middleware 即可支持我看了一下是比较高的优先级，应该也是不远了。

TinyShip 的下一个基础服务功能已经开发完毕，存储服务集成完毕，使用 Unified 的云存储接口，目前接入 - 阿里云 OSS - AWS S3 - Cloudflare R2 可以轻松切换不同服务商目前支持的功能： - 文件上传/下载 - 签名 URL 生成 - 元数据管理 - 目录列表现在进度比我预想的要快。关于几个人咨询的 Cloudflare Workers 部署问题：目前暂时不支持，因为 OpenNext 目前不支持 Node.js Middleware，而我们的 middleware 使用了 Node.js runtime，我不想推翻现在的设计，所以要等 OpenNext 支持 Node.js Middleware 即可支持我看了一下是比较高的优先级，应该也是不远了。

Viking

14,145 görüntüleme • 5 ay önce

大家好！就在刚刚，OpenAI Translator 的浏览器插件端和桌面应用端都全面支持了 Kimi，Kimi 的优点太多了： 1. 完全免费 2. 响应巨快 3. 翻译质量超高所以我实在找不到不支持 Kimi 的理由。希望大家去更新尝试一下！谢谢！（视频是原速播放，毫无加速）

大家好！就在刚刚，OpenAI Translator 的浏览器插件端和桌面应用端都全面支持了 Kimi，Kimi 的优点太多了： 1. 完全免费 2. 响应巨快 3. 翻译质量超高所以我实在找不到不支持 Kimi 的理由。希望大家去更新尝试一下！谢谢！（视频是原速播放，毫无加速）

yetone

399,693 görüntüleme • 2 yıl önce

OpenAI 在用户体验设计上一直非常用心，比如： 1. 视频中的 Computer Use 的授权流程，全程只需要用户拖一下，最大程度自动化，简单到就像点一下同意许可（因为系统权限和免责需要，必须用户自己操作）。 2. Codex 封装了「插件」的概念，里面预设集成了不同的 MCP 和 Skill，点击添加，网页授权，搞定。用户完全不需要去关注什么是 MCP 或 Skill 这些对普通人来说的全新的抽象概念。 3. 再比如很多产品还在让用户自己决定是否启用搜索、思考，是高级思考还是普通思考... 这本质上是用脑力来弥补算力问题，而 OpenAI 则很早就支持了 Auto 的自动决策机制。

OpenAI 在用户体验设计上一直非常用心，比如： 1. 视频中的 Computer Use 的授权流程，全程只需要用户拖一下，最大程度自动化，简单到就像点一下同意许可（因为系统权限和免责需要，必须用户自己操作）。 2. Codex 封装了「插件」的概念，里面预设集成了不同的 MCP 和 Skill，点击添加，网页授权，搞定。用户完全不需要去关注什么是 MCP 或 Skill 这些对普通人来说的全新的抽象概念。 3. 再比如很多产品还在让用户自己决定是否启用搜索、思考，是高级思考还是普通思考... 这本质上是用脑力来弥补算力问题，而 OpenAI 则很早就支持了 Auto 的自动决策机制。

Jimmy Cheung

21,937 görüntüleme • 2 ay önce

马斯克称5年后，不再有手机和App。美国播客主持人乔·罗根，发布了与特斯拉CEO埃隆·马斯克的最新对谈视频。谈及对智能手机未来的看法时，马斯克提出了一个大胆预测：未来五到六年内，人类所消费的大多数内容都将由AI生成。马斯克认为，届时人们将不再使用传统意义上的手机，或是说现在被称为“手机”的设备，实质上会演变成AI推理的“边缘节点”。它仍会保留通信所需的无线电模块，但核心逻辑将转变为服务器端AI与设备端AI的实时互动，实时生成用户想看到的任何视频内容。他进一步指出，未来将不再需要操作系统或App的概念，设备只承担显示画面、播放音频等功能，同时尽可能深度集成AI能力。

马斯克称5年后，不再有手机和App。美国播客主持人乔·罗根，发布了与特斯拉CEO埃隆·马斯克的最新对谈视频。谈及对智能手机未来的看法时，马斯克提出了一个大胆预测：未来五到六年内，人类所消费的大多数内容都将由AI生成。马斯克认为，届时人们将不再使用传统意义上的手机，或是说现在被称为“手机”的设备，实质上会演变成AI推理的“边缘节点”。它仍会保留通信所需的无线电模块，但核心逻辑将转变为服务器端AI与设备端AI的实时互动，实时生成用户想看到的任何视频内容。他进一步指出，未来将不再需要操作系统或App的概念，设备只承担显示画面、播放音频等功能，同时尽可能深度集成AI能力。

总裁简报 CEO Briefing

55,404 görüntüleme • 7 ay önce

AI又有新气象……抓紧体验🔥 Google 悄悄发布了一个东西，可能比 Gemini App 更值得关注——AI Edge Gallery 它不是又一个 AI 聊天软件。本质上，它是一个本地 AI 运行平台：模型直接跑在手机芯片上，推理全程离线，数据不经过任何服务器。目前已支持 Gemma 3/4 系列模型，最新版本还加入了 Thinking Mode 和 Agent Skills——也就是说，手机本身可以完成多步骤任务推理，而不只是回答问题。 ▍实际能用来做什么？ ∙拍照提问、文档理解，完全本地处理 ∙没网络也能用的实时翻译、语音转写 ∙敏感文件分析，内容不出设备 ∙未来可能支持本地 Agent 自动完成任务流这件事真正的意义，不在于”又多了一个 AI App”——而在于 Google 正在验证一件事：AI 能不能成为每台 Android 手机的底层能力，而不是需要联网调用的云端服务？ ▍如果这条路跑通手机 AI 的竞争格局会重写。苹果有 Apple Intelligence，高通在推 AI PC，现在 Google 在 Android 端下这步棋。 ► 端侧 AI 的入口之争，已经开始了。

AI又有新气象……抓紧体验🔥 Google 悄悄发布了一个东西，可能比 Gemini App 更值得关注——AI Edge Gallery 它不是又一个 AI 聊天软件。本质上，它是一个本地 AI 运行平台：模型直接跑在手机芯片上，推理全程离线，数据不经过任何服务器。目前已支持 Gemma 3/4 系列模型，最新版本还加入了 Thinking Mode 和 Agent Skills——也就是说，手机本身可以完成多步骤任务推理，而不只是回答问题。 ▍实际能用来做什么？ ∙拍照提问、文档理解，完全本地处理 ∙没网络也能用的实时翻译、语音转写 ∙敏感文件分析，内容不出设备 ∙未来可能支持本地 Agent 自动完成任务流这件事真正的意义，不在于”又多了一个 AI App”——而在于 Google 正在验证一件事：AI 能不能成为每台 Android 手机的底层能力，而不是需要联网调用的云端服务？ ▍如果这条路跑通手机 AI 的竞争格局会重写。苹果有 Apple Intelligence，高通在推 AI PC，现在 Google 在 Android 端下这步棋。 ► 端侧 AI 的入口之争，已经开始了。

泥伏雷闯关记

76,426 görüntüleme • 2 ay önce

写自动化测试脚本或者写爬虫时，用传统的 Playwright 往往需要频繁维护各种元素选择器。一旦目标网页的结构发生微调，原有的脚本就容易直接报错罢工，维护起来颇为费神。最近在 GitHub 上看到到 HyperAgent 这个开源项目，巧妙地将 Playwright 与大模型结合在了一起。通过自然语言就能控制浏览器，完成复杂的自动化任务，不用再写一堆脆弱的选择器代码。 GitHub：支持单步操作，速度快成本低，以及能处理多步骤复杂任务，支持视觉理解和自适应调整。还内置动作缓存功能，录制一次工作流后可以反复回放，不需要每次都调用大语言模型。底层直接使用 Chrome 开发者工具协议，动作执行更精确，自动过滤广告框架，支持深层嵌套的 iframe 操作。同时支持云端扩展，可以通过 Hyperbrowser 快速扩展到数百个会话，还能连接 MCP 工具实现完整工作流。如果你正在用 Playwright 做自动化测试或数据采集，又厌倦了频繁维护选择器代码，这个项目值得一试。

写自动化测试脚本或者写爬虫时，用传统的 Playwright 往往需要频繁维护各种元素选择器。一旦目标网页的结构发生微调，原有的脚本就容易直接报错罢工，维护起来颇为费神。最近在 GitHub 上看到到 HyperAgent 这个开源项目，巧妙地将 Playwright 与大模型结合在了一起。通过自然语言就能控制浏览器，完成复杂的自动化任务，不用再写一堆脆弱的选择器代码。 GitHub：支持单步操作，速度快成本低，以及能处理多步骤复杂任务，支持视觉理解和自适应调整。还内置动作缓存功能，录制一次工作流后可以反复回放，不需要每次都调用大语言模型。底层直接使用 Chrome 开发者工具协议，动作执行更精确，自动过滤广告框架，支持深层嵌套的 iframe 操作。同时支持云端扩展，可以通过 Hyperbrowser 快速扩展到数百个会话，还能连接 MCP 工具实现完整工作流。如果你正在用 Playwright 做自动化测试或数据采集，又厌倦了频繁维护选择器代码，这个项目值得一试。

GitHubDaily

17,999 görüntüleme • 2 ay önce

可能这就是在线零售的未来。 8mb 的小文件（会变得更小），立即以 30fps 的速度开始流式传输。在移动设备和网络上完全互动。无需任何额外许可即可用于商业用途。网络正在迅速变得 3D 和交互。这是在 Luma 中捕获的您只需要手机上拍摄的视频即可制作这些 From：Nick St. Pierre

可能这就是在线零售的未来。 8mb 的小文件（会变得更小），立即以 30fps 的速度开始流式传输。在移动设备和网络上完全互动。无需任何额外许可即可用于商业用途。网络正在迅速变得 3D 和交互。这是在 Luma 中捕获的您只需要手机上拍摄的视频即可制作这些 From：Nick St. Pierre

AI Will

20,763 görüntüleme • 2 yıl önce

录制演示视频又一个新的免费方案，Openscreen，完全开源免费的软件软件是基于 Electron 的，功能其实和这个浏览器插件差不多，甚至界面也很像，支持Zoom（不过是目前是手动的），支持 annotations，trim。我试了一下，感觉还不错，大家有需求的可以用用看，有趣的是：作者由于付不起 Apple Developer Certificates，在 MacOS 上要运行一个命令才能使用。

录制演示视频又一个新的免费方案，Openscreen，完全开源免费的软件软件是基于 Electron 的，功能其实和这个浏览器插件差不多，甚至界面也很像，支持Zoom（不过是目前是手动的），支持 annotations，trim。我试了一下，感觉还不错，大家有需求的可以用用看，有趣的是：作者由于付不起 Apple Developer Certificates，在 MacOS 上要运行一个命令才能使用。

Viking

44,336 görüntüleme • 6 ay önce

字节跳动发布的 UI-TARS-desktop，是本地运行的桌面自动化代理。它可以使用任何桌面应用程序，打开文件，浏览网站，并自动执行任务，无需云连接。100% 开源。

字节跳动发布的 UI-TARS-desktop，是本地运行的桌面自动化代理。它可以使用任何桌面应用程序，打开文件，浏览网站，并自动执行任务，无需云连接。100% 开源。

KK.aWSB

207,941 görüntüleme • 5 ay önce

Claude有个很让人不爽的点！！每次新模型发布，官方非订阅用户连体验的资格都没有！！想起之前在 ZenMux 充了钱还没用完，登上去一看，没想到已经上架了Claude Fable 5 ，也算是第一时间体验上了这个“目前最强模型”。听说这模型死贵！！于是很慎重的用它跑了一个支付模块重构的任务！零代码基础，只能把之前Codex的输出给复制进去，任务要求比较复杂：保持原 API 兼容；拆出 PaymentRequested / PaymentSucceeded / PaymentFailed；补幂等，避免重复扣款；改状态机；更新单测；输出迁移风险； Fable 5 不算快，面对这个长任务，它做对了两件事：第一，先拆计划，再执行。它把兼容层、事件定义、状态机、handler、测试、回滚风险都列出来了。第二，最后主动自检。它自己指出：支付成功事件必须幂等；旧接口“返回成功”不再等于“扣款完成”，调用方文档要改。结果看起来，还是一如既往的稳！但是真的贵，就这么几分钟，直接跑了十多美金！！所以，我觉得要是家里没有矿，还是不要随便用Fable 5 ，根本不适合当常驻模型！感谢Zenmux让我体验了一下“宇宙最强”！虽然有点贵，但有时候相比价格，省心省力会更重要。比如多文件重构、复杂迁移、PR review、长链路 Agent workflow这些复杂任务，偶尔用用，还是可以的！最后说一下 Zenmux，它有个PK 模式我一直很喜欢，可以同屏对比多个模型输出、延迟和成本。现在刚好还有个限时的充值返赠活动：充 20 美元送 10 美元充 50 美元送 30 美元如果你想第一时间体验Claude Fable 5或者其他模型，现在就是下手的最好时间！

Claude有个很让人不爽的点！！每次新模型发布，官方非订阅用户连体验的资格都没有！！想起之前在 ZenMux 充了钱还没用完，登上去一看，没想到已经上架了Claude Fable 5 ，也算是第一时间体验上了这个“目前最强模型”。听说这模型死贵！！于是很慎重的用它跑了一个支付模块重构的任务！零代码基础，只能把之前Codex的输出给复制进去，任务要求比较复杂：保持原 API 兼容；拆出 PaymentRequested / PaymentSucceeded / PaymentFailed；补幂等，避免重复扣款；改状态机；更新单测；输出迁移风险； Fable 5 不算快，面对这个长任务，它做对了两件事：第一，先拆计划，再执行。它把兼容层、事件定义、状态机、handler、测试、回滚风险都列出来了。第二，最后主动自检。它自己指出：支付成功事件必须幂等；旧接口“返回成功”不再等于“扣款完成”，调用方文档要改。结果看起来，还是一如既往的稳！但是真的贵，就这么几分钟，直接跑了十多美金！！所以，我觉得要是家里没有矿，还是不要随便用Fable 5 ，根本不适合当常驻模型！感谢Zenmux让我体验了一下“宇宙最强”！虽然有点贵，但有时候相比价格，省心省力会更重要。比如多文件重构、复杂迁移、PR review、长链路 Agent workflow这些复杂任务，偶尔用用，还是可以的！最后说一下 Zenmux，它有个PK 模式我一直很喜欢，可以同屏对比多个模型输出、延迟和成本。现在刚好还有个限时的充值返赠活动：充 20 美元送 10 美元充 50 美元送 30 美元如果你想第一时间体验Claude Fable 5或者其他模型，现在就是下手的最好时间！

沐阳

14,736 görüntüleme • 9 gün önce

英伟达等刚刚推出了用于人形机器人的多功能神经网络全身控制器：HOVER 它首次实现了用统一控制器来处理，像机器人的导航、步行操控和桌面操控等多种不同类型任务，还能模仿人类动作，它模拟一年的训练量，只需50分钟它可以完成导航行走、物体操作、桌面作业、复杂动作的协调、人机交互任务等可以无缝切换不同控制模式，支持全身运动模仿学习项目：论文：

英伟达等刚刚推出了用于人形机器人的多功能神经网络全身控制器：HOVER 它首次实现了用统一控制器来处理，像机器人的导航、步行操控和桌面操控等多种不同类型任务，还能模仿人类动作，它模拟一年的训练量，只需50分钟它可以完成导航行走、物体操作、桌面作业、复杂动作的协调、人机交互任务等可以无缝切换不同控制模式，支持全身运动模仿学习项目：论文：

AIGCLINK

20,821 görüntüleme • 1 yıl önce

MiMo推出1000 Token/s超高速模型｜体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本，能够实现每秒输出超过 1,000 Token 的速度。同时，这应该也是全球第一个达到这个速度的万亿（1T）参数模型。藏师傅提前试了一下，做了三个测试，确实爽。第一个跑了一个比较复杂的 3D 采矿小游戏测试。在没有素材的情况下，我让它全部用 Three.js 前端代码来生成素材。整体要求比较完整，虽然第一次实践时出了一些小问题，但在跟他沟通修改建议后，非常完美地实现了任务。这次测试的各项指标如下：思考的 TPS：804 Token/s，峰值速度：810 Token/s，首次响应时间：4.71 秒。第二个测试给了一个官网，其头部包含一个相对复杂的 3D 动画。这次的输出速度快了非常多：峰值达到了 1426 Token/s，首次响应只用了 0.83 秒，在 32 秒内输出了 25624 个 Token，总计生成了 1000 行代码。第三个测试给了一个更复杂的官网。我要求这个官网的 Header 头部包含以下 3D 效果：地球边缘、轨道上的飞船、星际尘埃、航线图、舷窗的 HUD 样式。这个效果非常好，整体的视觉样式、状态、SVG 动画和驾驶卡片都非常精细，还有滚动的视差效果这个输出的 TPS 达到了 1136 tokens/s，首次响应是 4.5 秒官方测试平台下面有个数据展示，会显示相关信息在流式输出的情况下，当你看着它只用 20 秒就产生一个非常复杂的 3D 游戏时，那种场景还是比较震撼的之前的这些（比如说 Groq 之类的）超高速推理方案，在模型能力或者是整体水平上都会有所下降，但是 MiMo 这个在测试的时候，我没有看到这种迹象最近很多公司都开始推出这种超高速的 API 服务，比如之前 OpenAI 和 Anthropic 都有 Fast 模式在 Agent 场景下，模型输出效率的提升会直接带动每一步 Agent 操作的效率：如果一个任务预估一分钟完成，你就会盯着它直到结束，然后立刻投入测试。如果需要五分钟才完成，你可能就会去干别的事，然后再回来看，难免会浪费一些时间这种效率提升在 Sub-Agent 和并发场景下更加明显。因为它可以更快地产出大量结果，想象一下，如果同时启动一两百个 Sub-Agent，在模型能力没有衰减的前提下，速度提高 10 倍，体验是非常爽的毕竟这本质上是面向那种对效率有极高要求的 To B 客户所推出的希望后面大家卷起来，优化一下成本，让普通用户也能放开用这种 UltraSpeed 模型

MiMo推出1000 Token/s超高速模型｜体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本，能够实现每秒输出超过 1,000 Token 的速度。同时，这应该也是全球第一个达到这个速度的万亿（1T）参数模型。藏师傅提前试了一下，做了三个测试，确实爽。第一个跑了一个比较复杂的 3D 采矿小游戏测试。在没有素材的情况下，我让它全部用 Three.js 前端代码来生成素材。整体要求比较完整，虽然第一次实践时出了一些小问题，但在跟他沟通修改建议后，非常完美地实现了任务。这次测试的各项指标如下：思考的 TPS：804 Token/s，峰值速度：810 Token/s，首次响应时间：4.71 秒。第二个测试给了一个官网，其头部包含一个相对复杂的 3D 动画。这次的输出速度快了非常多：峰值达到了 1426 Token/s，首次响应只用了 0.83 秒，在 32 秒内输出了 25624 个 Token，总计生成了 1000 行代码。第三个测试给了一个更复杂的官网。我要求这个官网的 Header 头部包含以下 3D 效果：地球边缘、轨道上的飞船、星际尘埃、航线图、舷窗的 HUD 样式。这个效果非常好，整体的视觉样式、状态、SVG 动画和驾驶卡片都非常精细，还有滚动的视差效果这个输出的 TPS 达到了 1136 tokens/s，首次响应是 4.5 秒官方测试平台下面有个数据展示，会显示相关信息在流式输出的情况下，当你看着它只用 20 秒就产生一个非常复杂的 3D 游戏时，那种场景还是比较震撼的之前的这些（比如说 Groq 之类的）超高速推理方案，在模型能力或者是整体水平上都会有所下降，但是 MiMo 这个在测试的时候，我没有看到这种迹象最近很多公司都开始推出这种超高速的 API 服务，比如之前 OpenAI 和 Anthropic 都有 Fast 模式在 Agent 场景下，模型输出效率的提升会直接带动每一步 Agent 操作的效率：如果一个任务预估一分钟完成，你就会盯着它直到结束，然后立刻投入测试。如果需要五分钟才完成，你可能就会去干别的事，然后再回来看，难免会浪费一些时间这种效率提升在 Sub-Agent 和并发场景下更加明显。因为它可以更快地产出大量结果，想象一下，如果同时启动一两百个 Sub-Agent，在模型能力没有衰减的前提下，速度提高 10 倍，体验是非常爽的毕竟这本质上是面向那种对效率有极高要求的 To B 客户所推出的希望后面大家卷起来，优化一下成本，让普通用户也能放开用这种 UltraSpeed 模型

歸藏(guizang.ai)

26,223 görüntüleme • 10 gün önce

最近被 gpt 5.3 codex 不说人话搞的有点暴躁, 阅读体验贼差, 特别是读 plan 的 ..... 事无巨细 + 黑话频出我试过通过在 agents md 里写各种提示词来改善沟通, 但 codex 5.3 就是死活不听话接着我又想到一个很严肃的问题「我真的有必要去“阅读”事无巨细 + 黑话频出的plan 嘛? 输入 codex 和输出 codex 这个流程是不是都可以简单的优化一下? 我是不是可以找个小助手帮我解决? 我只看重点?」所以, 我火速试了一下在 openclaw 里面去调用 codex 来规划, 这里我用的是 MiniMax (official) 的 M2.5, 你可以选择你熟悉的模型, 把一些输入偏好和阅读偏好放入龙虾中, 比如我更希望用表格呈现. 用 openclaw tui 快速跑通流程, 如视频, 左侧是优化版本的 openclaw给我的报告, 右边是 codex 默认的报告. 下一步就可以接入飞书或者discord了.

最近被 gpt 5.3 codex 不说人话搞的有点暴躁, 阅读体验贼差, 特别是读 plan 的 ..... 事无巨细 + 黑话频出我试过通过在 agents md 里写各种提示词来改善沟通, 但 codex 5.3 就是死活不听话接着我又想到一个很严肃的问题「我真的有必要去“阅读”事无巨细 + 黑话频出的plan 嘛? 输入 codex 和输出 codex 这个流程是不是都可以简单的优化一下? 我是不是可以找个小助手帮我解决? 我只看重点?」所以, 我火速试了一下在 openclaw 里面去调用 codex 来规划, 这里我用的是 MiniMax (official) 的 M2.5, 你可以选择你熟悉的模型, 把一些输入偏好和阅读偏好放入龙虾中, 比如我更希望用表格呈现. 用 openclaw tui 快速跑通流程, 如视频, 左侧是优化版本的 openclaw给我的报告, 右边是 codex 默认的报告. 下一步就可以接入飞书或者discord了.

海拉鲁编程客

23,103 görüntüleme • 3 ay önce