Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

19秒的视频--Codex 在 ChatGPT 手机 App 上使用 感受一下Codex的同步速度:手机发指令,电脑 Codex 实时执行、返回结果 发任务响应速度非常快,用来审核、review 输出特别好用 目前缺点是仅支持 macOS 设备(Windows 支持即将上线),作为预览版还存在一些 bug,比如同步不稳定、长线程加载卡顿、插件复杂任务仍需桌面端处理

18,862 görüntüleme • 1 ay önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

Claude有个很让人不爽的点!! 每次新模型发布,官方非订阅用户连体验的资格都没有!! 想起之前在 ZenMux 充了钱还没用完,登上去一看,没想到已经上架了Claude Fable 5 , 也算是第一时间体验上了这个“目前最强模型”。 听说这模型死贵!! 于是很慎重的用它跑了一个支付模块重构的任务! 零代码基础,只能把之前Codex的输出给复制进去, 任务要求比较复杂: 保持原 API 兼容; 拆出 PaymentRequested / PaymentSucceeded / PaymentFailed; 补幂等,避免重复扣款; 改状态机; 更新单测; 输出迁移风险; Fable 5 不算快,面对这个长任务,它做对了两件事: 第一,先拆计划,再执行。 它把兼容层、事件定义、状态机、handler、测试、回滚风险都列出来了。 第二,最后主动自检。 它自己指出:支付成功事件必须幂等;旧接口“返回成功”不再等于“扣款完成”,调用方文档要改。 结果看起来,还是一如既往的稳! 但是真的贵,就这么几分钟,直接跑了十多美金!! 所以,我觉得要是家里没有矿,还是不要随便用Fable 5 ,根本不适合当常驻模型! 感谢Zenmux让我体验了一下“宇宙最强”! 虽然有点贵,但有时候相比价格,省心省力会更重要。 比如多文件重构、复杂迁移、PR review、长链路 Agent workflow这些复杂任务,偶尔用用,还是可以的! 最后说一下 Zenmux,它有个PK 模式我一直很喜欢,可以同屏对比多个模型输出、延迟和成本。 现在刚好还有个限时的充值返赠活动: 充 20 美元送 10 美元 充 50 美元送 30 美元 如果你想第一时间体验Claude Fable 5或者其他模型,现在就是下手的最好时间!

沐阳

14,736 görüntüleme • 9 gün önce

MiMo推出1000 Token/s超高速模型|体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本,能够实现每秒输出超过 1,000 Token 的速度。 同时,这应该也是全球第一个达到这个速度的万亿(1T)参数模型。 藏师傅提前试了一下,做了三个测试,确实爽。 第一个跑了一个比较复杂的 3D 采矿小游戏测试。在没有素材的情况下,我让它全部用 Three.js 前端代码来生成素材。整体要求比较完整,虽然第一次实践时出了一些小问题,但在跟他沟通修改建议后,非常完美地实现了任务。 这次测试的各项指标如下:思考的 TPS:804 Token/s,峰值速度:810 Token/s,首次响应时间:4.71 秒。 第二个测试给了一个官网,其头部包含一个相对复杂的 3D 动画。 这次的输出速度快了非常多:峰值达到了 1426 Token/s,首次响应只用了 0.83 秒,在 32 秒内输出了 25624 个 Token,总计生成了 1000 行代码。 第三个测试给了一个更复杂的官网。我要求这个官网的 Header 头部包含以下 3D 效果:地球边缘、轨道上的飞船、星际尘埃、航线图、舷窗的 HUD 样式。 这个效果非常好,整体的视觉样式、状态、SVG 动画和驾驶卡片都非常精细,还有滚动的视差效果 这个输出的 TPS 达到了 1136 tokens/s,首次响应是 4.5 秒 官方测试平台下面有个数据展示,会显示相关信息 在流式输出的情况下,当你看着它只用 20 秒就产生一个非常复杂的 3D 游戏时,那种场景还是比较震撼的 之前的这些(比如说 Groq 之类的)超高速推理方案,在模型能力或者是整体水平上都会有所下降,但是 MiMo 这个在测试的时候,我没有看到这种迹象 最近很多公司都开始推出这种超高速的 API 服务,比如之前 OpenAI 和 Anthropic 都有 Fast 模式 在 Agent 场景下,模型输出效率的提升会直接带动每一步 Agent 操作的效率: 如果一个任务预估一分钟完成,你就会盯着它直到结束,然后立刻投入测试。如果需要五分钟才完成,你可能就会去干别的事,然后再回来看,难免会浪费一些时间 这种效率提升在 Sub-Agent 和并发场景下更加明显。因为它可以更快地产出大量结果,想象一下,如果同时启动一两百个 Sub-Agent,在模型能力没有衰减的前提下,速度提高 10 倍,体验是非常爽的 毕竟这本质上是面向那种对效率有极高要求的 To B 客户所推出的 希望后面大家卷起来,优化一下成本,让普通用户也能放开用这种 UltraSpeed 模型

歸藏(guizang.ai)

26,223 görüntüleme • 10 gün önce