Loading video...

Video Failed to Load

Go Home

DeepSeek V4 和 Opus 4.7的对比测试,一个很实用的场景,生成数学立体几何的3D演示。 很多学生缺乏三维想象空间,需要3D工具做辅助,我也做过一些调研,大部分的数学老师是用geogebra做立体几何的演示,但是这个工具用起来繁琐,做图的速度跟不上用量,如果能用AI生成,妥妥的生产力工具。 这次测试的平台依旧选择了ZenMux,目前ZenMux中的DeepSeek V4有免费的额度,必须蹭一波,直达链接 同样的提示词,在没有任何Skills的加持下,猜猜看哪个是DeepSeek V4,哪个是Opus 4.7?

13,315 views • 1 month ago •via X (Twitter)

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

【ZenMux 深度评测第二弹:AI 视频的“动线导演思维”】 在实际动作片拍摄中,动作导演和武指执行一镜到底的格逐戏前,会先设计完整的“动线”——角色从哪进、经哪些节点、在哪完成动作。路径定了,机位反而是被动推导出来的。控制的核心是动线,不是镜头。 用 AI 生成建筑跑酷或一镜到底也是同理。很多人直接在提示词里描述运镜,结果画面空间感混乱。正确解法是先建立动线(沿哪个立面跑、在哪腾空、落点是哪个平面),把空间路径描述清楚,AI 生成的运动才会有连贯的空间逻辑。 但怎么把这种抽象的“导演思维”翻译成 AI 听得懂的语言?这就涉及到一个高频痛点:不同的 AI 模型,对空间和镜头语言的“理解性格”完全不同。以前为了试一组跑酷动线 Prompt,要在 Claude、GPT、DeepSeek 之间来回切平台,切到思路断线,月底对账单也头大。 最近把这个动线测试工作流接进了 ZenMux,在同一个界面里直接调度和交叉实测,发现很有意思:Claude 的空间解构和节点拆分极专业;GPT-4o 对材质和光影的细腻润色拿来就能用;而 DeepSeek 成本极低,适合批量跑盲盒初筛。全程在一个入口搞定,后台额度清晰,还有智能路由和延迟赔付。真正干活和做内容交付的人,要的就是这种多模型调度的“确定性”和工作流“韧性”。降本增效不只是换个便宜模型,而是像导演一样,把不同的任务精准派发给最合适的工具。

波妞PONYO

11,352 views • 24 days ago

MiMo推出1000 Token/s超高速模型|体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本,能够实现每秒输出超过 1,000 Token 的速度。 同时,这应该也是全球第一个达到这个速度的万亿(1T)参数模型。 藏师傅提前试了一下,做了三个测试,确实爽。 第一个跑了一个比较复杂的 3D 采矿小游戏测试。在没有素材的情况下,我让它全部用 Three.js 前端代码来生成素材。整体要求比较完整,虽然第一次实践时出了一些小问题,但在跟他沟通修改建议后,非常完美地实现了任务。 这次测试的各项指标如下:思考的 TPS:804 Token/s,峰值速度:810 Token/s,首次响应时间:4.71 秒。 第二个测试给了一个官网,其头部包含一个相对复杂的 3D 动画。 这次的输出速度快了非常多:峰值达到了 1426 Token/s,首次响应只用了 0.83 秒,在 32 秒内输出了 25624 个 Token,总计生成了 1000 行代码。 第三个测试给了一个更复杂的官网。我要求这个官网的 Header 头部包含以下 3D 效果:地球边缘、轨道上的飞船、星际尘埃、航线图、舷窗的 HUD 样式。 这个效果非常好,整体的视觉样式、状态、SVG 动画和驾驶卡片都非常精细,还有滚动的视差效果 这个输出的 TPS 达到了 1136 tokens/s,首次响应是 4.5 秒 官方测试平台下面有个数据展示,会显示相关信息 在流式输出的情况下,当你看着它只用 20 秒就产生一个非常复杂的 3D 游戏时,那种场景还是比较震撼的 之前的这些(比如说 Groq 之类的)超高速推理方案,在模型能力或者是整体水平上都会有所下降,但是 MiMo 这个在测试的时候,我没有看到这种迹象 最近很多公司都开始推出这种超高速的 API 服务,比如之前 OpenAI 和 Anthropic 都有 Fast 模式 在 Agent 场景下,模型输出效率的提升会直接带动每一步 Agent 操作的效率: 如果一个任务预估一分钟完成,你就会盯着它直到结束,然后立刻投入测试。如果需要五分钟才完成,你可能就会去干别的事,然后再回来看,难免会浪费一些时间 这种效率提升在 Sub-Agent 和并发场景下更加明显。因为它可以更快地产出大量结果,想象一下,如果同时启动一两百个 Sub-Agent,在模型能力没有衰减的前提下,速度提高 10 倍,体验是非常爽的 毕竟这本质上是面向那种对效率有极高要求的 To B 客户所推出的 希望后面大家卷起来,优化一下成本,让普通用户也能放开用这种 UltraSpeed 模型

歸藏(guizang.ai)

26,223 views • 14 days ago