程序员鱼皮's banner
程序员鱼皮's profile picture

程序员鱼皮

@yupi99624,238 subscribers

专注 AI + 编程教育 | 编程导航站长 https://t.co/89dNxo4a3J ⭐️ 全网 200w 关注,独立开发→腾讯全栈→创业中 😈 项目狂魔,10+上线产品,GitHub 20k+ followers ❤️ 感谢关注,AI 资源获取 https://t.co/016as14C0T

Shorts

OpenAI 深夜放炸弹,GPT 5.4 来了!🤯 这次是真 “大一统” 了,推理、编程、操控电脑、搜索、百万 Token 上下文,一个模型全干了!之前得在不同模型之间反复横跳,现在一个 GPT 5.4 全搞定,恐怖的是每条线都拉到顶尖水平,几乎没有短板。 来看看跑分,SWE-Bench Pro 57.7% 编程登顶,FrontierMath 数学第一,ARC-AGI-2 抽象推理 83.3% 创下新高,把 Gemini 3.1 Pro 和 Opus 4.6 全踩脚下。幻觉率比 GPT-5.2 暴降 33%,工具搜索功能直接把 Token 消耗砍掉 47%,又准又省。 值得关注的是「原生操控电脑」能力,OSWorld-Verified 拿下 75% 成功率,超过了人类的 72.4%。也就是说,GPT 5.4 操作电脑比大部分人都熟练了😂 而且是真的能看截图,自己点鼠标键盘完成任务 实际工作能力的表现也很不错,在GDPval 测试里,GPT 5.4 拿了 83%,追平甚至超越行业专业人士!这个测试横跨 44 种职业,让 AI 真刀真枪交付成果,做 PPT、建 Excel 模型、写法律分析,也就是说 AI 干活比大多数打工人还靠谱了。 有意思的是,两天前 GPT 5.3 Instant 撞车 Gemini 3.1 同一天发布,算是给 GPT 5.4 铺路了,先出个日常对话版本,再放大招。 OpenAI 最近这波节奏很猛,短时间连发两个模型,明显是要把之前被 Claude 抢走的编程用户拉回来。 AI 模型的军备竞赛已经白热化了,你现在主力用的是哪个 AI 模型?打算换 GPT 5.4 试试吗?

OpenAI 深夜放炸弹,GPT 5.4 来了!🤯 这次是真 “大一统” 了,推理、编程、操控电脑、搜索、百万 Token 上下文,一个模型全干了!之前得在不同模型之间反复横跳,现在一个 GPT 5.4 全搞定,恐怖的是每条线都拉到顶尖水平,几乎没有短板。 来看看跑分,SWE-Bench Pro 57.7% 编程登顶,FrontierMath 数学第一,ARC-AGI-2 抽象推理 83.3% 创下新高,把 Gemini 3.1 Pro 和 Opus 4.6 全踩脚下。幻觉率比 GPT-5.2 暴降 33%,工具搜索功能直接把 Token 消耗砍掉 47%,又准又省。 值得关注的是「原生操控电脑」能力,OSWorld-Verified 拿下 75% 成功率,超过了人类的 72.4%。也就是说,GPT 5.4 操作电脑比大部分人都熟练了😂 而且是真的能看截图,自己点鼠标键盘完成任务 实际工作能力的表现也很不错,在GDPval 测试里,GPT 5.4 拿了 83%,追平甚至超越行业专业人士!这个测试横跨 44 种职业,让 AI 真刀真枪交付成果,做 PPT、建 Excel 模型、写法律分析,也就是说 AI 干活比大多数打工人还靠谱了。 有意思的是,两天前 GPT 5.3 Instant 撞车 Gemini 3.1 同一天发布,算是给 GPT 5.4 铺路了,先出个日常对话版本,再放大招。 OpenAI 最近这波节奏很猛,短时间连发两个模型,明显是要把之前被 Claude 抢走的编程用户拉回来。 AI 模型的军备竞赛已经白热化了,你现在主力用的是哪个 AI 模型?打算换 GPT 5.4 试试吗?

23,679 görüntüleme

Videos

2 分钟,教你国内爽用 Claude Code + Codex!保姆级教程 🫡
2:58

Sensitive content

This media may contain sensitive content.

Daha fazla içerik yok.