Loading video...

Video Failed to Load

There was a problem loading this video. This could be due to a temporary network issue or the video might be unavailable.

这是一个 OpenAI 的 o1 模型编写网页游戏的案例，这个例子是编写一个找松鼠的游戏，屏幕上每秒钟增加一个🍓并且在跳动，你要控制一只🐨去躲草莓，等到3秒后，🐿️会出来，你要绕过🍓找到🐿️。这个游戏首先逻辑有一点复杂，另外是一个以前没出现过的游戏（如果我没记错的话），以前的模型可能是无法一次性生成可以运行的游戏代码。所以以前的模型在演示生成代码时，大多都是用一些贪吃蛇这种经典游戏来演示，毕竟代码都训练过，很容易就生成了。这里 o1 一次生成可以执行的结果，确实是不错的。生成游戏时的提示词：使用 pygame 制作一个名为“找松鼠”的游戏：每秒钟随机生成一个草莓，并在屏幕上弹跳。草莓的图标是 strawberry.png。如果草莓碰到你，你会死亡。三秒钟后，松鼠图标会生成并在屏幕上弹跳。松鼠的图标是 squirrel.png。如果你碰到它，你就赢了。 * 确保所有图标的大小为 10 像素乘 48 像素。 * 使用 resco colors 作为基础，在屏幕角落添加一个定时器。 * 在游戏开始前显示游戏说明。 * 当你赢或输时，游戏会自动重新开始。 * 在单人模式下完成游戏。

宝玉

232,465 subscribers

18,172 views • 1 year ago •via X (Twitter)

Science & Technology Gaming Education

Anya Rossi• Live Now

Private livecam show

15 Comments

宝玉1 year ago

小时候有么有做过一些逻辑智力题，类似于： "当公主的年龄是王子过去年龄的两倍时，公主的年龄等于她当前年龄与王子当前年龄之和的一半。公主和王子的年龄分别是多少？" 看看 GPT o1 能不能做出来！

宝玉1 year ago

量子物理学家马里奥•克莱恩（Mario Krenn）向 OpenAI 的 o1 模型提出一个关于特定的量子算符应用的问题，之前的模型，比如 GPT-4 很可能无法很好地完成这个任务。但是，与 GPT-4 的回答相比，o1 模型的回答提供了非常详细的数学推导，并且结果是正确的。

宝玉1 year ago

记得以前吴恩达老师讲大语言模型时，专门举了个例子说大语言模型不会数单词“strawberry”中字母“R”的个数，因为模型的处理单位是 Token 而不是单词或者字符，所以它无法正确数对有多少个“R”，大语言模型的设计目标是处理文本，而不是字符或单词。而新的 o1 模型是一个推理模型，内置推理能力的模型能在给出答案之前会先思考避免错误。

宝玉1 year ago

OpenAI 最新的 o1 模型写代码能力的演示，演示的是编写一个可视化 Transformer 中自注意力机制的交互效果网页，但最近看多了炫酷的代码演示，这个真的算不上效果多好。

宝玉1 year ago

一些简单的物理问题，对于人类来说，很简单，因为我们已经熟知了这个世界的运行规律，但是对于 AI 来说，要理解物理世界还很困难，而 o1 已经开始能通过推理，解决一些简单的物理问题，比如： “假设在地球上的物理定律下，一颗小草莓被放在一个普通的杯子里，然后杯子倒扣在桌子上。接着有人拿起杯子，那么草莓会在哪里？请解释推理过程。”

宝玉1 year ago

OpenAI o1 帮助医生收集整理患者信息，为疑难杂症的诊断提供帮助

宝玉1 year ago

让 OpenAI o1 写一个贪吃蛇的网页游戏，这不算什么，但是后面让它在网格中添加障碍物，并且障碍物的形状连在一起时 A I 两个字母，这确实有了一点智能的感觉。

宝玉1 year ago

OpenAI 这个 o1 的演示例子很不错，挑战了以前 LLM 的弱项：写符合特定要求的诗，比如：写一首关于松鼠和树袋熊踢足球的六行诗，且符合以下限制条件：第二行的最后一个单词应以字母“i”结尾。第三行的第二个单词应以“u”开头。第五行倒数第二个单词是“eucalyptus”（桉树），而最后一行的每个单词都有两个音节。这以前在 GPT-4o 是很难很难成功的，但是现在能做到了。

宝玉1 year ago

让 OpenAI o1 模型玩逻辑游戏数织，数织是一种逻辑游戏，以猜谜的方式绘画黑白位图。在一个网格中，每一行和列都有一组数，玩家需根据它们来填满或留空格子，最后就可以由此得出一幅图画。例如，“4 8 3”的意思就是指该行或列上有三条独立的线，分别占了4、8和3格，而每条线最少要由一个空格分开。传统上，玩家是以黑色填满格子，和以“×”号标记一定不需要填充的格子。数织是一个NP完全的问题，有较强的逻辑推理在里面，o1 可以解出并可视化的方式描述结果。

宝玉1 year ago

当年 Devin 号称是第一个 AI 软件工程，风头一时无两，不过自从出了几个演示视频后再没什么声音，最近倒是随着 o1 模型的发布跟着露了下脸，演示了如何让 Devin 写一个程序分析某条推文表达的情绪是什么，在调试过程中，AI 发现浏览器无法获取推文信息，就改成了 API 获取推文信息，能自己根据当时的场景做出决策，就像一个真正的工程师那样。 Devin 到现在还只是演示，也不知道实际如何，但是 Scott Wu 说的这句话倒是挺对的：“编程的核心一直都是将你的想法变为现实，现在你能够以比以往任何时候都更快、更清晰的方式去实现这个目标。”

宝玉1 year ago

据说通过在韩语字符中添加一些多余的不必要的辅音，就可以扭曲原意，让大语言模型无法识别，但是母语是韩语的人可以通过脑补轻松看懂，以前的模型例如 GPT-4o 无法解读这种“加密”扭曲过的韩文，但是现在 OpenAI 新的 o1 模型通过推理可以解密出来加密扭曲前的韩文。

宝玉1 year ago

这是 OpenAI o1 背后的团队一起制作的一个短小的视频，其中一个人提出了一个问题：“什么是推理呢？”，这真是个好问题，感觉似乎知道答案，又似乎不知道如何表达。但是他紧接着自己回复了这个问题：“一种理解推理的方式是，有时候我们会提出一些问题需要立即得到答案因为这些是简单的问题。例如，如果你问“意大利的首都是哪里？”，答案是罗马，几乎不需要多想。但如果你在思考一个复杂的难题，或者想写一份好的商业计划书，或者撰写一本小说，你可能需要花些时间去深入思考。而你花在思考上的时间越多，结果往往越好。因此，推理是一种将思考时间转化为更好结果的能力，不论你正在处理什么任务。” 简单来说就是推理意味着慢思考，区别于快思考马上给出答案，在得出结果之前要先自我反思质疑。这可能就是 o1 和以往模型的核心区别，以前 GPT-4，除非你额外要求，默认是马上给出答案，并不会去自我反思自我质疑的。另外他们还分享了做研究中的“啊哈”时刻，就是那种灵光一现顿悟的时刻，突然发生了意想不到的突破，让一切突然变得明了。不知道 AI 是不是将来也会自己产生 “啊哈” 时刻，突然觉醒统治人类😄

linear uncle1 year ago

说实话这个例子很一般，目前的coding agent都能搞定，我用claude dev agent在本地用claude 3.5 sonnect模型本地实测了一下，也一次性正确生成结果（考拉图片我懒得替换了）。

JieJieCat1 year ago

啥时候表演个30年前的俄罗斯方块

OSDev1 year ago

rst @readwise save thread

Related Videos

不是，这就搞定了一个内容实时生成的AI漫剧游戏嘛？灵感来自向阳乔木和 Roi，可以将任何剧本生成类似于 Galagame 的游戏。有TTS阅读对话，同时呢还会自动生成背景图，自动生成每个角色的人物立绘。感觉这玩意儿都能直接做一个产品了，我操。你有剧情，你就可以生成对应的漫剧或者是对话游戏。

不是，这就搞定了一个内容实时生成的AI漫剧游戏嘛？灵感来自向阳乔木和 Roi，可以将任何剧本生成类似于 Galagame 的游戏。有TTS阅读对话，同时呢还会自动生成背景图，自动生成每个角色的人物立绘。感觉这玩意儿都能直接做一个产品了，我操。你有剧情，你就可以生成对应的漫剧或者是对话游戏。

歸藏(guizang.ai)

69,001 views • 8 months ago

Kimi-K2.6 前端/后端/Agent编程能力实测! 甚至还帮我做了个游戏! 给大家带来刚刚正式发布的 kimi-k2.6 的正式版本的实测! 本次为了考验它的长程Agentic Coding能力, 我用 kimi-k2.6-code-preview 写了个 harness 游戏自动生成框架, 它可以根据给到的人设/场景/数值设计等规则, 自动生成关卡, 背景图片, 甚至配音! 其中框架驱动和草稿模型使用 kimi-k2.6, 文生图和生成语音由 kimi-k2.6 生成 prompt 后调用其它大模型生成. 最好玩的是, 我做了个"无头"版本的游戏cli接口, kimi-k2.6 能像玩互联网早期Mud游戏一样, 使用纯文本玩这个游戏, 每当它生成关卡之后, 他就可以直接进入游戏游玩一下, 来验证关卡设计得是否正确. 而内部设计又分为了对话生成skill, 脚本生成skill, 关卡生成skill, 游戏测试大师skill, 游戏资深玩家skill(由于检讨游戏性) 等等, 从而实现了让大模型自己写游戏自己玩! 每个关卡大概需要一个小时生成和验证, 如果并行验证应该还能更快一些(做多线程BFS/DFS). 另外本次依旧使用大家都熟悉的测试项目进行了前端/后端/Agent能力测试, 从测试来看, 复杂项目前端能力(建模, 空间理解, 物理模拟等)略有下降, 但后端和 Agent 能力有明显提升. 不过如果你是纯做网站的话, 可以用 kimi 网站上的的 k2.6 Agent 模式, 由于 Agent 能力足够强所以可以在这个模式下多步来提升生成的网站质量和交互体验. #kimi #kimik26 #moonshot #月之暗面 #kimicli

Kimi-K2.6 前端/后端/Agent编程能力实测! 甚至还帮我做了个游戏! 给大家带来刚刚正式发布的 kimi-k2.6 的正式版本的实测! 本次为了考验它的长程Agentic Coding能力, 我用 kimi-k2.6-code-preview 写了个 harness 游戏自动生成框架, 它可以根据给到的人设/场景/数值设计等规则, 自动生成关卡, 背景图片, 甚至配音! 其中框架驱动和草稿模型使用 kimi-k2.6, 文生图和生成语音由 kimi-k2.6 生成 prompt 后调用其它大模型生成. 最好玩的是, 我做了个"无头"版本的游戏cli接口, kimi-k2.6 能像玩互联网早期Mud游戏一样, 使用纯文本玩这个游戏, 每当它生成关卡之后, 他就可以直接进入游戏游玩一下, 来验证关卡设计得是否正确. 而内部设计又分为了对话生成skill, 脚本生成skill, 关卡生成skill, 游戏测试大师skill, 游戏资深玩家skill(由于检讨游戏性) 等等, 从而实现了让大模型自己写游戏自己玩! 每个关卡大概需要一个小时生成和验证, 如果并行验证应该还能更快一些(做多线程BFS/DFS). 另外本次依旧使用大家都熟悉的测试项目进行了前端/后端/Agent能力测试, 从测试来看, 复杂项目前端能力(建模, 空间理解, 物理模拟等)略有下降, 但后端和 Agent 能力有明显提升. 不过如果你是纯做网站的话, 可以用 kimi 网站上的的 k2.6 Agent 模式, 由于 Agent 能力足够强所以可以在这个模式下多步来提升生成的网站质量和交互体验. #kimi #kimik26 #moonshot #月之暗面 #kimicli

karminski-牙医

40,013 views • 3 months ago

GPT-5.4 太惊艳了👑 一句生成一个战斗机射击的网页游戏的提示词，就完成的如此酷炫，关键是生成的还只是一个代码不到100行的网页，震撼！！！

GPT-5.4 太惊艳了👑 一句生成一个战斗机射击的网页游戏的提示词，就完成的如此酷炫，关键是生成的还只是一个代码不到100行的网页，震撼！！！

老张来了

104,944 views • 4 months ago

这个AI生成像素画的看着不错，让草图、线稿都可以轻松变成像素插画。很多功能都是为像素游戏量身定制的。

这个AI生成像素画的看着不错，让草图、线稿都可以轻松变成像素插画。很多功能都是为像素游戏量身定制的。

宝玉

130,528 views • 3 years ago

游戏代打也要失业了? 来看 NVIDIA NitroGen NVIDIA 刚刚又发了个新模型 NitroGen，这是个只有 1B 大小却可以玩游戏的大模型，它接受视频帧输入，然后输出手柄操作。所以非常适合用来玩手柄可以操作的动作类游戏。这个模型最大的特点是，它是基于游戏视频本身学习的，以往互联网上虽然有很多游戏视频，但是游戏操作并没有记录下来，而 NitroGen 它利用了合成动作标签技术。研究团队通过大规模的逆动力学模型，从公开的互联网游戏视频中“反推”出当时玩家可能按下的键，从而人工合成了海量的训练数据，通过上万小时的纯视频数据进行预训练，打破了数据瓶颈。而且最重要的是，这个模型支持后训练。这意味着面对一款它从未见过的全新游戏不需要从头训练，只需少量的微调或适配即可上手游玩。

游戏代打也要失业了? 来看 NVIDIA NitroGen NVIDIA 刚刚又发了个新模型 NitroGen，这是个只有 1B 大小却可以玩游戏的大模型，它接受视频帧输入，然后输出手柄操作。所以非常适合用来玩手柄可以操作的动作类游戏。这个模型最大的特点是，它是基于游戏视频本身学习的，以往互联网上虽然有很多游戏视频，但是游戏操作并没有记录下来，而 NitroGen 它利用了合成动作标签技术。研究团队通过大规模的逆动力学模型，从公开的互联网游戏视频中“反推”出当时玩家可能按下的键，从而人工合成了海量的训练数据，通过上万小时的纯视频数据进行预训练，打破了数据瓶颈。而且最重要的是，这个模型支持后训练。这意味着面对一款它从未见过的全新游戏不需要从头训练，只需少量的微调或适配即可上手游玩。

karminski-牙医

103,416 views • 7 months ago

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

karminski-牙医

35,854 views • 7 months ago

试了好多Web3游戏,大多都只是包装了个链上噱头,游戏性基本为零。不过最近发现一个叫BOSS FIGHTERS ⚡️ $BFTOKEN,真的让我眼前一亮! 这是一个在Open Loot平台上的PvP对战游戏,你可以选择成为Boss或者Fighter。VR模式简直让人上头,感觉整个人都身临其境了。操作手感很扎实,战斗节奏快而不乱,每场对决都紧张刺激。游戏本身在Web2平台就做得不错,现在趁着Web3东风起来感觉前景很不错。通过$OL代币经济模型的加持,让游戏体验和收益都得到了提升。难得遇到一个把重心放在游戏性上的Web3项目,值得关注。🎮 #GameFi #Web3Gaming #VR #P2E #BOSSFIGHTERS #PVP #区块链游戏

试了好多Web3游戏,大多都只是包装了个链上噱头,游戏性基本为零。不过最近发现一个叫BOSS FIGHTERS ⚡️ $BFTOKEN,真的让我眼前一亮! 这是一个在Open Loot平台上的PvP对战游戏,你可以选择成为Boss或者Fighter。VR模式简直让人上头,感觉整个人都身临其境了。操作手感很扎实,战斗节奏快而不乱,每场对决都紧张刺激。游戏本身在Web2平台就做得不错,现在趁着Web3东风起来感觉前景很不错。通过$OL代币经济模型的加持,让游戏体验和收益都得到了提升。难得遇到一个把重心放在游戏性上的Web3项目,值得关注。🎮 #GameFi #Web3Gaming #VR #P2E #BOSSFIGHTERS #PVP #区块链游戏

加密旺哥🧩 $BARD

36,340 views • 1 year ago

我花了几十个小时，用 Claude 做出一个能开车、飞行、打架、闯进室内的开放世界游戏。。。然后差点干了这个项目里最蠢的一件事：把几十小时的开发、踩坑和工作流，压成一份 29–68 元的游戏，直接卖给玩家。。。后来，我把同一个项目拆成 4 种完全不同的生意： 1. 直接卖游戏 2. 卖源码、制作工作流和可二开资产 3. 免费 Demo / 部分开源，用来给社群和咨询引流 4. 给品牌做定制小游戏再丢给 Atypica atypica.AI 里的 14 个 AI 模拟用户，让不同职业、预算和需求的人分别替我“买”一次。结果第一轮 5 个人里，4 个人首选第 2 种；第二轮又测了 9 个人，源码和工作流依然排在第一。理由很扎心：买游戏，他们会直接拿我和成熟商业游戏比较；买源码和工作流，他们买的是少踩几周坑，拿到一套能运行、能修改、能二开的东西。同一个项目：游戏本体，模拟用户愿意讨论的是 29–68 元；换成源码、工作流和资产包，变成 299–699 元；如果做 B 端品牌定制，测试报价直接从 5,000 元起。我以为自己在做游戏，结果这个项目里真正值钱的，可能是造游戏的“铲子”。我原本打开 Atypica atypica.AI，只想问：“这个游戏应该卖多少钱？” 它最后逼我重新回答的却是： “我真正该卖的，到底是游戏、源码、工作流，还是做出下一款游戏的能力？” 我最推荐 Atypica atypica.AI 的一点，不是它能生成一份报告，而是这些模拟用户不会在调研结束后消失，会沉淀成一支可以反复调用的 Panel。这次测卖什么，下次还能继续测价格、文案、渠道和海外市场。相当于给每个一人公司配了一支常驻焦点小组。这不只适用于游戏。App、独立站商品、课程、社群、咨询或任何 AI 产品，都可以在真正投入时间和钱之前，先让一批模拟用户替你“买”一次。模拟研究不是实际成交，也代替不了真实市场验证。但它至少能在你埋头干几个月之前先告诉你：你可能从一开始，就卖错了东西。免费体验链接，注册即送10000积分👉：

我花了几十个小时，用 Claude 做出一个能开车、飞行、打架、闯进室内的开放世界游戏。。。然后差点干了这个项目里最蠢的一件事：把几十小时的开发、踩坑和工作流，压成一份 29–68 元的游戏，直接卖给玩家。。。后来，我把同一个项目拆成 4 种完全不同的生意： 1. 直接卖游戏 2. 卖源码、制作工作流和可二开资产 3. 免费 Demo / 部分开源，用来给社群和咨询引流 4. 给品牌做定制小游戏再丢给 Atypica atypica.AI 里的 14 个 AI 模拟用户，让不同职业、预算和需求的人分别替我“买”一次。结果第一轮 5 个人里，4 个人首选第 2 种；第二轮又测了 9 个人，源码和工作流依然排在第一。理由很扎心：买游戏，他们会直接拿我和成熟商业游戏比较；买源码和工作流，他们买的是少踩几周坑，拿到一套能运行、能修改、能二开的东西。同一个项目：游戏本体，模拟用户愿意讨论的是 29–68 元；换成源码、工作流和资产包，变成 299–699 元；如果做 B 端品牌定制，测试报价直接从 5,000 元起。我以为自己在做游戏，结果这个项目里真正值钱的，可能是造游戏的“铲子”。我原本打开 Atypica atypica.AI，只想问：“这个游戏应该卖多少钱？” 它最后逼我重新回答的却是： “我真正该卖的，到底是游戏、源码、工作流，还是做出下一款游戏的能力？” 我最推荐 Atypica atypica.AI 的一点，不是它能生成一份报告，而是这些模拟用户不会在调研结束后消失，会沉淀成一支可以反复调用的 Panel。这次测卖什么，下次还能继续测价格、文案、渠道和海外市场。相当于给每个一人公司配了一支常驻焦点小组。这不只适用于游戏。App、独立站商品、课程、社群、咨询或任何 AI 产品，都可以在真正投入时间和钱之前，先让一批模拟用户替你“买”一次。模拟研究不是实际成交，也代替不了真实市场验证。但它至少能在你埋头干几个月之前先告诉你：你可能从一开始，就卖错了东西。免费体验链接，注册即送10000积分👉：

Rion Wu

14,534 views • 2 days ago

有没有一天能打4个小时游戏的人来给我说一说，游戏到底为什么这么让你着迷？我玩游戏只会去解析他的玩法，然后这游戏的玩法一旦被我了解清楚了，那么我就开始腻了，就坚持不下去了。

有没有一天能打4个小时游戏的人来给我说一说，游戏到底为什么这么让你着迷？我玩游戏只会去解析他的玩法，然后这游戏的玩法一旦被我了解清楚了，那么我就开始腻了，就坚持不下去了。

DarkEye 👁

13,151 views • 3 years ago

用 Lovart 手搓《老友记》像素小游戏！一直想自己做游戏，感觉在 AI 时代，应该会是触手可及的事情。刚好收到了 Lovart 的内测邀请，决定今天上午试试看！做了一个《老友记》粉丝向的像素小游戏 demo，大概游戏设定是在 Monica 在家里打扫，会不断找到其他人的小物品，包括 Phoebe 的吉他、Rachel 的杂志、Joey 的三明治等等。其中所有的素材都让 Lovart 一次性批量生成，包括：Monica 公寓地图、六个角色的像素版本、以及六个角色各自的小道具。我的感觉是 Lovart 批量生成的素材画风都很统一，非常适合快速做一些简单的游戏素材。然后将这些素材导进游戏引擎 Godot 里进行设置，很快就做好了这个游戏 demo~ （之前我从来没有用过 Godot, 也是 Claude 教我怎么用的哈哈哈。) 整个过程也就今天一天的时间。希望今年能做出完整版给大家玩！【戳评论区看过程素材~】

用 Lovart 手搓《老友记》像素小游戏！一直想自己做游戏，感觉在 AI 时代，应该会是触手可及的事情。刚好收到了 Lovart 的内测邀请，决定今天上午试试看！做了一个《老友记》粉丝向的像素小游戏 demo，大概游戏设定是在 Monica 在家里打扫，会不断找到其他人的小物品，包括 Phoebe 的吉他、Rachel 的杂志、Joey 的三明治等等。其中所有的素材都让 Lovart 一次性批量生成，包括：Monica 公寓地图、六个角色的像素版本、以及六个角色各自的小道具。我的感觉是 Lovart 批量生成的素材画风都很统一，非常适合快速做一些简单的游戏素材。然后将这些素材导进游戏引擎 Godot 里进行设置，很快就做好了这个游戏 demo~ （之前我从来没有用过 Godot, 也是 Claude 教我怎么用的哈哈哈。) 整个过程也就今天一天的时间。希望今年能做出完整版给大家玩！【戳评论区看过程素材~】

Ring Hyacinth

54,650 views • 1 year ago

这次我用 Qwen3.8-Max 完成了三个代码项目，其中最直观的是一个类似《我的世界》的网页游戏。游戏已经具备完整的可玩性：角色可以移动、跳跃和探索地图，也可以挖掘、放置方块、切换物品，并使用背包与合成系统。地形能够自动生成，基础的生存机制也已经实现。另外两个项目分别是可交互的 3D AI 芯片展示，以及读取19个真实来源的多模态供应商评审系统。 Qwen3.8-Max 还是个开源模型，国产模型真是越来越强了。

这次我用 Qwen3.8-Max 完成了三个代码项目，其中最直观的是一个类似《我的世界》的网页游戏。游戏已经具备完整的可玩性：角色可以移动、跳跃和探索地图，也可以挖掘、放置方块、切换物品，并使用背包与合成系统。地形能够自动生成，基础的生存机制也已经实现。另外两个项目分别是可交互的 3D AI 芯片展示，以及读取19个真实来源的多模态供应商评审系统。 Qwen3.8-Max 还是个开源模型，国产模型真是越来越强了。

雪踏乌云

68,246 views • 10 days ago

可交互游戏生成模型 GameGen-X 发布！！能够生成非常高质量的可以操作的游戏画面。 DiT 视频模型就是新的游戏引擎！模型创建角色、提供动态环境、复杂动作和多样化事件。 Epic CEO 看到 Oasis 实时生成游戏的时候就急了，直接开骂。红杉合伙人说再过五年看看，现在来看可能不需要 5 年。

可交互游戏生成模型 GameGen-X 发布！！能够生成非常高质量的可以操作的游戏画面。 DiT 视频模型就是新的游戏引擎！模型创建角色、提供动态环境、复杂动作和多样化事件。 Epic CEO 看到 Oasis 实时生成游戏的时候就急了，直接开骂。红杉合伙人说再过五年看看，现在来看可能不需要 5 年。

歸藏(guizang.ai)

13,421 views • 1 year ago

《黑神话：悟空》周二（8月20日）上线。这款高成本游戏在中国引发了游戏行业多年未见的轰动。这款以中国经典小说《西游记》为蓝本的游戏上线首日在数字游戏商店Steam的同时在线玩家数突破220万人，成为该平台史上第二受欢迎的游戏。该游戏也为中国动荡的游戏产业带来提振。过去几年，政府将游戏形容为“精神鸦片”，要求严格限制未成年人玩游戏的时间，并一度冻结了游戏版号的发放。

《黑神话：悟空》周二（8月20日）上线。这款高成本游戏在中国引发了游戏行业多年未见的轰动。这款以中国经典小说《西游记》为蓝本的游戏上线首日在数字游戏商店Steam的同时在线玩家数突破220万人，成为该平台史上第二受欢迎的游戏。该游戏也为中国动荡的游戏产业带来提振。过去几年，政府将游戏形容为“精神鸦片”，要求严格限制未成年人玩游戏的时间，并一度冻结了游戏版号的发放。

BBC News 中文

306,730 views • 1 year ago

这两天Claude Fable 5 不是回归了吗一直想重新测试一下它的功能看看它长任务的解决能力，所以我直接丢了一个要求：做一款完整的中文网页游戏《韭菜修仙：牛市生存模拟器》参考《吸血鬼幸存者》的割草玩法，但世界观全部换成 Crypto： FUD Rug Pull 巨鲸熊市黑客爆仓升级还能解锁： BTC 信仰 ETH Buff AI Agent Diamond Hands 整个游戏生成完成之后，我自己玩了十几分钟。说实话，比我预期还上头😂 —--- 更让我意外的，其实不是游戏。而是我突然意识到一件事。以前总觉得这种割草小游戏开发成本应该很高。但 AI 把整个流程跑完之后，我发现：真正复杂的并不是玩法。而是素材、美术、数值和平衡。如果把现在游戏里的这些方块、小卡片，全部替换成角色、NFT、链上资产或者项目 IP，其实就是另外一款游戏了。甚至完全可以做成： ✅ 链上交互小游戏 ✅ NFT 活动小游戏 ✅ 项目方任务游戏 ✅ Web2 爽游玩法几乎不用推倒重来。 AI 已经把最难的那部分搭好了。 —--- 这次整个任务也确实挺"重"。最终消耗： 📥 Input：33,603 Tokens 📤 Output：33,412 Tokens （大概是在2U左右）基本相当于让模型完整规划、设计并生成了一整个小游戏。也难怪大家都说 Fable 5 更适合这种长任务。 —--- 这次我没有去官方 Claude 跑，而是在 ZenMux 上体验的 Claude Fable 5 原因也很简单： Free 层就能直接体验 Fable 5 PAYG 账户只要 Credits > 0，就可以调用 claude-fable-5-free 后面如果想横向测试，还能直接切 PK 模式，同时对比 GPT-5.5、Opus 4.8、Gemini 等多个模型，不用来回切平台另外，现在 ZenMux 的 Auto Top-up 活动还在进行中（到 7 月 15 日），自动充值每笔还能额外赠送 20% 余额（最高可多获得 $300 额度）我下一步准备试一个更大的任务不是做游戏而是看看 Claude Fable 5 能不能直接帮我完成一个完整的 Web3 小产品。如果效果不错，再来分享全过程

这两天Claude Fable 5 不是回归了吗一直想重新测试一下它的功能看看它长任务的解决能力，所以我直接丢了一个要求：做一款完整的中文网页游戏《韭菜修仙：牛市生存模拟器》参考《吸血鬼幸存者》的割草玩法，但世界观全部换成 Crypto： FUD Rug Pull 巨鲸熊市黑客爆仓升级还能解锁： BTC 信仰 ETH Buff AI Agent Diamond Hands 整个游戏生成完成之后，我自己玩了十几分钟。说实话，比我预期还上头😂 —--- 更让我意外的，其实不是游戏。而是我突然意识到一件事。以前总觉得这种割草小游戏开发成本应该很高。但 AI 把整个流程跑完之后，我发现：真正复杂的并不是玩法。而是素材、美术、数值和平衡。如果把现在游戏里的这些方块、小卡片，全部替换成角色、NFT、链上资产或者项目 IP，其实就是另外一款游戏了。甚至完全可以做成： ✅ 链上交互小游戏 ✅ NFT 活动小游戏 ✅ 项目方任务游戏 ✅ Web2 爽游玩法几乎不用推倒重来。 AI 已经把最难的那部分搭好了。 —--- 这次整个任务也确实挺"重"。最终消耗： 📥 Input：33,603 Tokens 📤 Output：33,412 Tokens （大概是在2U左右）基本相当于让模型完整规划、设计并生成了一整个小游戏。也难怪大家都说 Fable 5 更适合这种长任务。 —--- 这次我没有去官方 Claude 跑，而是在 ZenMux 上体验的 Claude Fable 5 原因也很简单： Free 层就能直接体验 Fable 5 PAYG 账户只要 Credits > 0，就可以调用 claude-fable-5-free 后面如果想横向测试，还能直接切 PK 模式，同时对比 GPT-5.5、Opus 4.8、Gemini 等多个模型，不用来回切平台另外，现在 ZenMux 的 Auto Top-up 活动还在进行中（到 7 月 15 日），自动充值每笔还能额外赠送 20% 余额（最高可多获得 $300 额度）我下一步准备试一个更大的任务不是做游戏而是看看 Claude Fable 5 能不能直接帮我完成一个完整的 Web3 小产品。如果效果不错，再来分享全过程

小森🔶BNB

29,727 views • 27 days ago

OpenAI 在 Codex App 的官方介绍里，提供了一个游戏案例，只花了 700 万 Token，效果相当惊艳。我上周也曾经试图用 AI 做过一个赛车游戏，结果当然是一塌糊涂。可能是我提示词写的不对吧，这是 OpenAI 提供的开发过程和使用的提示词：我们要求 Codex 制作一款赛车游戏，配备不同的赛车手、八张地图，甚至还有玩家可以通过空格键使用的道具。使用由 GPT 图像驱动的图像生成技能⁠（在新窗口中打开）和网页游戏开发技能⁠（在新窗口中打开），Codex 仅凭一个初始用户提示，便独立使用超过 700 万个 Token 构建了这款游戏。它承担了设计师、游戏开发者和 QA 测试员的角色，通过实际玩游戏来验证其工作。这款游戏由 Codex 使用 imagen 和 develop-web-game 技能创建，基于以下初始提示（为清晰起见，已加以整理）：使用 Three.js 将 Voxel Velocity 实现为一款 3D 体素风卡丁车竞速游戏，且仅包含一个模式：单场比赛（始终为 3 圈、1 名玩家对战 7 名 CPU，8 条赛道全部立即解锁，无进度系统）。构建最简赛前流程，仅包含：赛道（8 条）、角色（8 个）、难度（轻松/标准/困难）、可选镜像模式、可选允许角色重复，以及开始比赛 (Start Race)。同时提供一个选项菜单和比赛中的暂停菜单（继续/重新开始/退出）。创建一个街机驾驶模型，具备灵敏的操控、对擦碰墙面的宽容判定、以有意义的漂移作为主要技能，并提供一个漂移蓄力系统，可生成精确的加速等级（一级 0.7 秒、二级 1.1 秒、三级 1.5 秒）。基础速度需保持“快速但易读”，并在宽阔道路上维持稳定的车群超车节奏。精确实现 8 种道具，单格道具栏，带轻微的名次加权分配，效果温和（最大失控 ≤1.2 秒、最大转向禁用 ≤0.6 秒），营造轻松混乱但无硬性眩晕。同时加入越野减速，并在加速状态下将越野减速幅度降低 50%。定义 8 名角色的既定属性与 AI 行为倾向，实现 CPU 难度预设、赛道作者定义的竞速/变化样条、漂移区与危险规避逻辑，使 AI 能利用多车道宽度进行干净的超车。并提供 HUD/音频基础功能：名次、圈数/最终圈提示、迷你地图、道具槽、计时/分段、清晰可读的音效 (SFX)，以及每条赛道一段循环音乐。然后，从包含十条通用提示的随机列表中不断向 Codex 重新提示，以便其继续解决问题。以下是其中一条提示的示例：你的任务是添加新功能，使游戏更接近原版。首先，玩一下游戏，找出与原版相比缺少了什么。然后选择几个缺失的功能并实现它们。在每个功能完成后，务必通过玩游戏来彻底测试并确认其工作正常。如果你在游玩时发现任何漏洞，请优先修复它们。文章地址：

OpenAI 在 Codex App 的官方介绍里，提供了一个游戏案例，只花了 700 万 Token，效果相当惊艳。我上周也曾经试图用 AI 做过一个赛车游戏，结果当然是一塌糊涂。可能是我提示词写的不对吧，这是 OpenAI 提供的开发过程和使用的提示词：我们要求 Codex 制作一款赛车游戏，配备不同的赛车手、八张地图，甚至还有玩家可以通过空格键使用的道具。使用由 GPT 图像驱动的图像生成技能⁠（在新窗口中打开）和网页游戏开发技能⁠（在新窗口中打开），Codex 仅凭一个初始用户提示，便独立使用超过 700 万个 Token 构建了这款游戏。它承担了设计师、游戏开发者和 QA 测试员的角色，通过实际玩游戏来验证其工作。这款游戏由 Codex 使用 imagen 和 develop-web-game 技能创建，基于以下初始提示（为清晰起见，已加以整理）：使用 Three.js 将 Voxel Velocity 实现为一款 3D 体素风卡丁车竞速游戏，且仅包含一个模式：单场比赛（始终为 3 圈、1 名玩家对战 7 名 CPU，8 条赛道全部立即解锁，无进度系统）。构建最简赛前流程，仅包含：赛道（8 条）、角色（8 个）、难度（轻松/标准/困难）、可选镜像模式、可选允许角色重复，以及开始比赛 (Start Race)。同时提供一个选项菜单和比赛中的暂停菜单（继续/重新开始/退出）。创建一个街机驾驶模型，具备灵敏的操控、对擦碰墙面的宽容判定、以有意义的漂移作为主要技能，并提供一个漂移蓄力系统，可生成精确的加速等级（一级 0.7 秒、二级 1.1 秒、三级 1.5 秒）。基础速度需保持“快速但易读”，并在宽阔道路上维持稳定的车群超车节奏。精确实现 8 种道具，单格道具栏，带轻微的名次加权分配，效果温和（最大失控 ≤1.2 秒、最大转向禁用 ≤0.6 秒），营造轻松混乱但无硬性眩晕。同时加入越野减速，并在加速状态下将越野减速幅度降低 50%。定义 8 名角色的既定属性与 AI 行为倾向，实现 CPU 难度预设、赛道作者定义的竞速/变化样条、漂移区与危险规避逻辑，使 AI 能利用多车道宽度进行干净的超车。并提供 HUD/音频基础功能：名次、圈数/最终圈提示、迷你地图、道具槽、计时/分段、清晰可读的音效 (SFX)，以及每条赛道一段循环音乐。然后，从包含十条通用提示的随机列表中不断向 Codex 重新提示，以便其继续解决问题。以下是其中一条提示的示例：你的任务是添加新功能，使游戏更接近原版。首先，玩一下游戏，找出与原版相比缺少了什么。然后选择几个缺失的功能并实现它们。在每个功能完成后，务必通过玩游戏来彻底测试并确认其工作正常。如果你在游玩时发现任何漏洞，请优先修复它们。文章地址：

周尔复

58,601 views • 5 months ago

🔥马斯克表示xAI将大规模投入电子游戏开发，生成照片级逼真游戏！ FT报道，马斯克的XAI正在开发一种叫世界模型的AI技术，自动生成交互式的3D环境。 🚨用户可以像玩电子游戏一样，直接操控AI生成的视频内容。模型能根据玩家的操作实时生成场景。每个玩家的选择可能导致不同的故事发展或环境变化！

🔥马斯克表示xAI将大规模投入电子游戏开发，生成照片级逼真游戏！ FT报道，马斯克的XAI正在开发一种叫世界模型的AI技术，自动生成交互式的3D环境。 🚨用户可以像玩电子游戏一样，直接操控AI生成的视频内容。模型能根据玩家的操作实时生成场景。每个玩家的选择可能导致不同的故事发展或环境变化！

谢嘉琪

93,362 views • 9 months ago

强烈推荐这款Steam上的游戏《节奏医生》Rythm Doctor 一种语言很难描述的天才级·真·游戏艺术。表面上只需要一根手指就能玩，但你的心脏、肺呼吸也能参与到游戏里，（我甚至一边玩，一边看自己的实时心率数据）唯独不那么需要眼睛参与，甚至闭上眼睛玩是另一种冥想体验通过玩这个游戏，很可能会对一款独立小游戏，能跟人产生什么样的生理、情感连接产生新的认识（有玩家评论这款游戏改变了ta的人生）真正的心流体验、专注力训练，也许真的能治好一些人的“心病”。都说后ai时代最重要的是审美。对于vibe coding爱好者来说，这款游戏是个很好的产品教科书，它会反复地给你“What?居然还能这样？”的感觉。这不是国产游戏，但甚至人声音乐都有中英双版。也有手机版，但不推荐。因为阉割，和缺乏键盘物理反馈，感受大打折扣。适合睡前玩。大约30~60分钟后，你应该会在第2章第3关卡关，但睡一觉后，第二天你会发现，你居然神奇地自动就能过关了（睡眠产生的效应）。然后，来到第2章boss战，完成后，你会得到来自这个游戏充分的震撼。

强烈推荐这款Steam上的游戏《节奏医生》Rythm Doctor 一种语言很难描述的天才级·真·游戏艺术。表面上只需要一根手指就能玩，但你的心脏、肺呼吸也能参与到游戏里，（我甚至一边玩，一边看自己的实时心率数据）唯独不那么需要眼睛参与，甚至闭上眼睛玩是另一种冥想体验通过玩这个游戏，很可能会对一款独立小游戏，能跟人产生什么样的生理、情感连接产生新的认识（有玩家评论这款游戏改变了ta的人生）真正的心流体验、专注力训练，也许真的能治好一些人的“心病”。都说后ai时代最重要的是审美。对于vibe coding爱好者来说，这款游戏是个很好的产品教科书，它会反复地给你“What?居然还能这样？”的感觉。这不是国产游戏，但甚至人声音乐都有中英双版。也有手机版，但不推荐。因为阉割，和缺乏键盘物理反馈，感受大打折扣。适合睡前玩。大约30~60分钟后，你应该会在第2章第3关卡关，但睡一觉后，第二天你会发现，你居然神奇地自动就能过关了（睡眠产生的效应）。然后，来到第2章boss战，完成后，你会得到来自这个游戏充分的震撼。

paulwei

74,691 views • 6 months ago

我可以很肯定地说，Gemini 3.0 Flash 会在接下来的 5 个小时内发布这将是美好的一天 ⚡⚡⚡ 哦，不对，ZenMux 已经破解了，我都已经用上啦，立马生成了一个游戏 prompt：重现 1958 年第一款电子游戏《双人网球》，绿线代表示波器电子束。你猜怎么着，整个过程仅需 4.47 秒，请观看视频👇 真的是美好的一天 ⚡⚡⚡

我可以很肯定地说，Gemini 3.0 Flash 会在接下来的 5 个小时内发布这将是美好的一天 ⚡⚡⚡ 哦，不对，ZenMux 已经破解了，我都已经用上啦，立马生成了一个游戏 prompt：重现 1958 年第一款电子游戏《双人网球》，绿线代表示波器电子束。你猜怎么着，整个过程仅需 4.47 秒，请观看视频👇 真的是美好的一天 ⚡⚡⚡

AppSail

30,866 views • 7 months ago

Kimi K3的游戏制作能力也在线啊，用K3制作了一个马里奥游戏，基本就是提示词直出的，没有修改过。部署到vercel了，大家感兴趣可以试一下，地址在评论区。还是带音乐的，有点带感。。。

Kimi K3的游戏制作能力也在线啊，用K3制作了一个马里奥游戏，基本就是提示词直出的，没有修改过。部署到vercel了，大家感兴趣可以试一下，地址在评论区。还是带音乐的，有点带感。。。

雪踏乌云

27,851 views • 12 days ago

一个12岁的中国小男孩，连银行卡都办不了，却靠自己做的一款小游戏，在Google Play上赚到了12万美元。而他的学校，还在教他怎么使用Word。那天晚上，他搬出两台显示器，靠ChatGPT只用一个晚上就做出一款完整游戏。每写一行代码，他都认真对着镜头讲解，全程录下来发到B站。因为年纪太小，他自己没法上架游戏，最后是爸爸帮忙提交的——父亲一个代码都没写，只是按照儿子的指示签字操作。游戏定价0.99美元，上线首月就收入7000美元，到第12个月，月收入已经稳定超过1万美元。这一切，还是他在写作业、吃饭的间隙完成的。谷歌花30万美元请高级工程师做的事，这个12岁小孩只用了三个小时就搞定了。半年后，有人把他的视频慢放到0.25倍速，逐帧截取屏幕上的代码。一个31岁的香港承包商看懂了关键——那个控制游戏逻辑的15分钟计时器。他直接把这个计时器对接到Polymarket的BTC 15分钟市场，每15分钟自动执行一次交易，然后就去忙自己的工作了。结果六个月后，这个钱包盈利达到了86.8万美元，总共完成了28,600次预测。他在私密开发者群里只发了一句话： “我抄了一个12岁小孩的作业，周二早上市场直接给我赚了4696美元。” 所有交易的时间点，都和男孩游戏里的15分钟定时完全一致。一个小孩随手做的游戏计时器，被大人拿来在Polymarket上印钞，而且印得又稳又狠。这波跨度，真的太离谱了。我看到整个故事的时候，久久没缓过来。一个12岁小孩无意中写下的代码，竟然成了别人暴富的工具。而更狠的是，那个香港承包商只用一句话就总结了这个时代最残酷的真相：有些人还在学Word的时候，已经有人用AI把小孩的作业变成了百万财富。

一个12岁的中国小男孩，连银行卡都办不了，却靠自己做的一款小游戏，在Google Play上赚到了12万美元。而他的学校，还在教他怎么使用Word。那天晚上，他搬出两台显示器，靠ChatGPT只用一个晚上就做出一款完整游戏。每写一行代码，他都认真对着镜头讲解，全程录下来发到B站。因为年纪太小，他自己没法上架游戏，最后是爸爸帮忙提交的——父亲一个代码都没写，只是按照儿子的指示签字操作。游戏定价0.99美元，上线首月就收入7000美元，到第12个月，月收入已经稳定超过1万美元。这一切，还是他在写作业、吃饭的间隙完成的。谷歌花30万美元请高级工程师做的事，这个12岁小孩只用了三个小时就搞定了。半年后，有人把他的视频慢放到0.25倍速，逐帧截取屏幕上的代码。一个31岁的香港承包商看懂了关键——那个控制游戏逻辑的15分钟计时器。他直接把这个计时器对接到Polymarket的BTC 15分钟市场，每15分钟自动执行一次交易，然后就去忙自己的工作了。结果六个月后，这个钱包盈利达到了86.8万美元，总共完成了28,600次预测。他在私密开发者群里只发了一句话： “我抄了一个12岁小孩的作业，周二早上市场直接给我赚了4696美元。” 所有交易的时间点，都和男孩游戏里的15分钟定时完全一致。一个小孩随手做的游戏计时器，被大人拿来在Polymarket上印钞，而且印得又稳又狠。这波跨度，真的太离谱了。我看到整个故事的时候，久久没缓过来。一个12岁小孩无意中写下的代码，竟然成了别人暴富的工具。而更狠的是，那个香港承包商只用一句话就总结了这个时代最残酷的真相：有些人还在学Word的时候，已经有人用AI把小孩的作业变成了百万财富。

0XDegen

27,997 views • 1 month ago