Video wird geladen...

Video konnte nicht geladen werden

Beim Laden dieses Videos ist ein Problem aufgetreten. Dies könnte an einem vorübergehenden Netzwerkproblem liegen oder das Video ist möglicherweise nicht verfügbar.

强烈推荐大家看下关于OpenClaw作者Peter Steinberger 的访谈附：用remotion剪了几段高亮片段，并用whisper转写带上了中文字幕里面有几个观点很打动我： 1️⃣Clawdbot（OpenClaw）的由来: 经常在电脑上让AI Agent 运行长耗时任务。痛点就是：出去吃饭或休息，又想监控电脑进展，于是就花了半小时开发了clawdbot的雏形：将 WhatsApp 连接到了他的本地代码环境（Cloud code/Terminal）。然后还讲了这个agent如何通过一张推特截图自动修复 Bug，并自动回复推文的过程（具体可查看视频），在当时看很魔幻 2️⃣ 工程思维才重要：现在非技术人员也可以vibe一个项目，但是如果缺乏系统级思维，可能走不远。这个系统思维主要包括： a.品味：毫无疑问这个是最关键的，人类需要提升审美和判断力来掌舵； b. 对架构与结构的理解（你要明白如何运用架构思维实现大型的项目、企业级项目如何设计）； c. 技术选型：能判断该建立在哪些依赖项之上（比如合适该用中间件、数据库、模型、网关等等）。所以一个新手vibe 和一个老手vibe 出来时两个不同的东西的，作者Peter就是最佳例证，看了视频才知道人家在iOS 和 Mac OS（整个苹果生态系统）领域深耕了 20年 3️⃣ OpenClaw的影响： openclaw实践在技术上没有创新，但这个模式是必由之路，让作者踩中了，这种模式肯定会持续下去。作者预言：这可能会融化掉你手机上80%的应用。这个岚叔是认同的，单一的应用应该根本不需要，有AI就够了，今早看新闻A I引发软件股抛售，市值蒸发 3000 亿美元，简单的 CRUD 软件、功能单一的软件、或者静态页面将必然被 AI 取代 4️⃣ 实践路径：总结下视频里作者关于vibe的心得：就是要主动去玩的AI 产品，不要设想一开始开发一个精美的软件。动手去写，去报错，去 Debug。只有在与 AI 深度磨合的“人机循环”中，你才能真正练就一种驾驭它的“手感”（Product Sense），知道如何引导它交出最好的结果

岚叔

15,448 subscribers

15,011 Aufrufe • vor 4 Monaten •via X (Twitter)

Anya Rossi• Live Now

Private livecam show

0 Kommentare

Keine Kommentare verfügbar

Kommentare vom Original-Post werden hier angezeigt

Ähnliche Videos

OpenAI 的大神 Andrej Karpathy 前几天在他的 YouTube 频道讲了一堂课，系统的介绍了大语言模型，内容深入浅出，非常赞，抽空将它翻译成了双语，由于内容较长，我将分批上传，以下是第一部分精校后的双语视频，字幕文稿如下： Intro: Large Language Model (LLM) talk 大家好。最近，我进行了一场关于大语言模型的 30 分钟入门讲座。遗憾的是，这次讲座没有被录制下来，但许多人在讲座后找到我，他们告诉我非常喜欢那次讲座。因此，我决定重新录制并上传到 YouTube，那么，让我们开始吧，为大家带来“忙碌人士的大语言模型入门”系列，主讲人 Scott。好的，那我们开始吧。 LLM Inference 首先，什么是大语言模型 (Large Language Model) 呢？其实，一个大语言模型就是由两个文件组成的。在这个假设的目录中会有两个文件。以 Llama 2 70B 模型为例，这是一个由 Meta AI 发布的大语言模型。这是 Llama 系列语言模型的第二代，也是该系列中参数最多的模型，达到了 700 亿。LAMA2 系列包括了多个不同规模的模型，70 亿，130 亿，340 亿，700 亿是最大的一个。现在很多人喜欢这个模型，因为它可能是目前公开权重最强大的模型。Meta 发布了这款模型的权重、架构和相关论文，所以任何人都可以很轻松地使用这个模型。这与其他一些你可能熟悉的语言模型不同，例如，如果你正在使用 ChatGPT 或类似的东西，其架构并未公开，是 OpenAI 的产权，你只能通过网页界面使用，但你实际上没有访问那个模型的权限。在这种情况下，Llama 2 70B 模型实际上就是你电脑上的两个文件：一个是存储参数的文件，另一个是运行这些参数的代码。这些参数是神经网络（即语言模型）的权重或参数。我们稍后会详细解释。因为这是一个拥有 700 亿参数的模型，每个参数占用两个字节，因此参数文件的大小为 140 GB，之所以是两个字节，是因为这是 float 16 类型的数据。除了这些参数，还有一大堆神经网络的参数。你还需要一些能运行神经网络的代码，这些代码被包含在我们所说的运行文件中。这个运行文件可以是 C 语言或 Python，或任何其他编程语言编写的。它可以用任何语言编写，但 C 语言是一种非常简单的语言，只是举个例子。只需大约 500 行 C 语言代码，无需任何其他依赖，就能构建起神经网络架构，并且主要依靠一些参数来运行模型。所以只需要这两个文件。你只需带上这两个文件和你的 MacBook，就拥有了一个完整的工具包。你不需要连接互联网或其他任何设备。你可以拿着这两个文件，编译你的 C 语言代码。你将得到一个可针对参数运行并与语言模型交互的二进制文件。比如，你可以让它写一首关于 Scale AI 公司的诗，语言模型就会开始生成文本。在这种情况下，它会按照指示为你创作一首关于 Scale AI 的诗。之所以选用 Scale AI 作为例子，你会在整个演讲中看到，是因为我最初在 Scale AI 举办的活动上介绍过这个话题，所以演讲中会多次提到它，以便内容更具体。这就是我们如何运行模型的方式。只需要两个文件和一台 MacBook。我在这里稍微有点作弊，因为这并不是在运行一个有 700 亿参数的模型，而是在运行一个有 70 亿参数的模型。一个有 700 亿参数的模型运行速度大约会慢 10 倍。但我想给你们展示一下文本生成的过程，让你们了解它是什么样子。所以运行模型并不需要很多东西。这是一个非常小的程序包，但是当我们需要获取那些参数时，计算的复杂性就真正显现出来了。那么，这些参数从何而来，我们如何获得它们？因为无论 run.c 文件中的内容是什么，神经网络的架构和前向传播都是算法上明确且公开的。

OpenAI 的大神 Andrej Karpathy 前几天在他的 YouTube 频道讲了一堂课，系统的介绍了大语言模型，内容深入浅出，非常赞，抽空将它翻译成了双语，由于内容较长，我将分批上传，以下是第一部分精校后的双语视频，字幕文稿如下： Intro: Large Language Model (LLM) talk 大家好。最近，我进行了一场关于大语言模型的 30 分钟入门讲座。遗憾的是，这次讲座没有被录制下来，但许多人在讲座后找到我，他们告诉我非常喜欢那次讲座。因此，我决定重新录制并上传到 YouTube，那么，让我们开始吧，为大家带来“忙碌人士的大语言模型入门”系列，主讲人 Scott。好的，那我们开始吧。 LLM Inference 首先，什么是大语言模型 (Large Language Model) 呢？其实，一个大语言模型就是由两个文件组成的。在这个假设的目录中会有两个文件。以 Llama 2 70B 模型为例，这是一个由 Meta AI 发布的大语言模型。这是 Llama 系列语言模型的第二代，也是该系列中参数最多的模型，达到了 700 亿。LAMA2 系列包括了多个不同规模的模型，70 亿，130 亿，340 亿，700 亿是最大的一个。现在很多人喜欢这个模型，因为它可能是目前公开权重最强大的模型。Meta 发布了这款模型的权重、架构和相关论文，所以任何人都可以很轻松地使用这个模型。这与其他一些你可能熟悉的语言模型不同，例如，如果你正在使用 ChatGPT 或类似的东西，其架构并未公开，是 OpenAI 的产权，你只能通过网页界面使用，但你实际上没有访问那个模型的权限。在这种情况下，Llama 2 70B 模型实际上就是你电脑上的两个文件：一个是存储参数的文件，另一个是运行这些参数的代码。这些参数是神经网络（即语言模型）的权重或参数。我们稍后会详细解释。因为这是一个拥有 700 亿参数的模型，每个参数占用两个字节，因此参数文件的大小为 140 GB，之所以是两个字节，是因为这是 float 16 类型的数据。除了这些参数，还有一大堆神经网络的参数。你还需要一些能运行神经网络的代码，这些代码被包含在我们所说的运行文件中。这个运行文件可以是 C 语言或 Python，或任何其他编程语言编写的。它可以用任何语言编写，但 C 语言是一种非常简单的语言，只是举个例子。只需大约 500 行 C 语言代码，无需任何其他依赖，就能构建起神经网络架构，并且主要依靠一些参数来运行模型。所以只需要这两个文件。你只需带上这两个文件和你的 MacBook，就拥有了一个完整的工具包。你不需要连接互联网或其他任何设备。你可以拿着这两个文件，编译你的 C 语言代码。你将得到一个可针对参数运行并与语言模型交互的二进制文件。比如，你可以让它写一首关于 Scale AI 公司的诗，语言模型就会开始生成文本。在这种情况下，它会按照指示为你创作一首关于 Scale AI 的诗。之所以选用 Scale AI 作为例子，你会在整个演讲中看到，是因为我最初在 Scale AI 举办的活动上介绍过这个话题，所以演讲中会多次提到它，以便内容更具体。这就是我们如何运行模型的方式。只需要两个文件和一台 MacBook。我在这里稍微有点作弊，因为这并不是在运行一个有 700 亿参数的模型，而是在运行一个有 70 亿参数的模型。一个有 700 亿参数的模型运行速度大约会慢 10 倍。但我想给你们展示一下文本生成的过程，让你们了解它是什么样子。所以运行模型并不需要很多东西。这是一个非常小的程序包，但是当我们需要获取那些参数时，计算的复杂性就真正显现出来了。那么，这些参数从何而来，我们如何获得它们？因为无论 run.c 文件中的内容是什么，神经网络的架构和前向传播都是算法上明确且公开的。

宝玉

1,122,182 Aufrufe • vor 2 Jahren

软件已死？没有。但它正在变异。 Sam Altman最近有个判断，在脑子里挥之不去。他说，每家公司现在都是API公司。不管他们想不想要。为什么？因为AI代理人将无处不在。它们会像流水线一样，自动组合各种产品和服务。怎么组合？通过调用你的API。过去的SaaS模式，软件即服务，股价已经开始剧烈震荡。一个时代结束了。一个新时代开启了。这背后真正的问题是什么？当AI代理人可以任意调用数据和功能时，谁来控制它们？身份认证成了新的战场。如果没有一个可信的身份，代理人就可能失控。这听起来是技术问题。但本质是权力问题。谁来定义“可信”？谁来发放这个“数字身份”？是少数几家科技巨头，还是一个凌驾于所有人之上的中心化机构？当每个行为、每个代理人都需要被“认证”才能运行时，这离一个完全被监控和许可的系统还有多远？这套逻辑，从商业安全延伸到社会管理，几乎是无缝的。力量的重塑，总是在人们不经意的地方开始。

软件已死？没有。但它正在变异。 Sam Altman最近有个判断，在脑子里挥之不去。他说，每家公司现在都是API公司。不管他们想不想要。为什么？因为AI代理人将无处不在。它们会像流水线一样，自动组合各种产品和服务。怎么组合？通过调用你的API。过去的SaaS模式，软件即服务，股价已经开始剧烈震荡。一个时代结束了。一个新时代开启了。这背后真正的问题是什么？当AI代理人可以任意调用数据和功能时，谁来控制它们？身份认证成了新的战场。如果没有一个可信的身份，代理人就可能失控。这听起来是技术问题。但本质是权力问题。谁来定义“可信”？谁来发放这个“数字身份”？是少数几家科技巨头，还是一个凌驾于所有人之上的中心化机构？当每个行为、每个代理人都需要被“认证”才能运行时，这离一个完全被监控和许可的系统还有多远？这套逻辑，从商业安全延伸到社会管理，几乎是无缝的。力量的重塑，总是在人们不经意的地方开始。

墓碑科技

20,751 Aufrufe • vor 4 Monaten

OpenClaw/Clawdbot作者 Peter Steinberger 讲了一个让他顿悟的瞬间。他给自己的clawdbot发了条语音消息，然后才反应过来：我根本没做语音功能啊。但"正在输入"的指示器亮了。十秒后，agent若无其事地回复了。 Peter问它：你怎么做到的？ Agent的回答让他震住了：你发的消息只有一个文件链接，没有扩展名。我查了文件头，发现是Opus格式。用你Mac上的FFmpeg转成Wave。想用Whisper但没装，还报错了。不过我翻了翻发现你环境变量里有OpenAI的key，就用curl调了API拿到转写，然后回复你了。这个故事的意义在于，这不是预设好的workflow，不是写好的代码，是agent在遇到一个从未见过的问题时，自己想办法把链路串起来。文件头分析、格式转换、找可用工具、翻环境变量、调第三方API，一气呵成。 Peter说了一句话我很认同：这些东西是该死的聪明、足智多谋的野兽，只要你真的赋予它们力量。 "if you actually give them the power"才是关键。大多数人还在用AI写个总结、改个文案，把它当高级搜索引擎用。但当你给它shell权限，给它访问你本地工具链的能力，它展现出的自主探索完成任务能力完全是另一个量级。与此同时，行业里有一大批人在反方向努力。有人在绞尽脑汁省token，精心设计让AI 更少思考，生怕多花几分钱。还觉得模型做事太慢，自己来设计一些流程替代 AI 的思考探索，美其名曰加速。这种思路本质上是把一个足智多谋的野兽关进笼子里，然后抱怨它不够聪明。更神奇的是，市面上95%的软件压根就不是为面向智能设计的。还是传统思路：产品经理写PRD，开发者把逻辑一条条写死在代码里，用户只能在预设的按钮和流程里点来点去。这些软件在AI时代就像是用打孔纸带写程序，技术上能用，但完全错过了这个时代真正的可能性。 --- 注，这段切片是我丢下一句话给 claude code 完成的下载切片添加字幕，只是提出要求，没有任何 Skills，没有告诉他怎么做。

OpenClaw/Clawdbot作者 Peter Steinberger 讲了一个让他顿悟的瞬间。他给自己的clawdbot发了条语音消息，然后才反应过来：我根本没做语音功能啊。但"正在输入"的指示器亮了。十秒后，agent若无其事地回复了。 Peter问它：你怎么做到的？ Agent的回答让他震住了：你发的消息只有一个文件链接，没有扩展名。我查了文件头，发现是Opus格式。用你Mac上的FFmpeg转成Wave。想用Whisper但没装，还报错了。不过我翻了翻发现你环境变量里有OpenAI的key，就用curl调了API拿到转写，然后回复你了。这个故事的意义在于，这不是预设好的workflow，不是写好的代码，是agent在遇到一个从未见过的问题时，自己想办法把链路串起来。文件头分析、格式转换、找可用工具、翻环境变量、调第三方API，一气呵成。 Peter说了一句话我很认同：这些东西是该死的聪明、足智多谋的野兽，只要你真的赋予它们力量。 "if you actually give them the power"才是关键。大多数人还在用AI写个总结、改个文案，把它当高级搜索引擎用。但当你给它shell权限，给它访问你本地工具链的能力，它展现出的自主探索完成任务能力完全是另一个量级。与此同时，行业里有一大批人在反方向努力。有人在绞尽脑汁省token，精心设计让AI 更少思考，生怕多花几分钱。还觉得模型做事太慢，自己来设计一些流程替代 AI 的思考探索，美其名曰加速。这种思路本质上是把一个足智多谋的野兽关进笼子里，然后抱怨它不够聪明。更神奇的是，市面上95%的软件压根就不是为面向智能设计的。还是传统思路：产品经理写PRD，开发者把逻辑一条条写死在代码里，用户只能在预设的按钮和流程里点来点去。这些软件在AI时代就像是用打孔纸带写程序，技术上能用，但完全错过了这个时代真正的可能性。 --- 注，这段切片是我丢下一句话给 claude code 完成的下载切片添加字幕，只是提出要求，没有任何 Skills，没有告诉他怎么做。

kAI

171,062 Aufrufe • vor 5 Monaten

红杉资本，硅谷顶级风投，给所有创始人泼了盆冷水。他们问了一个要命的问题： “你离破产，是不是只差AI的下一次迭代？” 谷歌的Gemini 1.5 Pro刚出来。功能强到让人害怕。很多软件公司做的东西，它动动手指就实现了。这就等于，你辛辛苦苦开发一个工具。结果OpenAI或谷歌更新一下模型，你的公司就没了。直接被降维打击。这生意还怎么做？红杉指了一条路：别再卖铲子了，去卖挖出来的金子。什么意思？不要卖软件工具本身。要卖用这个工具完成的工作成果。把自己伪装成一家“服务公司”。但内核是一家效率极高的软件公司。让AI给你打工，而不是成为你的敌人。他们算了一笔账。市场上，软件每花1美元。配套的服务就要花6美元。以前的创业者只能赚那1美元。现在，AI能让你去抢那6美元的市场。这才是下一个万亿级公司的机会。说白了，就是用AI武装的服务业。不再是卖一个Word软件，而是直接帮你写好一份完美的合同。不再是卖一个Photoshop，而是直接给你一张修好的图。靠卖软件授权的商业模式，可能真的要到头了。

红杉资本，硅谷顶级风投，给所有创始人泼了盆冷水。他们问了一个要命的问题： “你离破产，是不是只差AI的下一次迭代？” 谷歌的Gemini 1.5 Pro刚出来。功能强到让人害怕。很多软件公司做的东西，它动动手指就实现了。这就等于，你辛辛苦苦开发一个工具。结果OpenAI或谷歌更新一下模型，你的公司就没了。直接被降维打击。这生意还怎么做？红杉指了一条路：别再卖铲子了，去卖挖出来的金子。什么意思？不要卖软件工具本身。要卖用这个工具完成的工作成果。把自己伪装成一家“服务公司”。但内核是一家效率极高的软件公司。让AI给你打工，而不是成为你的敌人。他们算了一笔账。市场上，软件每花1美元。配套的服务就要花6美元。以前的创业者只能赚那1美元。现在，AI能让你去抢那6美元的市场。这才是下一个万亿级公司的机会。说白了，就是用AI武装的服务业。不再是卖一个Word软件，而是直接帮你写好一份完美的合同。不再是卖一个Photoshop，而是直接给你一张修好的图。靠卖软件授权的商业模式，可能真的要到头了。

墓碑科技

35,308 Aufrufe • vor 3 Monaten

两周前，我和老朋友田鸿飞录制了一期关于边缘 AI 的播客。田鸿飞是 Olares 的联合创始人，Olares 是一款面向 AI 的操作系统，类似于个人 VPS，方便安装服务和 AI 模型，Olares One 就是这个系统的专用硬件，配备了 NVIDIA 5090 以及 96G 的内存。其实这两周爆火的 OpenClaw 给了大家一个很好的启示，一款边缘 AI OS 只需提供 Unix 内核和一个文件系统，一套在本地运行 AI Agent 的框架，能够调用本地模型或者远端能力更强大的模型，你的个人数据还有执行权限才是这个 AI 助理的关键所在！ OpenClaw 的作者 Peter Steinberger 说 MCP 是垃圾，它没法扩展。人们在它周围搞各种奇怪的搜索功能，但你知道什么真正能扩展？命令行工具。" 因为： - AI 模型已经懂 Unix； - 你的电脑上可以有上千个小程序； - 模型只需要知道程序名，调用 -help 查看帮助，就知道怎么使用； - 如果你聪明一点，把工具设计成模型期望的样子，一切都运作得更好；把所有的功能都封装成 Unix 的命令行，然后让 AI Agent 来直接使用这个操作系统，这才是边缘 AI OS 最有趣的地方😃

两周前，我和老朋友田鸿飞录制了一期关于边缘 AI 的播客。田鸿飞是 Olares 的联合创始人，Olares 是一款面向 AI 的操作系统，类似于个人 VPS，方便安装服务和 AI 模型，Olares One 就是这个系统的专用硬件，配备了 NVIDIA 5090 以及 96G 的内存。其实这两周爆火的 OpenClaw 给了大家一个很好的启示，一款边缘 AI OS 只需提供 Unix 内核和一个文件系统，一套在本地运行 AI Agent 的框架，能够调用本地模型或者远端能力更强大的模型，你的个人数据还有执行权限才是这个 AI 助理的关键所在！ OpenClaw 的作者 Peter Steinberger 说 MCP 是垃圾，它没法扩展。人们在它周围搞各种奇怪的搜索功能，但你知道什么真正能扩展？命令行工具。" 因为： - AI 模型已经懂 Unix； - 你的电脑上可以有上千个小程序； - 模型只需要知道程序名，调用 -help 查看帮助，就知道怎么使用； - 如果你聪明一点，把工具设计成模型期望的样子，一切都运作得更好；把所有的功能都封装成 Unix 的命令行，然后让 AI Agent 来直接使用这个操作系统，这才是边缘 AI OS 最有趣的地方😃

indigo

17,512 Aufrufe • vor 4 Monaten

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

歸藏(guizang.ai)

46,883 Aufrufe • vor 1 Monat

马斯克根本不做手机。他要直接跳过这个概念。我们口袋里的东西，将不再是手机。它会变成一个超薄的AI边缘节点。一个屏幕，加上无线电，实时连接Grok/xAI服务器处理一切。什么意思？未来没有操作系统，也没有App。你看到的一切，都是AI根据你的需求实时生成和推送的。邮件、社交、新闻，所有信息都通过一个统一的AI入口。马斯克预测，五六年内就会发生。这确实是对苹果和谷歌这些平台巨头的釜底抽薪。绕开应用商店，打破它们的生态垄断，听起来很解气。但这里有一个更深层的问题。当所有App消失，信息入口被一个超级AI统一时，谁来控制这个AI？如果这个AI决定了你能看到什么、不能看到什么，这会不会成为一种新的、更彻底的审查？它能不能在无形中塑造你的思想？一个中心化的AI，与一个去中心化的、由无数开发者构建的App世界，哪个对个人自由更有利？这个技术蓝图，到底是通往更高效的未来，还是在不经意间，为某种数字集权铺平了道路？值得每个人思考。

马斯克根本不做手机。他要直接跳过这个概念。我们口袋里的东西，将不再是手机。它会变成一个超薄的AI边缘节点。一个屏幕，加上无线电，实时连接Grok/xAI服务器处理一切。什么意思？未来没有操作系统，也没有App。你看到的一切，都是AI根据你的需求实时生成和推送的。邮件、社交、新闻，所有信息都通过一个统一的AI入口。马斯克预测，五六年内就会发生。这确实是对苹果和谷歌这些平台巨头的釜底抽薪。绕开应用商店，打破它们的生态垄断，听起来很解气。但这里有一个更深层的问题。当所有App消失，信息入口被一个超级AI统一时，谁来控制这个AI？如果这个AI决定了你能看到什么、不能看到什么，这会不会成为一种新的、更彻底的审查？它能不能在无形中塑造你的思想？一个中心化的AI，与一个去中心化的、由无数开发者构建的App世界，哪个对个人自由更有利？这个技术蓝图，到底是通往更高效的未来，还是在不经意间，为某种数字集权铺平了道路？值得每个人思考。

墓碑科技

68,774 Aufrufe • vor 7 Monaten

小扎吐槽苹果和 Google，以及谈为什么开源 AI **Mark Zuckerberg**: 我认为移动生态系统中普遍存在的一个问题是有两个把持入口的公司，Apple 和 Google，它们可以告诉你可以构建什么。在我们的历史中有很多次，比如有经济层面的情况，就是我们构建了些东西，然后它们就会拿走我们大部分的收入，但还有一种是质量层面，这实际上让我更加不满，也就是有很多次我们推出或希望推出某些功能，然后Apple就会说，不，你不能推出这功能。这真的很糟糕。问题是，这样的世界是否会在AI领域复现，就像你会有一小部分拥有封闭模型的公司，它们控制API，因此将能够告诉你可以构建什么。我可以说，对我们来说，自己构建一个模型以避免处于那种位置是值得的。我不希望那些其他公司告诉我们可以构建什么，而且我认为从开源的角度来看，很多开发人员也不希望那些公司告诉他们可以构建什么。这就是我坚定支持开源的原因之一，我认为未来AI的集中化可能像其广泛传播一样具有潜在危险。我发现很多人都在思考，如果我们能实现这种技术，那么让它广泛传播是否不利。我认为另一种可能也很糟糕的情况是，如果一个机构掌握了一种强大的AI远超其他所有人的，这同样是非常糟糕的。在我看来，一个理想的世界应该是这样的：AI技术被广泛而均衡地应用，随着时间推移逐步增强其健康性。在这样的世界里，各种系统能够相互制衡，这种平衡的状态比一个高度集中化的世界要健康得多。虽然风险无处不在，但我觉得有一个风险我想人们我并没有听到太多人提及。 **Dwarkesh Patel**:举例来说，一个价值100亿美元的模型，如果经过评估是完全安全的，你们会选择开源吗？ **Mark Zuckerberg**:我的答案是，只要这个模型对我们有所帮助，那我们就会开源。 **Dwarkesh Patel**: 那如果这个模型是用100亿美元的研发经费研发出来的，然后现在要开源呢？ **Mark Zuckerberg**: 我们一直以来都有开源软件的传统，但是我们并不会开源我们的产品。比如说，我们并不会将Instagram的代码开源，但我们会开源许多底层的基础设施。我们历史上最大的一个项目可能就是开放计算项目。在这个项目中，我们将我们所有的服务器的设计网络交换机和数据中心的设计开源了，这对我们来说非常有帮助。因为很多人可以设计服务器，但现在，大家普遍都采用了我们的设计，这就意味着整个供应链都围绕我们的设计展开，规模变大，对所有人来说都变得更便宜，为我们节省了数十亿美元。这真是太棒了，对吧？因此，我认为开源有多种方式可以对我们有所帮助。一种就是，如果有人能够找出更便宜的运行模型的方法，我们将花费数十亿甚至上千亿美元，在所有这些模型上，所以如果我们能做的更有效率，那我们就可以节省数十亿甚至上百亿美元，这可能本身就非常有价值。 **Dwarkesh Patel**: 关于开源，我很想知道你是否认为像PyTorch、React、Open Compute这样的开源项目，对世界的影响是否已经超过了Meta在社交媒体方面的作用。 **Mark Zuckerberg**: 因为我曾经和使用这些服务的人交谈过，他们觉得这是有可能的，因为互联网的很大一部分都在运行这些项目。这是一个有趣的问题，我认为几乎有一半的世界人口都在使用我们的产品，这是一个真实的点，所以我觉得这很难超越。但不管怎样，我还是认为开源是一种新的、非常強大的建设方式。来源：

小扎吐槽苹果和 Google，以及谈为什么开源 AI Mark Zuckerberg: 我认为移动生态系统中普遍存在的一个问题是有两个把持入口的公司，Apple 和 Google，它们可以告诉你可以构建什么。在我们的历史中有很多次，比如有经济层面的情况，就是我们构建了些东西，然后它们就会拿走我们大部分的收入，但还有一种是质量层面，这实际上让我更加不满，也就是有很多次我们推出或希望推出某些功能，然后Apple就会说，不，你不能推出这功能。这真的很糟糕。问题是，这样的世界是否会在AI领域复现，就像你会有一小部分拥有封闭模型的公司，它们控制API，因此将能够告诉你可以构建什么。我可以说，对我们来说，自己构建一个模型以避免处于那种位置是值得的。我不希望那些其他公司告诉我们可以构建什么，而且我认为从开源的角度来看，很多开发人员也不希望那些公司告诉他们可以构建什么。这就是我坚定支持开源的原因之一，我认为未来AI的集中化可能像其广泛传播一样具有潜在危险。我发现很多人都在思考，如果我们能实现这种技术，那么让它广泛传播是否不利。我认为另一种可能也很糟糕的情况是，如果一个机构掌握了一种强大的AI远超其他所有人的，这同样是非常糟糕的。在我看来，一个理想的世界应该是这样的：AI技术被广泛而均衡地应用，随着时间推移逐步增强其健康性。在这样的世界里，各种系统能够相互制衡，这种平衡的状态比一个高度集中化的世界要健康得多。虽然风险无处不在，但我觉得有一个风险我想人们我并没有听到太多人提及。 Dwarkesh Patel:举例来说，一个价值100亿美元的模型，如果经过评估是完全安全的，你们会选择开源吗？ Mark Zuckerberg:我的答案是，只要这个模型对我们有所帮助，那我们就会开源。 Dwarkesh Patel: 那如果这个模型是用100亿美元的研发经费研发出来的，然后现在要开源呢？ Mark Zuckerberg: 我们一直以来都有开源软件的传统，但是我们并不会开源我们的产品。比如说，我们并不会将Instagram的代码开源，但我们会开源许多底层的基础设施。我们历史上最大的一个项目可能就是开放计算项目。在这个项目中，我们将我们所有的服务器的设计网络交换机和数据中心的设计开源了，这对我们来说非常有帮助。因为很多人可以设计服务器，但现在，大家普遍都采用了我们的设计，这就意味着整个供应链都围绕我们的设计展开，规模变大，对所有人来说都变得更便宜，为我们节省了数十亿美元。这真是太棒了，对吧？因此，我认为开源有多种方式可以对我们有所帮助。一种就是，如果有人能够找出更便宜的运行模型的方法，我们将花费数十亿甚至上千亿美元，在所有这些模型上，所以如果我们能做的更有效率，那我们就可以节省数十亿甚至上百亿美元，这可能本身就非常有价值。 Dwarkesh Patel: 关于开源，我很想知道你是否认为像PyTorch、React、Open Compute这样的开源项目，对世界的影响是否已经超过了Meta在社交媒体方面的作用。 Mark Zuckerberg: 因为我曾经和使用这些服务的人交谈过，他们觉得这是有可能的，因为互联网的很大一部分都在运行这些项目。这是一个有趣的问题，我认为几乎有一半的世界人口都在使用我们的产品，这是一个真实的点，所以我觉得这很难超越。但不管怎样，我还是认为开源是一种新的、非常強大的建设方式。来源：

宝玉

74,721 Aufrufe • vor 2 Jahren

现在的短视频已经有不少精品，在用心创作高质量的作品。推荐一个最近关注的视频号：万能大饼子。它创作的视频特点可能就是充满了细节性的隐喻，经常需要思考下才能知道这个视频想要表达的是什么。比如下面这个有关“AI创作”的视频：

现在的短视频已经有不少精品，在用心创作高质量的作品。推荐一个最近关注的视频号：万能大饼子。它创作的视频特点可能就是充满了细节性的隐喻，经常需要思考下才能知道这个视频想要表达的是什么。比如下面这个有关“AI创作”的视频：

Tristan

168,698 Aufrufe • vor 2 Jahren

千万别拿我和张雪峰这个大傻逼作对比。网友：我想学AI相关的专业，我对AI很感兴趣，请问我应该选计算机还是数学？我：你一定要选计算机，先把python和数据结构基础打好，然后从deep learning这门课开始学，可以在家配置一个nvidia GPU的笔记本或者台式机，或者用google colab，先从最简单的 CNN 开始训练，找一个dataset，自己安装好pytorch和cuda、cudnn，抄一个经典CNN model，训练你的第一个神经网络，然后可以学习transformer，学习encoder only的BERT，学习decoder only的GPT模型，从minGPT开始，训练你的最小版本的GPT模型，如果你对训练模型感兴趣，可以读个PhD，如果你的inference感兴趣，可以多花点时间看cuda，简单学习一下nvidia tensor core architecture，可以了解GPT后续的模型的架构，如果你对inference感兴趣，你也可以直接看vllm的架构，读里面的代码，理解vllm是如何load一个用pytorch训练好的LLM模型，如果你对AI Agent感兴趣，可以从ReAct Agent开始看，然后看SWE Agent，知道一个Agent是如何抽象出来的，如何调用function call，如何自己做reasoning，如何把一个软件开发的任务用agentical的方式拆分和执行的，然后你可以看codex的架构，看看codex是如何设计memory、auto compact、multi agent、background task这些现代coding Agent功能的。张雪峰（下面视频中可以找到原话）：孩子，你一定要学数学，数学学好了可以转互联网、AI、科技、半导体、金融所有专业，数学是一切专业之母，所有专业的老祖宗！孩子，deepseek就是一群纯数学博士造出来的，这些人天天研究数学，就把deepseek造出来了！孩子，AI本质就是数学建模，就是一个个自变量，你只有研究数学，一直读到数学博士，才能把这些数学建模研究明白，计算机毕业生是永远研究不明白AI的！我的结论是，鼓吹“数学万能论”、“数学是一切专业的老祖宗”、“只有数学博士才能研究AI”的张雪峰和他们的粉丝，都是彻彻底底的大傻逼。

千万别拿我和张雪峰这个大傻逼作对比。网友：我想学AI相关的专业，我对AI很感兴趣，请问我应该选计算机还是数学？我：你一定要选计算机，先把python和数据结构基础打好，然后从deep learning这门课开始学，可以在家配置一个nvidia GPU的笔记本或者台式机，或者用google colab，先从最简单的 CNN 开始训练，找一个dataset，自己安装好pytorch和cuda、cudnn，抄一个经典CNN model，训练你的第一个神经网络，然后可以学习transformer，学习encoder only的BERT，学习decoder only的GPT模型，从minGPT开始，训练你的最小版本的GPT模型，如果你对训练模型感兴趣，可以读个PhD，如果你的inference感兴趣，可以多花点时间看cuda，简单学习一下nvidia tensor core architecture，可以了解GPT后续的模型的架构，如果你对inference感兴趣，你也可以直接看vllm的架构，读里面的代码，理解vllm是如何load一个用pytorch训练好的LLM模型，如果你对AI Agent感兴趣，可以从ReAct Agent开始看，然后看SWE Agent，知道一个Agent是如何抽象出来的，如何调用function call，如何自己做reasoning，如何把一个软件开发的任务用agentical的方式拆分和执行的，然后你可以看codex的架构，看看codex是如何设计memory、auto compact、multi agent、background task这些现代coding Agent功能的。张雪峰（下面视频中可以找到原话）：孩子，你一定要学数学，数学学好了可以转互联网、AI、科技、半导体、金融所有专业，数学是一切专业之母，所有专业的老祖宗！孩子，deepseek就是一群纯数学博士造出来的，这些人天天研究数学，就把deepseek造出来了！孩子，AI本质就是数学建模，就是一个个自变量，你只有研究数学，一直读到数学博士，才能把这些数学建模研究明白，计算机毕业生是永远研究不明白AI的！我的结论是，鼓吹“数学万能论”、“数学是一切专业的老祖宗”、“只有数学博士才能研究AI”的张雪峰和他们的粉丝，都是彻彻底底的大傻逼。

lidang 立党（劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人）

266,741 Aufrufe • vor 3 Monaten

这是我来到 X 以后，学会的几个新的操作。很多X新手应该都不知道，我也一直踩坑： 1、第一个操作，就是在通知里看到某一条消息之后，打开之后看不到原帖是哪个。这个时候你把页面向上滑动一下，你才能看到他回复的是哪个帖子。 2、第二个操作，怎么发长线程的推文？点击发帖，发帖之后，把第一个帖子编辑好之后，就可以点击右下角的一个添加加号，然后就可以添加新的内容，也就是发一个长线程的推文。 3、第三个操作，转发视频。其实有时候你转发其他人的推文的时候，可以不用直接转发推文，而是直接把视频引用过来，看起来像是自己发的视频一样。怎么操作呢？就是你进入到这个视频的页面，然后长按视频，然后点发布视频。然后就会带入一个链接，然后你在链接的前面输入你的文字，你发布出去之后就会只引用对方的视频，有时候看起来跟你自己发的是一样的。你学会了吗？没学会的可以👀看视频

这是我来到 X 以后，学会的几个新的操作。很多X新手应该都不知道，我也一直踩坑： 1、第一个操作，就是在通知里看到某一条消息之后，打开之后看不到原帖是哪个。这个时候你把页面向上滑动一下，你才能看到他回复的是哪个帖子。 2、第二个操作，怎么发长线程的推文？点击发帖，发帖之后，把第一个帖子编辑好之后，就可以点击右下角的一个添加加号，然后就可以添加新的内容，也就是发一个长线程的推文。 3、第三个操作，转发视频。其实有时候你转发其他人的推文的时候，可以不用直接转发推文，而是直接把视频引用过来，看起来像是自己发的视频一样。怎么操作呢？就是你进入到这个视频的页面，然后长按视频，然后点发布视频。然后就会带入一个链接，然后你在链接的前面输入你的文字，你发布出去之后就会只引用对方的视频，有时候看起来跟你自己发的是一样的。你学会了吗？没学会的可以👀看视频

鱼总聊AI

13,431 Aufrufe • vor 5 Monaten

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上，陶哲轩做了一次 AI 和数学的演讲，非常精彩，从数学使用计算计算机的历史开始讲起，一直讲到大语言模型，干货相当多，尤其适合对数学有兴趣的同学。（对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看）先摘录几个冷知识： 1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘 2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。并且陶哲轩提到了基于大语言模型的一些改进的方案：比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？陶哲轩也给出了他的看法： > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。他还提到了一些可能的 AI 能在数学领域提供帮助的方向： - AI 能够非常好地生成有价值的猜想 > 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。演讲环节结束前的最后一句话说的特别好： > 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。原始 YT 视频：

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上，陶哲轩做了一次 AI 和数学的演讲，非常精彩，从数学使用计算计算机的历史开始讲起，一直讲到大语言模型，干货相当多，尤其适合对数学有兴趣的同学。（对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看）先摘录几个冷知识： 1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘 2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。并且陶哲轩提到了基于大语言模型的一些改进的方案：比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？陶哲轩也给出了他的看法： > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。他还提到了一些可能的 AI 能在数学领域提供帮助的方向： - AI 能够非常好地生成有价值的猜想 > 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。演讲环节结束前的最后一句话说的特别好： > 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。原始 YT 视频：

宝玉

300,761 Aufrufe • vor 1 Jahr

从一个想法到 App Store 只用了 20 天——我如何在不是全职程序员的情况下，用 AI 打造并发布一款 iOS 应用：JAM。如果你有一个创意，想把它变成真正的产品，现在的速度可以比你想象的还快。在这段视频里，我会告诉你，如何在完全没有传统编程经验的情况下，借助像 Cursor 这样的 AI 工具，仅用 20 天就从构思走到 App Store 上架。这是一份针对设计师和科技从业者的真实案例，展示了现代 AI 工具如何加速工作流程、验证产品创意，并在极短时间内完成可用原型。

从一个想法到 App Store 只用了 20 天——我如何在不是全职程序员的情况下，用 AI 打造并发布一款 iOS 应用：JAM。如果你有一个创意，想把它变成真正的产品，现在的速度可以比你想象的还快。在这段视频里，我会告诉你，如何在完全没有传统编程经验的情况下，借助像 Cursor 这样的 AI 工具，仅用 20 天就从构思走到 App Store 上架。这是一份针对设计师和科技从业者的真实案例，展示了现代 AI 工具如何加速工作流程、验证产品创意，并在极短时间内完成可用原型。

Bear Liu

51,546 Aufrufe • vor 10 Monaten

Anthropic engineer 这句话很关键： “你不应该一直 prompt Claude。你应该搭一个会自己 prompt 自己的 system。” 这可能是最近看到最值得保存的 Claude workflow 之一视频里她拆了很多人正在犯的同一个问题：用了 Claude 几个月，但每次还是从零开始新开 session 重新解释背景重新贴上下文重新写 prompt 然后关掉 tab，一切停止她讲到几个细节： CLAUDE.md 在你输入第一个字前，就可能吃掉 14% 95% 用户从来没装过的 plugins 不需要你手动输入 prompt，也能运行的 workflows 以及为什么“打一条 prompt 然后关掉页面”，等于把 90% 的能力留在桌上真正有意思的是： Claude 的价值不只是回答你的问题而是你能不能把它放进一套系统里让它记住规则读取上下文调用 plugins 跑 workflows 甚至在你不输入下一条 prompt 的时候，继续推进任务如果你用了 Claude 几个月，但每次 session 还是从头开始那你至少还有 28 个 untouched features 可能是 30 个今晚与其再刷一集剧，不如看完这个视频看完先 bookmark

Anthropic engineer 这句话很关键： “你不应该一直 prompt Claude。你应该搭一个会自己 prompt 自己的 system。” 这可能是最近看到最值得保存的 Claude workflow 之一视频里她拆了很多人正在犯的同一个问题：用了 Claude 几个月，但每次还是从零开始新开 session 重新解释背景重新贴上下文重新写 prompt 然后关掉 tab，一切停止她讲到几个细节： CLAUDE.md 在你输入第一个字前，就可能吃掉 14% 95% 用户从来没装过的 plugins 不需要你手动输入 prompt，也能运行的 workflows 以及为什么“打一条 prompt 然后关掉页面”，等于把 90% 的能力留在桌上真正有意思的是： Claude 的价值不只是回答你的问题而是你能不能把它放进一套系统里让它记住规则读取上下文调用 plugins 跑 workflows 甚至在你不输入下一条 prompt 的时候，继续推进任务如果你用了 Claude 几个月，但每次 session 还是从头开始那你至少还有 28 个 untouched features 可能是 30 个今晚与其再刷一集剧，不如看完这个视频看完先 bookmark

0x_Miko

154,161 Aufrufe • vor 29 Tagen

印度正在干一件大事。一件很安静，但可能影响深远的事。他们在从零开始，构建一个梵语大语言模型。梵语，是世界上最古老的结构化语言。这个项目，不是简单的翻译工具。更不是把古籍扫描数字化就完事了。他们要让AI真正“学会”梵语，用梵语的逻辑去思考。牵头的是一家有118年历史的梵语学院，和印度顶尖的理工学院IIT马德拉斯分校。学者和数据科学家坐到了一起。第一步，也是最难的一步，建立语料库。他们收集了超过11万份梵文文本。包括经文、孤本、还有数千份手稿。为了处理这些古老的手稿，团队自己开发了专有软件。结果惊人。 24小时内数字化了超过1000本梵语书籍。每页只有三到四个错误，准确率接近97%。梵语的语法结构极其复杂和精确。比如“Sandhi”这种连音变化规则，还有复杂的词形变化，对AI的挑战远超英语。解决这些难题，需要全新的算法和模型。这暴露了一个关键问题。当下的AI模型，本质上是基于英语世界的逻辑和数据结构建立的。而印度这个项目，试图用一种完全不同的文明底层逻辑来训练AI。这不仅仅是技术问题。这关乎一个文明的记忆，能否在机器时代被完整保留，甚至被激活。当全球科技巨头都在追求更大规模的模型、更快的算力时，印度选择了一条不同的路。深度优先，而非规模。结构优先，而非噪音。意义优先，而非模仿。这引出了一个更深层的问题。 AI的未来，是否也依赖于人类最古老的智慧？如果这个实验成功，梵语将不再仅仅是被“保存”的遗产。它将成为一种可计算的，具备严谨逻辑推理能力的工具。这是一个国家在尝试用自己的文化之根，去定义自己的科技未来。而不是被动地接受硅谷制定的标准和游戏规则。这种对自己文明的自信和投入，值得深思。当一个国家开始系统性地将自己的古典智慧与最前沿的科技结合，它的目标可能远不止是开发一个AI模型那么简单。

印度正在干一件大事。一件很安静，但可能影响深远的事。他们在从零开始，构建一个梵语大语言模型。梵语，是世界上最古老的结构化语言。这个项目，不是简单的翻译工具。更不是把古籍扫描数字化就完事了。他们要让AI真正“学会”梵语，用梵语的逻辑去思考。牵头的是一家有118年历史的梵语学院，和印度顶尖的理工学院IIT马德拉斯分校。学者和数据科学家坐到了一起。第一步，也是最难的一步，建立语料库。他们收集了超过11万份梵文文本。包括经文、孤本、还有数千份手稿。为了处理这些古老的手稿，团队自己开发了专有软件。结果惊人。 24小时内数字化了超过1000本梵语书籍。每页只有三到四个错误，准确率接近97%。梵语的语法结构极其复杂和精确。比如“Sandhi”这种连音变化规则，还有复杂的词形变化，对AI的挑战远超英语。解决这些难题，需要全新的算法和模型。这暴露了一个关键问题。当下的AI模型，本质上是基于英语世界的逻辑和数据结构建立的。而印度这个项目，试图用一种完全不同的文明底层逻辑来训练AI。这不仅仅是技术问题。这关乎一个文明的记忆，能否在机器时代被完整保留，甚至被激活。当全球科技巨头都在追求更大规模的模型、更快的算力时，印度选择了一条不同的路。深度优先，而非规模。结构优先，而非噪音。意义优先，而非模仿。这引出了一个更深层的问题。 AI的未来，是否也依赖于人类最古老的智慧？如果这个实验成功，梵语将不再仅仅是被“保存”的遗产。它将成为一种可计算的，具备严谨逻辑推理能力的工具。这是一个国家在尝试用自己的文化之根，去定义自己的科技未来。而不是被动地接受硅谷制定的标准和游戏规则。这种对自己文明的自信和投入，值得深思。当一个国家开始系统性地将自己的古典智慧与最前沿的科技结合，它的目标可能远不止是开发一个AI模型那么简单。

墓碑科技

22,272 Aufrufe • vor 5 Monaten

最近这个 Srcbook 很火，非常有趣的一个开源项目，用Typescript 编写的一个本地的笔记工具，但是内置了一个 Node.js 环境，所以完全是可交互式的。在里面可以运行任何的JS 代码，还能 npm 安装依赖，还有 AI 的加持，可以直接让 AI 写代码，最后还能导出标准的 Markdown，非常有趣的想法，要是能再用 Electron 包一层，做成一个本地的应用就很方便了。我截了一段官网视频大家可以感受一下，可以在官网看看介绍全部的介绍视频。

最近这个 Srcbook 很火，非常有趣的一个开源项目，用Typescript 编写的一个本地的笔记工具，但是内置了一个 Node.js 环境，所以完全是可交互式的。在里面可以运行任何的JS 代码，还能 npm 安装依赖，还有 AI 的加持，可以直接让 AI 写代码，最后还能导出标准的 Markdown，非常有趣的想法，要是能再用 Electron 包一层，做成一个本地的应用就很方便了。我截了一段官网视频大家可以感受一下，可以在官网看看介绍全部的介绍视频。

Viking

26,608 Aufrufe • vor 1 Jahr

真是开了眼了——一个还在读量化专业的大学生，只花了10天，自己搭了个AI集群引擎，结果在GitHub上火得一塌糊涂，直接拿下13000多颗星，还顺手融了400万美元。最近有个叫MiroFish的项目特别火，它其实是个多智能体模拟器，主要干的事就是帮你预测——不管是交易、公关，还是别的什么领域。 MiroFish到底是个啥？简单说，它就是一个数字版“沙盒世界”。里面跑着几千个AI代理，每个代理都有自己的“记忆”和行为模式，像真人一样在里面互动、讨论、站队。你随便扔一个场景进去——比如某条新闻突然泄露、政策突然变了，甚至一部没写完的经典小说——它就能模拟出这些人会怎么反应、怎么吵、最后得出什么结果，帮你预判现实里可能发生的情况。做这个项目的人叫郭汉江，2025年底的时候还是个本科生。他当时用AI工具帮忙写代码，把核心功能跑通之后，一发到网上就爆了。盛大集团直接砸了3000万人民币进来。后来他把宿舍退了，自己出来开了家公司，现在正带着这方向往前走。这东西能干嘛？目前用得比较多的几个场景：交易方面，你把金融新闻或者财报往里一丢，它就能模拟出市场会不会恐慌、价格大概怎么走，给你个预判的参考。公关测试也很实用，公司或者团队写了个声明，先扔进去跑一遍，看看会不会翻车，再调整措辞。还有人有拿来玩的，比如把一本没结局的中国小说放进去，里面的代理就会“扮演”角色，自己推一个合理的结局出来。部署也不麻烦，用Docker几分钟就能搞定，自带对接各种大模型的API密钥。给大伙支个招：你甚至可以整点“骚操作”——比如模拟马斯克突然发推说“狗狗币2.0来了”，然后看里面的交易员、大V、散户怎么炸锅，整个过程还能生成视频，完全无风险体验一把什么叫“起飞”或者“崩盘”。已经有交易员靠这个赚到钱了。比如有个案例在Polymarket上，有人用MiroFish跑历史数据，模拟完之后去押注SPX 500，最后净赚12万多美元。他的地址是：如果你想省点事，直接跟着高手走，也可以试试Kreo的跟单交易，自动复制他这类人的操作，借力上车。在PolyCop上添加他的钱包 [0x17559efac103ac7f361be37ec0b93888d4c55aac] 到就能开始跟踪或者复制他的交易了。代码在这：

真是开了眼了——一个还在读量化专业的大学生，只花了10天，自己搭了个AI集群引擎，结果在GitHub上火得一塌糊涂，直接拿下13000多颗星，还顺手融了400万美元。最近有个叫MiroFish的项目特别火，它其实是个多智能体模拟器，主要干的事就是帮你预测——不管是交易、公关，还是别的什么领域。 MiroFish到底是个啥？简单说，它就是一个数字版“沙盒世界”。里面跑着几千个AI代理，每个代理都有自己的“记忆”和行为模式，像真人一样在里面互动、讨论、站队。你随便扔一个场景进去——比如某条新闻突然泄露、政策突然变了，甚至一部没写完的经典小说——它就能模拟出这些人会怎么反应、怎么吵、最后得出什么结果，帮你预判现实里可能发生的情况。做这个项目的人叫郭汉江，2025年底的时候还是个本科生。他当时用AI工具帮忙写代码，把核心功能跑通之后，一发到网上就爆了。盛大集团直接砸了3000万人民币进来。后来他把宿舍退了，自己出来开了家公司，现在正带着这方向往前走。这东西能干嘛？目前用得比较多的几个场景：交易方面，你把金融新闻或者财报往里一丢，它就能模拟出市场会不会恐慌、价格大概怎么走，给你个预判的参考。公关测试也很实用，公司或者团队写了个声明，先扔进去跑一遍，看看会不会翻车，再调整措辞。还有人有拿来玩的，比如把一本没结局的中国小说放进去，里面的代理就会“扮演”角色，自己推一个合理的结局出来。部署也不麻烦，用Docker几分钟就能搞定，自带对接各种大模型的API密钥。给大伙支个招：你甚至可以整点“骚操作”——比如模拟马斯克突然发推说“狗狗币2.0来了”，然后看里面的交易员、大V、散户怎么炸锅，整个过程还能生成视频，完全无风险体验一把什么叫“起飞”或者“崩盘”。已经有交易员靠这个赚到钱了。比如有个案例在Polymarket上，有人用MiroFish跑历史数据，模拟完之后去押注SPX 500，最后净赚12万多美元。他的地址是：如果你想省点事，直接跟着高手走，也可以试试Kreo的跟单交易，自动复制他这类人的操作，借力上车。在PolyCop上添加他的钱包 [0x17559efac103ac7f361be37ec0b93888d4c55aac] 到就能开始跟踪或者复制他的交易了。代码在这：

区块链行情研究

157,301 Aufrufe • vor 3 Monaten

凭啥说中国🇨🇳未来是美国🇺🇸唯一对手？你把一颗螺丝、一个零件、一个驱动程序拆开看，它什么都不是。但中国人擅长的不是某一个点，而是把所有点“组装成系统”的能力。上世纪90年代，美国搞去工业化，把制造业往外甩，老美资本家兴奋地下注：我们掌握设计、技术和规则，低端的制造就让“中国工厂”搞定。没人意识到，这不是工厂的外包，这是工业文明主动放弃了自己的“系统底盘”。风险？独家解读⬇️ 什么是底盘。美国🇺🇸它丢掉的是整个“Industrial Commons”—设计、试产、测试、修正、工艺优化……整条从实验室到量产的链条。你可以限制光刻机、顶尖芯片，但你无法消灭中国的“体系构建能力”。然后中国开始补短板，搞芯片，搞AI，搞软件算法。最可怕的不是它追上了，而是它把这些东西也系统化了。算法 + 工厂；数据 + 封装；大模型 + 自动化流水线。你可以断它的卡脖子技术，但你断不了它的体系构建能力。这个世界上现在只有一个国家，能把工业体系“整体打包开战”——就是中国。这不是那种“靠卷”堆出来的，而是有深层文化机制支持的能力。能干，听话，聪明，擅长协作、执行和大工程落地。这不是一种能力，是一种建立在儒家文明结构。所以说，特朗普不是疯子，他只是看懂了这件事。他知道，中国不是偷走了几个岗位，是在悄悄拼装一个能打仗的产业链闭环。而这正是美国最怕的事：一个有软件有算法、后面硬件有工厂、有指挥系统、还能一体化推进的国家。但故事还没结束。中国🇨🇳真正的对手，其实不是美国🇺🇸。是自己。因为历史上所有系统性最强、执行力最强的国家，最终往往都败在“刚性太强，转弯太慢”。它会赢在系统，也可能毁在系统。摧毁一个像中国这样的国家，不需要敌人，只需要它自己不断加速、不留缓冲。

凭啥说中国🇨🇳未来是美国🇺🇸唯一对手？你把一颗螺丝、一个零件、一个驱动程序拆开看，它什么都不是。但中国人擅长的不是某一个点，而是把所有点“组装成系统”的能力。上世纪90年代，美国搞去工业化，把制造业往外甩，老美资本家兴奋地下注：我们掌握设计、技术和规则，低端的制造就让“中国工厂”搞定。没人意识到，这不是工厂的外包，这是工业文明主动放弃了自己的“系统底盘”。风险？独家解读⬇️ 什么是底盘。美国🇺🇸它丢掉的是整个“Industrial Commons”—设计、试产、测试、修正、工艺优化……整条从实验室到量产的链条。你可以限制光刻机、顶尖芯片，但你无法消灭中国的“体系构建能力”。然后中国开始补短板，搞芯片，搞AI，搞软件算法。最可怕的不是它追上了，而是它把这些东西也系统化了。算法 + 工厂；数据 + 封装；大模型 + 自动化流水线。你可以断它的卡脖子技术，但你断不了它的体系构建能力。这个世界上现在只有一个国家，能把工业体系“整体打包开战”——就是中国。这不是那种“靠卷”堆出来的，而是有深层文化机制支持的能力。能干，听话，聪明，擅长协作、执行和大工程落地。这不是一种能力，是一种建立在儒家文明结构。所以说，特朗普不是疯子，他只是看懂了这件事。他知道，中国不是偷走了几个岗位，是在悄悄拼装一个能打仗的产业链闭环。而这正是美国最怕的事：一个有软件有算法、后面硬件有工厂、有指挥系统、还能一体化推进的国家。但故事还没结束。中国🇨🇳真正的对手，其实不是美国🇺🇸。是自己。因为历史上所有系统性最强、执行力最强的国家，最终往往都败在“刚性太强，转弯太慢”。它会赢在系统，也可能毁在系统。摧毁一个像中国这样的国家，不需要敌人，只需要它自己不断加速、不留缓冲。

Tigris 会讲课教授是好老师

164,331 Aufrufe • vor 1 Jahr

👺如何真正用Seedance2.0挣到钱？肖师傅首个全Seedance商业作品《Horse进门》今天正式发布，作为首个变现的作品，我想我有权力来说说大家目前存在的一些误区： 1⃣ 技术平权造成的创收假象：其实这一点我在一开始也深受困扰，大家看我前两天发布的文章，一股深深的绝望，因为我所引以为傲的技术、剪辑等等，突然就平权了，随便一个小孩，随便几句话，都可以超过我们精心制作的内容。但经过了2天的调整，我认定不能坐以待毙，于是主动出去抢客户，希望在被平权前拿到一些商业机会，但在这个过程中，我的客户给了我很大的鼓励，集中的核心就是：我们选择你，不是因为技术，技术只是加分，把过去你实拍做不到的变得更好，但并不代表，有这个武器的人就能替代你，我们喜欢的是你的创意和商业的结合，这并不是其他人可以代替的。这给了我很大的信心。 2⃣ 15秒不能代表150秒：大家现在看到的几乎都是Seedance生成的15秒视频，在这个时间段里，它是无敌的，所以最可能被干掉的是15秒的短视频，但是如果跨度到了150秒呢？就像一个钢铁巨人，每一个零件都是坚固的，那么最薄弱的就是连接处的关节。150秒的视频就像这个巨人，而最脆弱的就是如何把15秒的视频完整统一的串联成一个故事或者一段情节。而这时候，专业的导演思维就可以很好的解决这个问题。 3⃣ 150秒不代表能变现：那么是不是有经验的导演就可以制作出好的作品呢？我只能说会比普通人容易一些，但不是绝对，因为传统导演很容易陷入传统思维，但Seedance恰恰需要的是天马行空的创意。另外一点，即使你可以顺利的完成一部作品，但别忘记了，这是一个商业作品，不是你喜欢，很完整就可以的，太多时候需要平衡客户的想法，客户的意见，如何结合，就成了关键。 4⃣ 最大的障碍：修改商业案例不同于自我high的作品，甲方会需要有修改容错的空间，比如我昨天在设计一个案例的时候，非常完美的一个镜头，但是甲方说，背后的某一个装饰物的比例不太对，和现场有差别，需要改掉。这个时候怎么办，再好的镜头也必须放弃。那么又如何保证在原来的基础上去做修正呢？这是一个最大的难题 👺总结一下： Seedance2.0 确实给我们这个行业带来很大的冲击，未来也一定会重塑行业的规则，我想对两类人提出建议： 1、职业选手：不要盲目担心，与其害怕不如主动出击，我们福建人信仰的就是“想要赢，先下场”，相信自己的专业找到那个缺口。 2、普通小白：一个很好的时代，一个很好的工具，但别只是玩，如果只是炫技或者玩乐，那么挣钱的就只有字节，去逼自己把积分变成钱，就算是炫技，也要把流量换算成钱，对比积分，你到底挣了没有。提升专业技巧，因为如果每个小白都可以做出来的，那么，只是提高了起跑线而已，对于你没有任何提升。 👺这个帖子很长，是我一字字打出来的，希望对你有所帮助。新年到来之际，就把这首《Horse进门》送给大家，希望在AI加持下，每个人都有机会财务自由！

👺如何真正用Seedance2.0挣到钱？肖师傅首个全Seedance商业作品《Horse进门》今天正式发布，作为首个变现的作品，我想我有权力来说说大家目前存在的一些误区： 1⃣ 技术平权造成的创收假象：其实这一点我在一开始也深受困扰，大家看我前两天发布的文章，一股深深的绝望，因为我所引以为傲的技术、剪辑等等，突然就平权了，随便一个小孩，随便几句话，都可以超过我们精心制作的内容。但经过了2天的调整，我认定不能坐以待毙，于是主动出去抢客户，希望在被平权前拿到一些商业机会，但在这个过程中，我的客户给了我很大的鼓励，集中的核心就是：我们选择你，不是因为技术，技术只是加分，把过去你实拍做不到的变得更好，但并不代表，有这个武器的人就能替代你，我们喜欢的是你的创意和商业的结合，这并不是其他人可以代替的。这给了我很大的信心。 2⃣ 15秒不能代表150秒：大家现在看到的几乎都是Seedance生成的15秒视频，在这个时间段里，它是无敌的，所以最可能被干掉的是15秒的短视频，但是如果跨度到了150秒呢？就像一个钢铁巨人，每一个零件都是坚固的，那么最薄弱的就是连接处的关节。150秒的视频就像这个巨人，而最脆弱的就是如何把15秒的视频完整统一的串联成一个故事或者一段情节。而这时候，专业的导演思维就可以很好的解决这个问题。 3⃣ 150秒不代表能变现：那么是不是有经验的导演就可以制作出好的作品呢？我只能说会比普通人容易一些，但不是绝对，因为传统导演很容易陷入传统思维，但Seedance恰恰需要的是天马行空的创意。另外一点，即使你可以顺利的完成一部作品，但别忘记了，这是一个商业作品，不是你喜欢，很完整就可以的，太多时候需要平衡客户的想法，客户的意见，如何结合，就成了关键。 4⃣ 最大的障碍：修改商业案例不同于自我high的作品，甲方会需要有修改容错的空间，比如我昨天在设计一个案例的时候，非常完美的一个镜头，但是甲方说，背后的某一个装饰物的比例不太对，和现场有差别，需要改掉。这个时候怎么办，再好的镜头也必须放弃。那么又如何保证在原来的基础上去做修正呢？这是一个最大的难题 👺总结一下： Seedance2.0 确实给我们这个行业带来很大的冲击，未来也一定会重塑行业的规则，我想对两类人提出建议： 1、职业选手：不要盲目担心，与其害怕不如主动出击，我们福建人信仰的就是“想要赢，先下场”，相信自己的专业找到那个缺口。 2、普通小白：一个很好的时代，一个很好的工具，但别只是玩，如果只是炫技或者玩乐，那么挣钱的就只有字节，去逼自己把积分变成钱，就算是炫技，也要把流量换算成钱，对比积分，你到底挣了没有。提升专业技巧，因为如果每个小白都可以做出来的，那么，只是提高了起跑线而已，对于你没有任何提升。 👺这个帖子很长，是我一字字打出来的，希望对你有所帮助。新年到来之际，就把这首《Horse进门》送给大家，希望在AI加持下，每个人都有机会财务自由！

肖师傅

28,106 Aufrufe • vor 4 Monaten

微软2023年Build大会演讲：如何训练和应用GPT（中英文字幕）这是本次微软2023年Build大会来自OpenAI的AI 研究员和创始成员Andrej Karpathy的一个主题为State of GPT的演讲。演讲主要有两部分内容： 1. OpenAI是如何训练GPT的 2. 我们如何有效应用GPT 都是非常有价值的分享。首先对于如何训练GPT，通常来说是四个阶段预训练（Pretraining），有监督的微调（Supervised Finetuning），奖励建模（Reward Modeling）和强化学习（Reinforcement Learning），这几个阶段通常是依次进行，每个阶段都有不同的数据集。预训练（Pretraining）：这个阶段的目标是让模型学习一种语言模型，用于预测文本序列中的下一个单词。训练数据通常是互联网上的大量文本。模型从这些文本中学习词汇、语法、事实以及某种程度的推理能力。这个阶段结束后，模型可以生成一些有意义且语法正确的文本，但可能无法理解具体任务的需求。有监督的微调（Supervised Finetuning）：在预训练后，模型会进入微调阶段。在这个阶段，人类评估员将参与并给出指导，他们会给模型提供对话样本，样本中包含了输入和期望的输出。这使得模型能更好地适应特定任务或应用，例如回答问题或编写文章。奖励建模（Reward Modeling）：评估员将对模型生成的不同输出进行排名，以表示它们的质量。这个排名将被用作奖励函数，指导模型优化其生成的输出。强化学习（Reinforcement Learning）：强化学习阶段是一个迭代的过程，模型会试图优化其行为以获得最大的奖励。在这个阶段，模型会产生新的输出，评估员会对这些输出进行排名，然后模型根据这个反馈调整其行为。然后是如何有效应用GPT 在演讲中Andrej举了一个非常好的例子：人类和大语言模型（LLM）都是如何写作的？从这个例子中你能明显感觉到人类和GPT之间的差异。假设你要写一篇文章去比较加利福尼亚州和阿拉斯加州的人口，你的写作的过程中可能是像这样的： - 我需要写一篇文章去比较加利福尼亚州和阿拉斯加州的人口 - 我需要去获取两个州的人口数据 - 我不知道这两个周的人口数据 - 去维基百科找到加利福尼亚州的人口是39.2M - 去维基百科找到阿拉斯加州的人口是0.74M - 现在我需要计算一下两个州人口数相差多少倍，但是可能需要计算机帮忙 - 用计算器算出来39.2除以0.74约等于53 - 快速的检查一下53倍这个数字是不是符合常识，嗯，这是一个相当大的比值，但加利福尼亚州毕竟是人口最多的州，所以这个结果或许是合理的，可以继续 - 好了，我现在有了我需要的所有信息 - 写下：“加利福尼亚州的人口比53倍的……” - 觉得好像不太好，删除重写成：“加利福尼亚州的人口是阿拉斯加州的53倍。” - 嗯，觉得还不错也就是说，当人类写作时，哪怕是这样一个简单的句子，可能内心实际上进行了大量的运算的。但当我们用GPT进行写作这样的句子看起来会是什么样呢？从GPT的角度看，这只是一系列的标记（Tokens）。当GPT在接收到一个输入，比如你给出的主题。它会生成一段与输入相关的文本，GPT的目标是预测下一个词，所以它会连续生成一串词，形成一段连贯的文本。从本质上看，Transformer只是标记模拟器，它不知道自己知道什么不知道什么，它不知道自己擅长什么或不擅长什么，它只是尽力生成下一个标记，它也不会进行反思，也不会不进行任何合理性检查。它不会纠正自己的错误，它只是产生抽样的标记序列，它没有像人类那样的内心独白流。但是，GPT有一些优势，如它们拥有大量的基于事实的知识，并且拥有相对大的并且完美的工作记忆。GPT通过自我注意力机制，能立即获取到上下文窗口中的信息，从而进行无损记忆。然而，GPT在推理和判断方面的能力相对较弱，如果提出的问题需要更复杂的推理，单凭一个标记的信息，GPT往往无法给出正确的答案。一些技巧可以提升GPT的表现，比如Cot（Chain of Though）设定步骤来引导GPT展示其工作过程，或者通过多次抽样然后选择最佳结果等，或者可以让GPT检查自己的输出，比如询问它是否完成了任务，最好是在Prompt中明确的要求它检查自己的输出。后面还介绍了目前比较流行的GPT应用，比如Agent、Plugin、CoT、Embedding等最后他用GPT-4写了一个结尾： “女士们，先生们，2023年Microsoft Build的创新者和先驱者们，欢迎来到这个独一无二的卓越人才的集结地。你们是未来的架构师，是塑造数字领域的视野家，在那里人类繁荣发展。拥抱科技的无限可能，让你的想法飞得和你的想象力一样高。让我们一起创造一个更连通，更出色，更包容的世界，为未来的世代留下。准备好释放你的创造力，探索未知，把梦想变成现实。你的旅程今天开始。” 原始视频地址： YouTube地址：

微软2023年Build大会演讲：如何训练和应用GPT（中英文字幕）这是本次微软2023年Build大会来自OpenAI的AI 研究员和创始成员Andrej Karpathy的一个主题为State of GPT的演讲。演讲主要有两部分内容： 1. OpenAI是如何训练GPT的 2. 我们如何有效应用GPT 都是非常有价值的分享。首先对于如何训练GPT，通常来说是四个阶段预训练（Pretraining），有监督的微调（Supervised Finetuning），奖励建模（Reward Modeling）和强化学习（Reinforcement Learning），这几个阶段通常是依次进行，每个阶段都有不同的数据集。预训练（Pretraining）：这个阶段的目标是让模型学习一种语言模型，用于预测文本序列中的下一个单词。训练数据通常是互联网上的大量文本。模型从这些文本中学习词汇、语法、事实以及某种程度的推理能力。这个阶段结束后，模型可以生成一些有意义且语法正确的文本，但可能无法理解具体任务的需求。有监督的微调（Supervised Finetuning）：在预训练后，模型会进入微调阶段。在这个阶段，人类评估员将参与并给出指导，他们会给模型提供对话样本，样本中包含了输入和期望的输出。这使得模型能更好地适应特定任务或应用，例如回答问题或编写文章。奖励建模（Reward Modeling）：评估员将对模型生成的不同输出进行排名，以表示它们的质量。这个排名将被用作奖励函数，指导模型优化其生成的输出。强化学习（Reinforcement Learning）：强化学习阶段是一个迭代的过程，模型会试图优化其行为以获得最大的奖励。在这个阶段，模型会产生新的输出，评估员会对这些输出进行排名，然后模型根据这个反馈调整其行为。然后是如何有效应用GPT 在演讲中Andrej举了一个非常好的例子：人类和大语言模型（LLM）都是如何写作的？从这个例子中你能明显感觉到人类和GPT之间的差异。假设你要写一篇文章去比较加利福尼亚州和阿拉斯加州的人口，你的写作的过程中可能是像这样的： - 我需要写一篇文章去比较加利福尼亚州和阿拉斯加州的人口 - 我需要去获取两个州的人口数据 - 我不知道这两个周的人口数据 - 去维基百科找到加利福尼亚州的人口是39.2M - 去维基百科找到阿拉斯加州的人口是0.74M - 现在我需要计算一下两个州人口数相差多少倍，但是可能需要计算机帮忙 - 用计算器算出来39.2除以0.74约等于53 - 快速的检查一下53倍这个数字是不是符合常识，嗯，这是一个相当大的比值，但加利福尼亚州毕竟是人口最多的州，所以这个结果或许是合理的，可以继续 - 好了，我现在有了我需要的所有信息 - 写下：“加利福尼亚州的人口比53倍的……” - 觉得好像不太好，删除重写成：“加利福尼亚州的人口是阿拉斯加州的53倍。” - 嗯，觉得还不错也就是说，当人类写作时，哪怕是这样一个简单的句子，可能内心实际上进行了大量的运算的。但当我们用GPT进行写作这样的句子看起来会是什么样呢？从GPT的角度看，这只是一系列的标记（Tokens）。当GPT在接收到一个输入，比如你给出的主题。它会生成一段与输入相关的文本，GPT的目标是预测下一个词，所以它会连续生成一串词，形成一段连贯的文本。从本质上看，Transformer只是标记模拟器，它不知道自己知道什么不知道什么，它不知道自己擅长什么或不擅长什么，它只是尽力生成下一个标记，它也不会进行反思，也不会不进行任何合理性检查。它不会纠正自己的错误，它只是产生抽样的标记序列，它没有像人类那样的内心独白流。但是，GPT有一些优势，如它们拥有大量的基于事实的知识，并且拥有相对大的并且完美的工作记忆。GPT通过自我注意力机制，能立即获取到上下文窗口中的信息，从而进行无损记忆。然而，GPT在推理和判断方面的能力相对较弱，如果提出的问题需要更复杂的推理，单凭一个标记的信息，GPT往往无法给出正确的答案。一些技巧可以提升GPT的表现，比如Cot（Chain of Though）设定步骤来引导GPT展示其工作过程，或者通过多次抽样然后选择最佳结果等，或者可以让GPT检查自己的输出，比如询问它是否完成了任务，最好是在Prompt中明确的要求它检查自己的输出。后面还介绍了目前比较流行的GPT应用，比如Agent、Plugin、CoT、Embedding等最后他用GPT-4写了一个结尾： “女士们，先生们，2023年Microsoft Build的创新者和先驱者们，欢迎来到这个独一无二的卓越人才的集结地。你们是未来的架构师，是塑造数字领域的视野家，在那里人类繁荣发展。拥抱科技的无限可能，让你的想法飞得和你的想象力一样高。让我们一起创造一个更连通，更出色，更包容的世界，为未来的世代留下。准备好释放你的创造力，探索未知，把梦想变成现实。你的旅程今天开始。” 原始视频地址： YouTube地址：

宝玉

298,761 Aufrufe • vor 3 Jahren