Video yükleniyor...

Video Yüklenemedi

Bu video yüklenirken bir sorun oluştu. Bu geçici bir ağ sorunundan kaynaklanıyor olabilir veya video kullanılamıyor olabilir.

Ana Sayfaya Dön

最近 FLUX 生成擦边视频和网红图看起来很火啊。其实我有个比较成体系的网红图生成方案。主要是一些保证正式感的参数和流程，还有一些保证擦边内容质量的东西。之前的问题是已有的视频模型面部表情过于僵硬，海螺刚好解决了这个问题。看看要不要整理一下。

歸藏(guizang.ai)

160,807 subscribers

164,746 görüntüleme • 1 yıl önce •via X (Twitter)

Anya Rossi• Live Now

Private livecam show

10 Yorum

歸藏(guizang.ai) profil fotoğrafı

歸藏(guizang.ai)1 yıl önce

刚刷到的，新号，这几天搞的，这就起量了

歸藏(guizang.ai) profil fotoğrafı

歸藏(guizang.ai)1 yıl önce

AI图片检测结果：

歸藏(guizang.ai) profil fotoğrafı

歸藏(guizang.ai)1 yıl önce

西乔老师这个也很厉害，这类流程商业价值都很大也相对复杂。

奇点 profil fotoğrafı

奇点1 yıl önce

国内的生图平台还是太敏感了，很多都不能生成，生成视频又走样。海螺勉强好点。

今天午餐吃甚麼？ profil fotoğrafı

今天午餐吃甚麼？1 yıl önce

昨天看到黎明的新歌MＶ，馬上想起藏師傅他這個是全AＩ視頻，超級複雜繁瑣，平均兩三秒一個畫面，總抽卡數起碼是以千為單位的，還得搭配歌詞，想分鏡，修後期🤒

歸藏(guizang.ai) profil fotoğrafı

歸藏(guizang.ai)1 yıl önce

工作量太大了

August profil fotoğrafı

August1 yıl önce

感觉以后不管生产内容的都是先生图，再用视频模型让图动起来的模式了。

通透马说 profil fotoğrafı

通透马说1 yıl önce

晃头的动作很欧美

AI geesehoward profil fotoğrafı

AI geesehoward1 yıl önce

要是图生视频能本地运行就好了，现在在线的本质还是抽卡，花钱抽卡抽到自己不想要的成本太高，也不符合经济学，利润不够成本

歸藏(guizang.ai) profil fotoğrafı

歸藏(guizang.ai)1 yıl önce

luma 有 Comfyui 插件，价格也不贵，可以接受了

Benzer Videolar

基于藏师傅 PPT Skill 的讲解视频生成 Skill，差不多搞定了！ Codex 配合远程控制不在家也可以一键产出视频内容可以用非常低的成本保证视频内容的可用性和表现力这里的视频是我随便找了一个徒步文案一次生成的。主要的内容用前端生成，只有配音和部分分镜使用音频和Seedance 2.0 模型

基于藏师傅 PPT Skill 的讲解视频生成 Skill，差不多搞定了！ Codex 配合远程控制不在家也可以一键产出视频内容可以用非常低的成本保证视频内容的可用性和表现力这里的视频是我随便找了一个徒步文案一次生成的。主要的内容用前端生成，只有配音和部分分镜使用音频和Seedance 2.0 模型

歸藏(guizang.ai)

21,925 görüntüleme • 2 ay önce

最近发现之前推荐过的 Midreal AI 互动小说游戏更新了网页版本，不需要在 Discord 里面使用了。我尝试了一下将每句话都生成图片做视频小说，效果很不错。这次升级非常强大，Midreal已经不只是小说生成工具，正在朝着互动式内容消费平台进化。网页版本的Midreal每一句话都可以生成对应的图片，现在还是免费的，做互动小说生成视频搞流量也不错，还没有原创性问题。每句都能生成图片之后，比之前到分支的时候才生成会强非常多，图片从原来的DALL-E3 变成了他们自己训练的 SD 模型，图像质量和提示词遵循都比之前强很多。除了支持生成图片之外，现在网页版的Midreal分享功能也非常好用，分享出去就是一个带插图的完整小说页面，阅读体验很不错，还有评论和转发能力。他们自己训练的图像模型现在也有一个专门的页面可以使用，只用来生成图片也是可以的。感觉模型能力也有了比较大的提升，之前中文的小说都会有逻辑问题，这次尝试之后好了很多。这里尝试网页版Midreal：

最近发现之前推荐过的 Midreal AI 互动小说游戏更新了网页版本，不需要在 Discord 里面使用了。我尝试了一下将每句话都生成图片做视频小说，效果很不错。这次升级非常强大，Midreal已经不只是小说生成工具，正在朝着互动式内容消费平台进化。网页版本的Midreal每一句话都可以生成对应的图片，现在还是免费的，做互动小说生成视频搞流量也不错，还没有原创性问题。每句都能生成图片之后，比之前到分支的时候才生成会强非常多，图片从原来的DALL-E3 变成了他们自己训练的 SD 模型，图像质量和提示词遵循都比之前强很多。除了支持生成图片之外，现在网页版的Midreal分享功能也非常好用，分享出去就是一个带插图的完整小说页面，阅读体验很不错，还有评论和转发能力。他们自己训练的图像模型现在也有一个专门的页面可以使用，只用来生成图片也是可以的。感觉模型能力也有了比较大的提升，之前中文的小说都会有逻辑问题，这次尝试之后好了很多。这里尝试网页版Midreal：

歸藏(guizang.ai)

48,993 görüntüleme • 2 yıl önce

利用Hermes去使用ComfyUI实现免费生成图片和视频。上次我介绍了ComfyUI可在本地部署并且自有本地大模型，不用调用其他付费大模型。并且30/40/50显卡都可以去用，当然配置越高生成的质量就越好。大家按需去用即可。 ComfyUI我认为对于新手来说应该是不怎么难，但是还是有很多兄弟们给狙击手私信问各种操作类型的问题。那么这次我专门做了次实验就是利用Hermes去调用本地的ComfyUI去实现生图以及做视频，目前来看是可行的，至于整体的质量还要去慢慢的调试。我其实是建议大家还是把ComfyUI去系统性的学一下的，网上有各种免费的教程的。我认为既然享受这些免费开源的好软件了，就稍微用用心。哈哈，毕竟它是不要钱的。下面的视频看一下我第一次调用ComfyUI，生成的第一张图片的结果吧。你们看看怎么样？对了我引用的推文里面有ComfyUI的安装包，免费自取！

利用Hermes去使用ComfyUI实现免费生成图片和视频。上次我介绍了ComfyUI可在本地部署并且自有本地大模型，不用调用其他付费大模型。并且30/40/50显卡都可以去用，当然配置越高生成的质量就越好。大家按需去用即可。 ComfyUI我认为对于新手来说应该是不怎么难，但是还是有很多兄弟们给狙击手私信问各种操作类型的问题。那么这次我专门做了次实验就是利用Hermes去调用本地的ComfyUI去实现生图以及做视频，目前来看是可行的，至于整体的质量还要去慢慢的调试。我其实是建议大家还是把ComfyUI去系统性的学一下的，网上有各种免费的教程的。我认为既然享受这些免费开源的好软件了，就稍微用用心。哈哈，毕竟它是不要钱的。下面的视频看一下我第一次调用ComfyUI，生成的第一张图片的结果吧。你们看看怎么样？对了我引用的推文里面有ComfyUI的安装包，免费自取！

DeFi狙击手 | Ai🕊️

34,943 görüntüleme • 1 ay önce

今天在Producthunt发现一个AI模型Kombai，可以理解Figma的界面设计并生成对应的前端代码，下面是他们官网的演示视频。从演示来看生成的代码还是不错的，它的优势在于他不要求设计稿的格式、层级和是否使用组件，无论你怎么嵌套和画出的界面它都能理解。这比之前通过传统工程化思路从设计稿生成代码要强多了。之前的一些工具要不是处理不了复杂样式，要不就是对设计师的设计稿格式有非常严格的要求。同时这个模型也支持通过自然语言生成前端界面的代码。官网链接：

今天在Producthunt发现一个AI模型Kombai，可以理解Figma的界面设计并生成对应的前端代码，下面是他们官网的演示视频。从演示来看生成的代码还是不错的，它的优势在于他不要求设计稿的格式、层级和是否使用组件，无论你怎么嵌套和画出的界面它都能理解。这比之前通过传统工程化思路从设计稿生成代码要强多了。之前的一些工具要不是处理不了复杂样式，要不就是对设计师的设计稿格式有非常严格的要求。同时这个模型也支持通过自然语言生成前端界面的代码。官网链接：

歸藏(guizang.ai)

78,671 görüntüleme • 2 yıl önce

怎样将保存一个完整的网站到本地？直接使用页面另存为会有非常多的问题，主要是静态资源的问题，比如图片不显示等等。原帖是一个非常火的讨论：方案一：找到一个开源库 SingleFile：提供各种浏览器插件以及 CLI 工具可以很方便的完成站点的一键保存。有 14.9K 个 star。方案二：原帖中的一段 Gist 代码，我看了一下处理：使用FileReader 读取，external css 转换成 inline，并且修改地址到 absolute，图片转换成 base64 images。这两个方案都是值得收藏看看。大家如果有更好的方案也可以分享一下。

怎样将保存一个完整的网站到本地？直接使用页面另存为会有非常多的问题，主要是静态资源的问题，比如图片不显示等等。原帖是一个非常火的讨论：方案一：找到一个开源库 SingleFile：提供各种浏览器插件以及 CLI 工具可以很方便的完成站点的一键保存。有 14.9K 个 star。方案二：原帖中的一段 Gist 代码，我看了一下处理：使用FileReader 读取，external css 转换成 inline，并且修改地址到 absolute，图片转换成 base64 images。这两个方案都是值得收藏看看。大家如果有更好的方案也可以分享一下。

Viking

132,637 görüntüleme • 1 yıl önce

在上个月，我分享了一个 Demo，很多人都来问我如何实现，我这里简单说下从前期生图到视频生成以及开发交付落地整个流程，希望能帮到你。主要用到的工具是即梦（图片生成）和可灵（视频生成）生成后的的视频可以通过配置图层混合来进行交付

在上个月，我分享了一个 Demo，很多人都来问我如何实现，我这里简单说下从前期生图到视频生成以及开发交付落地整个流程，希望能帮到你。主要用到的工具是即梦（图片生成）和可灵（视频生成）生成后的的视频可以通过配置图层混合来进行交付

Paidax

37,642 görüntüleme • 1 yıl önce

NotebookLM生成视频时，会使用nano banana生成视频里的配图了。整体能力提升特别大，有视频，有语音（中文稍有瑕疵但问题不大），视频内容有配图有文字（文字是程序写上去的不是生成的）。如果内容足够好，用NotebookLM发自媒体也不是不行。下方是我上传了纳瓦尔宝典生成的视频。

NotebookLM生成视频时，会使用nano banana生成视频里的配图了。整体能力提升特别大，有视频，有语音（中文稍有瑕疵但问题不大），视频内容有配图有文字（文字是程序写上去的不是生成的）。如果内容足够好，用NotebookLM发自媒体也不是不行。下方是我上传了纳瓦尔宝典生成的视频。

Gorden Sun

26,983 görüntüleme • 9 ay önce

一个模型搞定视频+音频+口型! 你看到的这个就是 LTX 刚刚发布的 LTX-2 开放权重大模型, 这个模型可以文生视频或者图生视频, 这个模型最大的特点是在保证了画质和一致性的同时, 可以生成音频! 而且音频和口型完全适配! 并且说话人神态也非常棒! 模型大小是 19B, 相当可用! 演示视频是我用 HuggingFace Zero GPU 生成的 demo, 10秒视频大概需要5分钟左右生成时间. 我测试目前来看最大的优点就是口型和声音生成得非常好, 并且一致性很高. 指定人物使用什么样的银色就能稳定生成. 当然模型也有不足之处, 主要是还是偶尔能看到模型生成人物皮肤的那种油腻感. 当然官方的 pro 版本在这点上处理的更好, 并且 pro 版本支持4K分辨率输出, 当然 pro 版本是没有开源的.

一个模型搞定视频+音频+口型! 你看到的这个就是 LTX 刚刚发布的 LTX-2 开放权重大模型, 这个模型可以文生视频或者图生视频, 这个模型最大的特点是在保证了画质和一致性的同时, 可以生成音频! 而且音频和口型完全适配! 并且说话人神态也非常棒! 模型大小是 19B, 相当可用! 演示视频是我用 HuggingFace Zero GPU 生成的 demo, 10秒视频大概需要5分钟左右生成时间. 我测试目前来看最大的优点就是口型和声音生成得非常好, 并且一致性很高. 指定人物使用什么样的银色就能稳定生成. 当然模型也有不足之处, 主要是还是偶尔能看到模型生成人物皮肤的那种油腻感. 当然官方的 pro 版本在这点上处理的更好, 并且 pro 版本支持4K分辨率输出, 当然 pro 版本是没有开源的.

karminski-牙医

19,832 görüntüleme • 6 ay önce

AI 视频生成，到各种 AI Agent，我一直在思考一个问题：AI 最终会如何改变人类创造和体验数字世界的方式？最开始，AI 帮助我们生成文字和图片；后来，它开始生成越来越逼真的视频。但无论画面质量提升到什么程度，这些内容依然存在一个限制——我们仍然只是观看者。我们可以欣赏 AI 创造出来的场景，却无法真正进入其中，也无法与这个世界产生互动。最近体验 Alaya World Alaya Lab 后，我第一次感觉，AI 视频生成正在探索一个新的方向：它不只是生成一段视频，而是在尝试生成一个可以被探索的世界。 Alaya World 是 Alaya Lab 推出的交互式视频世界模型。用户可以通过文字、图片或者视频作为初始条件，让模型生成一个动态世界。不同于传统视频生成模型“输入 Prompt，输出一段固定视频”的方式，Alaya World 更像是在探索过程中持续构建环境，用户可以在生成的世界中移动视角，并通过交互指令触发新的事件。这也是我认为世界模型和普通视频生成模型最大的区别。过去的视频生成模型解决的是“如何生成一段更加真实的视频”，而世界模型尝试解决的问题是“如何让一个世界持续存在”。如果你进入一个虚拟城市，向前探索，然后回头，你期待看到的是同一个城市，而不是一个重新随机生成的场景。这背后涉及世界模型最核心的挑战：长时间生成的一致性。模型不仅需要知道下一帧画面应该是什么，还需要理解空间关系、历史状态以及用户行为对世界造成的影响。 Alaya World 在技术层面通过空间记忆机制、历史信息保留以及抗漂移训练等方式，提高长时间生成过程中的稳定性。目前模型支持 720p / 24 FPS 实时流式生成，并展示了超过一分钟的连续探索能力。让我觉得这个方向有意思的地方，是它可能会重新定义未来数字内容的生产方式。以游戏行业为例，过去一个虚拟世界需要大量人工制作：美术设计地图、程序编写规则、策划设计剧情。开发者需要提前创造一个固定世界，而玩家进入后按照既定规则体验。但如果世界模型进一步发展，未来的游戏可能不再只是“开发者搭建世界，玩家进入世界”，而是“开发者定义规则，AI 实时生成世界”。玩家体验的不再是一个完全预设好的内容，而是一个随着交互不断变化的环境。当然，Alaya World 目前仍然处于早期阶段。实时生成所需的算力成本、复杂环境理解能力，以及更长期、更稳定的世界一致性，都还有很多问题需要解决。但它让我看到一个值得关注的趋势：AI 的竞争可能不会只停留在生成更漂亮的图片和视频，而是进一步走向创造更真实、更连续、更可交互的世界。过去，人类通过电影记录想象，通过游戏创造虚拟空间。而未来，也许我们只需要描述一个想法，AI 就可以帮助我们生成一个能够进入其中、探索其中的世界。从生成内容，到生成世界，这可能是 AI 下一阶段最值得期待的变化之一。

AI 视频生成，到各种 AI Agent，我一直在思考一个问题：AI 最终会如何改变人类创造和体验数字世界的方式？最开始，AI 帮助我们生成文字和图片；后来，它开始生成越来越逼真的视频。但无论画面质量提升到什么程度，这些内容依然存在一个限制——我们仍然只是观看者。我们可以欣赏 AI 创造出来的场景，却无法真正进入其中，也无法与这个世界产生互动。最近体验 Alaya World Alaya Lab 后，我第一次感觉，AI 视频生成正在探索一个新的方向：它不只是生成一段视频，而是在尝试生成一个可以被探索的世界。 Alaya World 是 Alaya Lab 推出的交互式视频世界模型。用户可以通过文字、图片或者视频作为初始条件，让模型生成一个动态世界。不同于传统视频生成模型“输入 Prompt，输出一段固定视频”的方式，Alaya World 更像是在探索过程中持续构建环境，用户可以在生成的世界中移动视角，并通过交互指令触发新的事件。这也是我认为世界模型和普通视频生成模型最大的区别。过去的视频生成模型解决的是“如何生成一段更加真实的视频”，而世界模型尝试解决的问题是“如何让一个世界持续存在”。如果你进入一个虚拟城市，向前探索，然后回头，你期待看到的是同一个城市，而不是一个重新随机生成的场景。这背后涉及世界模型最核心的挑战：长时间生成的一致性。模型不仅需要知道下一帧画面应该是什么，还需要理解空间关系、历史状态以及用户行为对世界造成的影响。 Alaya World 在技术层面通过空间记忆机制、历史信息保留以及抗漂移训练等方式，提高长时间生成过程中的稳定性。目前模型支持 720p / 24 FPS 实时流式生成，并展示了超过一分钟的连续探索能力。让我觉得这个方向有意思的地方，是它可能会重新定义未来数字内容的生产方式。以游戏行业为例，过去一个虚拟世界需要大量人工制作：美术设计地图、程序编写规则、策划设计剧情。开发者需要提前创造一个固定世界，而玩家进入后按照既定规则体验。但如果世界模型进一步发展，未来的游戏可能不再只是“开发者搭建世界，玩家进入世界”，而是“开发者定义规则，AI 实时生成世界”。玩家体验的不再是一个完全预设好的内容，而是一个随着交互不断变化的环境。当然，Alaya World 目前仍然处于早期阶段。实时生成所需的算力成本、复杂环境理解能力，以及更长期、更稳定的世界一致性，都还有很多问题需要解决。但它让我看到一个值得关注的趋势：AI 的竞争可能不会只停留在生成更漂亮的图片和视频，而是进一步走向创造更真实、更连续、更可交互的世界。过去，人类通过电影记录想象，通过游戏创造虚拟空间。而未来，也许我们只需要描述一个想法，AI 就可以帮助我们生成一个能够进入其中、探索其中的世界。从生成内容，到生成世界，这可能是 AI 下一阶段最值得期待的变化之一。

Ashlyn He

11,709 görüntüleme • 13 gün önce

这种宣传大片制作成本怎么着也要5万人民币吧我给海南封关做了一个宣传视频，几乎0成本不要写剧本，不要写脚本，不要生成参考图我就说了一句话描述我的需求，10分钟就可以生成一个高级感的视频视频脚本、场景图片、旁白、背景音乐都是由Medeo完成。只需要一句提示词：制作一个30秒左右的中国海南封关的宣传视频，讲解封关的具体过程以及封关对中国乃至世界的重要性。我发现Medeo与传统的AI视频工具（Sora、Veo3等）的最大的优点是：只需要通过对话的方式，描述你的需求，系统会自动根据你的需求进行脚本编写、分镜图片生成、声音和背景音乐的生成和组装。而且生成的小片段可以独立修改，不用再调整和重新生成整个视频，这个做局部视频编辑就很方便了。同时支持全品类内容生成：比如真人电影、广告制作、动漫短剧、MV或歌曲、科普解说、产品宣传、PPT风格视频等等，这些在官网都可以看见案例。详细制作和生成过程可以看评论区视频对于刚开始玩的兄弟们，建议不要生成太长的视频生成一个5-10秒的视频感受下，因为长的视频比较消耗积分。工具地址：

这种宣传大片制作成本怎么着也要5万人民币吧我给海南封关做了一个宣传视频，几乎0成本不要写剧本，不要写脚本，不要生成参考图我就说了一句话描述我的需求，10分钟就可以生成一个高级感的视频视频脚本、场景图片、旁白、背景音乐都是由Medeo完成。只需要一句提示词：制作一个30秒左右的中国海南封关的宣传视频，讲解封关的具体过程以及封关对中国乃至世界的重要性。我发现Medeo与传统的AI视频工具（Sora、Veo3等）的最大的优点是：只需要通过对话的方式，描述你的需求，系统会自动根据你的需求进行脚本编写、分镜图片生成、声音和背景音乐的生成和组装。而且生成的小片段可以独立修改，不用再调整和重新生成整个视频，这个做局部视频编辑就很方便了。同时支持全品类内容生成：比如真人电影、广告制作、动漫短剧、MV或歌曲、科普解说、产品宣传、PPT风格视频等等，这些在官网都可以看见案例。详细制作和生成过程可以看评论区视频对于刚开始玩的兄弟们，建议不要生成太长的视频生成一个5-10秒的视频感受下，因为长的视频比较消耗积分。工具地址：

松果先森

54,067 görüntüleme • 6 ay önce

这是一期视频回答☝️ 我发现这种方式我的脑子很容易转不过来，回答的都比较简略还是希望大家能多多问我一些有趣的问题🤓 #匿名问答

这是一期视频回答☝️ 我发现这种方式我的脑子很容易转不过来，回答的都比较简略还是希望大家能多多问我一些有趣的问题🤓 #匿名问答

咕噜咕噜

33,207 görüntüleme • 4 ay önce

Pixverse 发布 R1 实时视频世界模型藏师傅也试了一下前几天测试的 Pixverse R1 终于发布了，这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。极限情况下可以实时生成 1080P 的高清视频，感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验，目前他们在一个单独的平台测试需要邀请码。你可以选择预制的的三个主题进行体验，三个主题分别是巨龙巢穴、二战主题、海底世界，正式版本会增加到 6 个。也可以创建自己的主题，选择画面比例、风格输入主题相关提示词就可以了。生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。而且这里生成的视频居然还是带音乐、音效混合旁白的，比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有：这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流，接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构，用来实现无限连续的生成，还使用了增加注意力机制，确保长时间生成的内容一致性。为了适配实时视频生成的性能，他们将原来的迭代降噪逻辑进行了多项优化，他们叫瞬时响应引擎 (IRE)，主要包括三个优化： Temporal Trajectory Folding：传统模型从噪点到清晰图像需要迭代几十步，他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification：直接将传统的 CFG 逻辑蒸馏到了模型参数内部，节省了时间。 Adaptive Sparse Attention：生成高分辨率的视频的时候让模型学会学会“抓大放小”，自动识别重要区域进行精细计算，大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试，生成的分辨率是 480P，过几天会提高到 720P。

Pixverse 发布 R1 实时视频世界模型藏师傅也试了一下前几天测试的 Pixverse R1 终于发布了，这是一个可以实时生成并且可以随时通过提示词介入修改后续内容的世界模型。极限情况下可以实时生成 1080P 的高清视频，感觉成本再下来一点以后 AI 游戏和交互式的影视内容有戏了啊。 ------ 简单介绍一下使用体验，目前他们在一个单独的平台测试需要邀请码。你可以选择预制的的三个主题进行体验，三个主题分别是巨龙巢穴、二战主题、海底世界，正式版本会增加到 6 个。也可以创建自己的主题，选择画面比例、风格输入主题相关提示词就可以了。生成之后主要的互动就是在他播放的过程中输入提示词来改变当前视频生成的剧情走向。而且这里生成的视频居然还是带音乐、音效混合旁白的，比以前所谓的实时生成的模型强了不少。 ------ 算法和架构上主要的优化有：这是个原生的多模态模型支持将文本、图像、视频、音频统一为连续的 Token 流，接受任何模态的输入。 PixVerse-R1 改成了非扩散的自回归架构，用来实现无限连续的生成，还使用了增加注意力机制，确保长时间生成的内容一致性。为了适配实时视频生成的性能，他们将原来的迭代降噪逻辑进行了多项优化，他们叫瞬时响应引擎 (IRE)，主要包括三个优化： Temporal Trajectory Folding：传统模型从噪点到清晰图像需要迭代几十步，他们直接暴力压缩到仅需 1–4 步。 Guidance Rectification：直接将传统的 CFG 逻辑蒸馏到了模型参数内部，节省了时间。 Adaptive Sparse Attention：生成高分辨率的视频的时候让模型学会学会“抓大放小”，自动识别重要区域进行精细计算，大幅降低计算负载。 ------- 目前由于成本问题需要邀请码才能测试，生成的分辨率是 480P，过几天会提高到 720P。

歸藏(guizang.ai)

16,373 görüntüleme • 6 ay önce

今天给易论AI的亚婷1小时从0到1 开发一个她的Skills 我们都有点惊讶，这就出来了？亚婷一直问我，AI编程和Skills的关系是什么我说，过去都认为AI编程必须要做出产品其实最近我也有转变 AI编程其实解决问题就好 Skills就是一个轻量化Vibe就能解决问题的好方案

今天给易论AI的亚婷1小时从0到1 开发一个她的Skills 我们都有点惊讶，这就出来了？亚婷一直问我，AI编程和Skills的关系是什么我说，过去都认为AI编程必须要做出产品其实最近我也有转变 AI编程其实解决问题就好 Skills就是一个轻量化Vibe就能解决问题的好方案

AI产品黄叔

15,905 görüntüleme • 6 ay önce

近日，香港一网红发视频称，对内地游客总喜欢“亚洲蹲”而感到不解，于是他们推者轮椅，见到蹲在路边的内地游客便询问对方：我看你蹲了好久，你是不是腰椎有问题，要不要坐轮椅。视频结尾这对网红表示：原来你们腰骨都没问题，那就赶紧站起来，找个位置坐吧。

近日，香港一网红发视频称，对内地游客总喜欢“亚洲蹲”而感到不解，于是他们推者轮椅，见到蹲在路边的内地游客便询问对方：我看你蹲了好久，你是不是腰椎有问题，要不要坐轮椅。视频结尾这对网红表示：原来你们腰骨都没问题，那就赶紧站起来，找个位置坐吧。

李老师不是你老师

2,471,272 görüntüleme • 1 yıl önce

准备定期分享一些觉得有用的 Google Claude 的免费的基础 AI 教学内容。🫶🫶🫶 毕竟 Vibe Coding 虽然好玩，但核心还是能将 AI 的技术融入到自己 Vibe Coding 出来的产品里面，那样才比较酷啊！所以最近我也在各种看教学内容。今天这个主要是 Google Skills 里面的“生成式 AI 简介”课程。（但实际上和 AI 相关的课程有很多，这个比较简单而已）里面关于 AI 和 LLM 的介绍还是很不错的，浅显易懂。视频质量也非常好，视频之后还有 Badge 和 Quiz。算是寓教于乐了！

准备定期分享一些觉得有用的 Google Claude 的免费的基础 AI 教学内容。🫶🫶🫶 毕竟 Vibe Coding 虽然好玩，但核心还是能将 AI 的技术融入到自己 Vibe Coding 出来的产品里面，那样才比较酷啊！所以最近我也在各种看教学内容。今天这个主要是 Google Skills 里面的“生成式 AI 简介”课程。（但实际上和 AI 相关的课程有很多，这个比较简单而已）里面关于 AI 和 LLM 的介绍还是很不错的，浅显易懂。视频质量也非常好，视频之后还有 Badge 和 Quiz。算是寓教于乐了！

Penny777 🦊

15,837 görüntüleme • 7 ay önce

🚨还是让肖师傅来盘一盘，Skill做视频这件事本质上，Skill做视频有两条路： 1、忽略质量，只需要制作一个类似会动的PPT，用来辅助自媒体完成内容讲解，但注意，因为视频效果一般，所以必须要本体的内容有干货，Skill只是辅助。如果选择这样，还是比较合算的，因为节约的是不会制作视频的博主的一个痛点。 2、不要妄想一键一个Skill生成视频，本质上它就是一个有操作权限的GEM，所以必须使用GEM思维，一个Skill是无法完成复杂的视频的，只能利用它可以生成文件的特质，生成素材之后，再由另一个Skill进行拼接，当然，这个部分我觉得只能给他一些模板，做些简单的固定搭配的工作。而且这个部分通过我的计算，容错率加上之后，成本和手搓差不多，但风格上就需要固化。即使不能一键成片，至少还有素材打底。另外，别妄想一句话生成一个效果很棒的视频，还是那句话，本质上它还是一个按照固定路径执行的GEM，所以引导和命令依然是重要的，区别是，现在你需要把各种可能得变量都要写进去。 👻来看看肖师傅用Skill制作的视频，但作为商业片我不会选择使用claude code来跑这种商业广告，太费钱了。

🚨还是让肖师傅来盘一盘，Skill做视频这件事本质上，Skill做视频有两条路： 1、忽略质量，只需要制作一个类似会动的PPT，用来辅助自媒体完成内容讲解，但注意，因为视频效果一般，所以必须要本体的内容有干货，Skill只是辅助。如果选择这样，还是比较合算的，因为节约的是不会制作视频的博主的一个痛点。 2、不要妄想一键一个Skill生成视频，本质上它就是一个有操作权限的GEM，所以必须使用GEM思维，一个Skill是无法完成复杂的视频的，只能利用它可以生成文件的特质，生成素材之后，再由另一个Skill进行拼接，当然，这个部分我觉得只能给他一些模板，做些简单的固定搭配的工作。而且这个部分通过我的计算，容错率加上之后，成本和手搓差不多，但风格上就需要固化。即使不能一键成片，至少还有素材打底。另外，别妄想一句话生成一个效果很棒的视频，还是那句话，本质上它还是一个按照固定路径执行的GEM，所以引导和命令依然是重要的，区别是，现在你需要把各种可能得变量都要写进去。 👻来看看肖师傅用Skill制作的视频，但作为商业片我不会选择使用claude code来跑这种商业广告，太费钱了。

肖师傅

16,310 görüntüleme • 6 ay önce

分享一下如何快速生成高质量的小红书封面以及标题的工作流。做了一个视频版本的。核心提示词： “一个爆款封面的公式，封面需要三要素:给谁看、解决什么问题、可以得到成果基于这个原则，我们重新设置一个标题，以及封面呢？” 我认为关键的操作步骤： 1.提供了我的人物封面（让其融合进封面） 2. 垫图了高质量的封面案例参考 ———————————— 详细的步骤，可见下面的视频操作：详细的文字版教程，可见我转推的下面的推文：（优惠链接也在这个推文中）

分享一下如何快速生成高质量的小红书封面以及标题的工作流。做了一个视频版本的。核心提示词： “一个爆款封面的公式，封面需要三要素:给谁看、解决什么问题、可以得到成果基于这个原则，我们重新设置一个标题，以及封面呢？” 我认为关键的操作步骤： 1.提供了我的人物封面（让其融合进封面） 2. 垫图了高质量的封面案例参考 ———————————— 详细的步骤，可见下面的视频操作：详细的文字版教程，可见我转推的下面的推文：（优惠链接也在这个推文中）

我真的没有拼多多

46,542 görüntüleme • 6 ay önce

过去两年，AI 视频一直在卷画质、时长和真实感。但对世界模型来说，生成得越长，反而越容易暴露一个致命问题：它根本记不住自己刚刚生成过什么。 AlayaWorld 想解决的，就是这个比画质更难的问题。一段视频，只要前后几帧看起来连贯，观众通常不会深究背后的空间是否真的存在。但世界不一样。你往前走了一段路，转身回来，刚才的房子还得在那里。你中途召唤了一只怪物，模型不但要马上给出反馈，还得让这件事自然地发生在同一个世界里。这也是为什么世界模型最难的地方，不是生成，而是状态管理。 AlayaWorld 为这件事加了三层机制： 1. 3D Cache 负责记住东西在哪里。模型离开一个区域再回来时，可以重新找到之前的空间信息。 2. 压缩后的画面历史负责记住刚才发生了什么。它不需要把所有旧画面一直塞进上下文，但又不能把过去全部忘掉。 3.漂移训练和 Error Bank，负责处理模型自己制造的错误。因为生成时间越长，前面一个小错误就越可能污染后面的所有画面。看到这里，我突然发现，世界模型和 Agent 其实在解决同一个问题。 Agent 运行久了会 context rot，忘记原始任务，被错误的历史信息带偏。世界模型运行久了也会，只不过它忘记的不是文字，而是街道、建筑、人物和刚刚发生过的事。所以 AI 的下一场竞争，可能不只是生成质量。视频模型比的是单次输出。世界模型比的是持续运行。谁能让 AI 在运行过程中记得住、改得动、错了还能拉回来，谁才有机会把一次生成变成一个真正可以进入的世界。 AlayaWorld 目前还更像研究级原型。公开的推理流程需要首帧图片、相机轨迹和 Prompt，离普通人打开网页就能玩还有距离。但它已经把推理代码和模型权重公开了。这个方向终于不只是看一段官方 Demo，而是可以被下载、检查和验证 Alaya Lab

过去两年，AI 视频一直在卷画质、时长和真实感。但对世界模型来说，生成得越长，反而越容易暴露一个致命问题：它根本记不住自己刚刚生成过什么。 AlayaWorld 想解决的，就是这个比画质更难的问题。一段视频，只要前后几帧看起来连贯，观众通常不会深究背后的空间是否真的存在。但世界不一样。你往前走了一段路，转身回来，刚才的房子还得在那里。你中途召唤了一只怪物，模型不但要马上给出反馈，还得让这件事自然地发生在同一个世界里。这也是为什么世界模型最难的地方，不是生成，而是状态管理。 AlayaWorld 为这件事加了三层机制： 1. 3D Cache 负责记住东西在哪里。模型离开一个区域再回来时，可以重新找到之前的空间信息。 2. 压缩后的画面历史负责记住刚才发生了什么。它不需要把所有旧画面一直塞进上下文，但又不能把过去全部忘掉。 3.漂移训练和 Error Bank，负责处理模型自己制造的错误。因为生成时间越长，前面一个小错误就越可能污染后面的所有画面。看到这里，我突然发现，世界模型和 Agent 其实在解决同一个问题。 Agent 运行久了会 context rot，忘记原始任务，被错误的历史信息带偏。世界模型运行久了也会，只不过它忘记的不是文字，而是街道、建筑、人物和刚刚发生过的事。所以 AI 的下一场竞争，可能不只是生成质量。视频模型比的是单次输出。世界模型比的是持续运行。谁能让 AI 在运行过程中记得住、改得动、错了还能拉回来，谁才有机会把一次生成变成一个真正可以进入的世界。 AlayaWorld 目前还更像研究级原型。公开的推理流程需要首帧图片、相机轨迹和 Prompt，离普通人打开网页就能玩还有距离。但它已经把推理代码和模型权重公开了。这个方向终于不只是看一段官方 Demo，而是可以被下载、检查和验证 Alaya Lab

泊舟

478,341 görüntüleme • 14 gün önce

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上，陶哲轩做了一次 AI 和数学的演讲，非常精彩，从数学使用计算计算机的历史开始讲起，一直讲到大语言模型，干货相当多，尤其适合对数学有兴趣的同学。（对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看）先摘录几个冷知识： 1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘 2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。并且陶哲轩提到了基于大语言模型的一些改进的方案：比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？陶哲轩也给出了他的看法： > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。他还提到了一些可能的 AI 能在数学领域提供帮助的方向： - AI 能够非常好地生成有价值的猜想 > 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。演讲环节结束前的最后一句话说的特别好： > 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。原始 YT 视频：

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上，陶哲轩做了一次 AI 和数学的演讲，非常精彩，从数学使用计算计算机的历史开始讲起，一直讲到大语言模型，干货相当多，尤其适合对数学有兴趣的同学。（对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看）先摘录几个冷知识： 1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘 2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。并且陶哲轩提到了基于大语言模型的一些改进的方案：比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？陶哲轩也给出了他的看法： > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。他还提到了一些可能的 AI 能在数学领域提供帮助的方向： - AI 能够非常好地生成有价值的猜想 > 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。演讲环节结束前的最后一句话说的特别好： > 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。原始 YT 视频：

宝玉

301,399 görüntüleme • 1 yıl önce