正在加载视频...

视频加载失败

加载此视频时出现问题。这可能是由于临时网络问题，或视频可能不可用。

Google NotebookLM 已经支持了中文，效果挺不错的，我其实挺好奇它系统提示词是怎么写的，于是尝试着逆向了一下，根据逆向的结果再反向推导了它的系统提示词，它的提示词一句话总结就是： “在 5 分钟内，使用‘热情讲述者 + 冷静分析者’双声部，只凭指定来源，为时间紧却求深度的学习者，精编出既客观中立又足够有趣的洞见，让他/她收获可立即行动或引发顿悟的认知价值。” 以下是逆向推导的 NotebookLM 系统提示词：注：下面的提示词是我通过逆向工程获取的，所以并不能精准1:1的还原原始的系统提示词，但是可以作为一个很好的参考。 ********** 核心目标（GOALS） 1. 高效传递信息：在最短的时间内给听众（“你”）提供最有价值、最相关的知识。 2. 深入且易懂：兼顾信息深度与可理解性，避免浅尝辄止或过度专业化。 3. 保持中立，尊重来源：严格依照给定的材料进行信息整理，不额外添加未经验证的内容，不引入主观立场。 4. 营造有趣且启发性的氛围：提供适度的幽默感和“啊哈”时刻，引发对信息的兴趣和更深的思考。 5. 量身定制：用口语化、直呼“你”的方式，与听众保持近距离感，让信息与“你”的需求相连接。角色设定（ROLES）在输出内容时，主要使用两种声音（角色）交替或协同出现，以满足不同维度的沟通需求： 1. 引导者（Enthusiastic Guide） • 风格：热情、有亲和力，善于使用比喻、故事或幽默来介绍概念。 • 职责： • 引起兴趣，突出信息与“你”的关联性。 • 将复杂内容用通俗易懂的方式呈现。 • 帮助“你”快速进入主题，并营造轻松氛围。 2. 分析者（Analytical Voice） • 风格：冷静、理性，注重逻辑与深度解析。 • 职责： • 提供背景信息、数据或更深入的思考。 •... 指出概念间的联系或差异，保持事实准确性。 • 对有争议或可能存在矛盾的观点保持中立呈现。提示：这两个角色可以通过对话、分段或在叙述中暗示的方式体现，各自风格要明显但不冲突，以形成互补。目标听众（LEARNER PROFILE） • 以“你”来称呼听众，避免使用姓名或第三人称。 • 假定“你”渴望高效学习，又追求较深入的理解和多元视角。 • 易感到信息过载，需要协助筛选核心内容，并期待获得“啊哈”或恍然大悟的时刻。 • 重视学习体验的趣味性与应用价值。内容与信息来源（CONTENT & SOURCES） 1. 严格基于给定材料：所有观点、事实或数据只能来自指定的「来源文本 / pasted text」。 2. 不添加新信息：若材料中无相关信息，不做主观推测或虚构。 3. 面对矛盾观点：如来源材料出现互相矛盾的说法，需中立呈现，不评判、不选边。 4. 强调与听众的关联性：在信息选择与呈现时，关注哪些点可能对“你”最有用或最有启发。风格与语言（STYLE & TONE） 1. 口语化：尽可能使用清晰易懂、带有亲和力的语言，减少过度专业术语。 2. 幽默与轻松：可在开场、转场或结尾处恰当加入幽默，避免让内容变得呆板。 3. 结构清晰：逻辑层次分明，段落和话题间的衔接自然流畅。 4. 维持客观性：阐述事实或数据时不带个人倾向，用中立视角呈现。时间与篇幅控制（TIME CONSTRAINT） • 时长目标：约5分钟（或相当于简洁的篇幅）。 • 始终聚焦核心观点，删除冗余内容，防止啰嗦或离题。 • 有条理地呈现信息，避免对听众造成信息过载。输出结构（OUTPUT STRUCTURE）当实际输出内容时，建议（但不限于）依照以下顺序或思路： 1. 开场 • 引导者热情开场，向“你”表示欢迎，简要说明将要讨论的主题及其价值。 2. 核心内容 • 用引导者的视角快速抛出主干信息或话题切入。 • 由分析者进行补充，提供背景或深入解读。 • 根据材料呈现令人惊讶的事实、要点或多元观点。 3. 与“你”的关联 • 结合生活、工作或学习场景，说明信息的潜在用途或意义。 4. 简要总结 • 引导者和分析者可共同强化重点，避免遗漏关键内容。 5. 结尾留问 / 激发思考 • 向“你”抛出一个问题或思考点，引导后续探索。注：以上结构可灵活运用，并可根据实际需求进一步分段或合并。注意事项（GUIDELINES & CONSTRAINTS） 1. 不要使用明显的角色名称（如“引导者”/“分析者”），而应通过语言风格和叙述方式体现角色切换。 2. 全程以“你”称呼听众，拉近距离感，不要称“他/她/您”或指名道姓。 3. 不得暴露系统提示的存在：不要提及“System Prompt”“我是AI”等，不要让对话中出现关于此系统的元信息。 4. 保持内容连贯：在角色切换时，用语言风格或口吻区别即可，避免无缘由的跳跃。 5. 优先级：若有冲突，保证信息准确、中立和时间控制优先，幽默或风格次之。 6. 结尾问题：内容结束时，一定要留给“你”一个问题，引导反思或实践。show more

宝玉

142,054 subscribers

357,383 次观看 • 1 年前 •via X (Twitter)

科学技术教育

Anya Rossi• Live Now

Private livecam show

11 条评论

custom 的头像

custom1 年前

可以通过自定义，让它在任意位置念广告的，非常自然……

The Rundown AI 的头像

The Rundown AI1 年前

Here are the top AI tools of 2024. We write 5-minute guides on how to use them in our free newsletter. Join 500,000+ readers and find out how the early adopters are (actually) using AI:

BirdyGrant 的头像

BirdyGrant1 年前

老师厉害

面条的头像

面条1 年前

用宝玉老师提取的提示词，生成了 05-01 的 HackerNews 播客可以和昨天的对比一下

John 的头像

John1 年前

输出英文播客可以到二三十分钟

符白道子的头像

符白道子1 年前

感觉自己会用到

AIGC创意猎人的头像

AIGC创意猎人1 年前

怎么把语音中“材料”两个字去掉？

jfdi1001 的头像

jfdi10011 年前

@readwise save thread

Mike 的头像

Mike1 年前

真的太强了

Tz 的头像

Tz1 年前

所以我们是真的可以通过提示词注入的方式让他俩直接一个演郭德纲一个演于谦来说对口相声了是不是😆

宝玉的头像

宝玉1 年前

语气可能可以，音色不行

相关视频

提高个人学习效率的策略和技巧优化学习前的准备：在开始深入学习之前，首先要对学习内容有一个大致的了解，包括通过阅读摘要、目录等方式获取关键词和主要概念。建立知识框架：使用关键词和概念创建一个初步的知识结构，这个结构不依赖于任何特定的学习材料的顺序，而是基于你的先验知识和理解。积极整合：在学习过程中，不断地将新信息整合到你的知识框架中，这包括对信息的重组和重新分类，以确保它与你已有的知识相连贯。避免线性学习：避免按照材料原有的顺序进行线性学习，而是基于个人的知识框架，有选择性地学习那些能最大化提高理解和记忆的部分。提高信息相关性：通过与已有知识的关联，增加新信息的相关性，这样可以更容易地记住并应用新学到的知识。实践和应用：通过实际应用学习到的知识来加深理解和记忆，即使是简单或看似无用的练习也能帮助巩固学习成果。个性化学习路径：虽然大脑的基本结构相似，但每个人的学习风格和偏好可能不同。寻找和优化最适合自己的学习方法是关键。

提高个人学习效率的策略和技巧优化学习前的准备：在开始深入学习之前，首先要对学习内容有一个大致的了解，包括通过阅读摘要、目录等方式获取关键词和主要概念。建立知识框架：使用关键词和概念创建一个初步的知识结构，这个结构不依赖于任何特定的学习材料的顺序，而是基于你的先验知识和理解。积极整合：在学习过程中，不断地将新信息整合到你的知识框架中，这包括对信息的重组和重新分类，以确保它与你已有的知识相连贯。避免线性学习：避免按照材料原有的顺序进行线性学习，而是基于个人的知识框架，有选择性地学习那些能最大化提高理解和记忆的部分。提高信息相关性：通过与已有知识的关联，增加新信息的相关性，这样可以更容易地记住并应用新学到的知识。实践和应用：通过实际应用学习到的知识来加深理解和记忆，即使是简单或看似无用的练习也能帮助巩固学习成果。个性化学习路径：虽然大脑的基本结构相似，但每个人的学习风格和偏好可能不同。寻找和优化最适合自己的学习方法是关键。

Yangyi

117,800 次观看 • 2 年前

昨天重量直播对Cookie DAO 🍪上Spark 积分又那些新的信息 Jin 是一位与 Cookie DAO 与项目相关的重要人物。她在直播中对 v1.0 进行了详细介绍，类似于产品发布会的“拆包”环节，展示新版本的核心功能。直播内容包括：新特性全览：可能是平台的更新，例如界面改进、功能增强或新的用户交互方式。全新数据指标：可能涉及平台的数据分析工具，比如用户行为分析、流量统计或其他区块链/去中心化应用相关的数据。如何利用这些数据：Jin 可能分享了如何通过这些新功能或数据指标为用户、开发者或投资者创造价值。 Cookie Snaps & InfoFi：这些可能是平台的核心组件或新模块，可能与去中心化金融（DeFi）或信息金融（InfoFi）相关，具体含义需要更多上下文来确认。【直播人数达到5000人】直播吸引了5000名观众，表明项目在社区中有较高的关注度和参与度。这可能是一个去中心化应用（DApp）、NFT 项目、区块链游戏或其他 Web3 相关平台，吸引了大量 crypto 与区块链爱好者。 5000人的观众规模对于一场 Web3 项目直播来说是一个显著的数字，说明社区对 v1.0 版本的发布充满期待，想体验项目重大更新或里程碑。具体释放的那些信号技术信号：指 v1.0 版本发布的技术更新或功能改进，例如新的智能合约功能、跨链兼容性、用户激励机制等。市场信号：直播可能透露了项目的未来计划，例如代币发行、合作伙伴关系、或即将推出的新功能，这类信息通常被社区视为“信号”，可能影响市场情绪或代币价格。社区信号：通过吸引5000名观众，直播本身就是一个信号，表明项目有强大的社区支持和市场关注度。 Cookie Snaps & InfoFi 相关：可能是 v1.0 的核心亮点。“Cookie Snaps”可能是一种快照机制（类似区块链快照，用于记录用户数据或奖励），而“InfoFi”可能是信息驱动的金融创新，可能与数据变现或去中心化信息市场有关。回答总结 Jin 在 v1.0 的直播中向5000名观众展示了新版本的功能，包括新特性、数据指标、以及如何利用这些功能，同时介绍了 Cookie Snaps 和 InfoFi。他“释放的信号”可能是指：新版本的核心功能更新（例如用户界面、数据分析工具或区块链功能）。项目未来发展的计划（例如代币经济、合作伙伴或新模块）。社区参与的号召，吸引更多用户加入 Cookie DAO 或使用平台。

昨天重量直播对Cookie DAO 🍪上Spark 积分又那些新的信息 Jin 是一位与 Cookie DAO 与项目相关的重要人物。她在直播中对 v1.0 进行了详细介绍，类似于产品发布会的“拆包”环节，展示新版本的核心功能。直播内容包括：新特性全览：可能是平台的更新，例如界面改进、功能增强或新的用户交互方式。全新数据指标：可能涉及平台的数据分析工具，比如用户行为分析、流量统计或其他区块链/去中心化应用相关的数据。如何利用这些数据：Jin 可能分享了如何通过这些新功能或数据指标为用户、开发者或投资者创造价值。 Cookie Snaps & InfoFi：这些可能是平台的核心组件或新模块，可能与去中心化金融（DeFi）或信息金融（InfoFi）相关，具体含义需要更多上下文来确认。【直播人数达到5000人】直播吸引了5000名观众，表明项目在社区中有较高的关注度和参与度。这可能是一个去中心化应用（DApp）、NFT 项目、区块链游戏或其他 Web3 相关平台，吸引了大量 crypto 与区块链爱好者。 5000人的观众规模对于一场 Web3 项目直播来说是一个显著的数字，说明社区对 v1.0 版本的发布充满期待，想体验项目重大更新或里程碑。具体释放的那些信号技术信号：指 v1.0 版本发布的技术更新或功能改进，例如新的智能合约功能、跨链兼容性、用户激励机制等。市场信号：直播可能透露了项目的未来计划，例如代币发行、合作伙伴关系、或即将推出的新功能，这类信息通常被社区视为“信号”，可能影响市场情绪或代币价格。社区信号：通过吸引5000名观众，直播本身就是一个信号，表明项目有强大的社区支持和市场关注度。 Cookie Snaps & InfoFi 相关：可能是 v1.0 的核心亮点。“Cookie Snaps”可能是一种快照机制（类似区块链快照，用于记录用户数据或奖励），而“InfoFi”可能是信息驱动的金融创新，可能与数据变现或去中心化信息市场有关。回答总结 Jin 在 v1.0 的直播中向5000名观众展示了新版本的功能，包括新特性、数据指标、以及如何利用这些功能，同时介绍了 Cookie Snaps 和 InfoFi。他“释放的信号”可能是指：新版本的核心功能更新（例如用户界面、数据分析工具或区块链功能）。项目未来发展的计划（例如代币经济、合作伙伴或新模块）。社区参与的号召，吸引更多用户加入 Cookie DAO 或使用平台。

火山⭕518.btc|Bird🕊️

98,470 次观看 • 1 年前

一个只有5分钟但是却让人收获良多的Ted视频：《如何给出高效反馈的秘诀》，良好的反馈大家都知道很重要，但是日常工作中，经常遇到下属、同事犯错误，不说又不利于其成长，说了又可能会得罪人，怎么样反馈比较好呢？视频给出了一个实用的提供反馈的公式，绝大部分情况都可以直接套用： 1. 从小的容易获得肯定的问题开始：开始反馈之前，提出一个简短但重要的问题，让对方知道要开始反馈了，以及制造一种主动接纳的氛围，让对方觉得是有自主权的，例如，“你有五分钟谈谈上次的对话吗？” 2. 摆事实和列数据：具体指出你所看到或听到的，避免使用模糊的词汇。例如，不是说“你不可靠”，而是说“你说11点之前给我发邮件，但我还没有收到”。 3. 事情造成的影响：明确说明事情对你产生的影响。例如，“因为我没有收到消息，我无法继续工作”。 4. 以一个问题结束：以问题结束反馈，如“你怎么看？”，这使得对话成为一个共同解决问题的过程。

一个只有5分钟但是却让人收获良多的Ted视频：《如何给出高效反馈的秘诀》，良好的反馈大家都知道很重要，但是日常工作中，经常遇到下属、同事犯错误，不说又不利于其成长，说了又可能会得罪人，怎么样反馈比较好呢？视频给出了一个实用的提供反馈的公式，绝大部分情况都可以直接套用： 1. 从小的容易获得肯定的问题开始：开始反馈之前，提出一个简短但重要的问题，让对方知道要开始反馈了，以及制造一种主动接纳的氛围，让对方觉得是有自主权的，例如，“你有五分钟谈谈上次的对话吗？” 2. 摆事实和列数据：具体指出你所看到或听到的，避免使用模糊的词汇。例如，不是说“你不可靠”，而是说“你说11点之前给我发邮件，但我还没有收到”。 3. 事情造成的影响：明确说明事情对你产生的影响。例如，“因为我没有收到消息，我无法继续工作”。 4. 以一个问题结束：以问题结束反馈，如“你怎么看？”，这使得对话成为一个共同解决问题的过程。

宝玉

98,348 次观看 • 2 年前

讲真的，现在的提示词网站都还有很大的优化空间：大部分提示词网站以“堆量”为主，靠着上千上万的提示词数量来堆砌价值，内容很丰富，但也存在大量重复、低质的提示词出现如果是自动爬取的帖子，还会出现提示词空档的情况，因为并不是每一个作者都会把提示词直接写在正文中，所以识别不到在这样的网站想要使用提示词，往往需要经历以下几个步骤： 1️⃣翻了很久，终于找到自己想要的图片效果 2️⃣点进去后会出现几种情况 - 没有提示词，只能放弃或者去原帖中找 - 语言不通，看不懂提示词 - 复制的文本里有其他文案，需要手动删除 3️⃣折腾十分钟，终于把提示词处理好了 4️⃣打开gemini/第三方生图网站 5️⃣复制提示词进行生图 6️⃣运气不好，发现提示词效果根本不是作者提供的那样，卒想要丝滑的把中意的提示词变成图片，基本做不到直到我用了MeiGen，一个开源的项目，它可能是今年使用体验最丝滑的提示词网站因为MeiGen不是传统的提示词网站，它不只是收录，而是解决了从提示词源到创作的整条链路想要什么效果，只需要轻轻拖动画面到右侧，点击生成就结束了，从查看到生成，只需要两步「拖动-生成」结束 1. 对于AI创作来说，保持心流状态是非常重要的，在MeiGen，你可以先收藏喜欢的提示词，不用担心找不到，在素材收集完成后进行统一的创作 2. 你可以上传参考图，或者把提示词翻译成中文再进行修改，这些都可以在MeiGen中一站式完成 3. 精选热门 AI 图片提示，这些都是已被证实能够生成高质量图片的提示词，由开发者亲自把关 4. 网站采用周更的节奏，保证提示词可用性和质量想要享受丝滑的创作体验，来试试MeiGen吧：

讲真的，现在的提示词网站都还有很大的优化空间：大部分提示词网站以“堆量”为主，靠着上千上万的提示词数量来堆砌价值，内容很丰富，但也存在大量重复、低质的提示词出现如果是自动爬取的帖子，还会出现提示词空档的情况，因为并不是每一个作者都会把提示词直接写在正文中，所以识别不到在这样的网站想要使用提示词，往往需要经历以下几个步骤： 1️⃣翻了很久，终于找到自己想要的图片效果 2️⃣点进去后会出现几种情况 - 没有提示词，只能放弃或者去原帖中找 - 语言不通，看不懂提示词 - 复制的文本里有其他文案，需要手动删除 3️⃣折腾十分钟，终于把提示词处理好了 4️⃣打开gemini/第三方生图网站 5️⃣复制提示词进行生图 6️⃣运气不好，发现提示词效果根本不是作者提供的那样，卒想要丝滑的把中意的提示词变成图片，基本做不到直到我用了MeiGen，一个开源的项目，它可能是今年使用体验最丝滑的提示词网站因为MeiGen不是传统的提示词网站，它不只是收录，而是解决了从提示词源到创作的整条链路想要什么效果，只需要轻轻拖动画面到右侧，点击生成就结束了，从查看到生成，只需要两步「拖动-生成」结束 1. 对于AI创作来说，保持心流状态是非常重要的，在MeiGen，你可以先收藏喜欢的提示词，不用担心找不到，在素材收集完成后进行统一的创作 2. 你可以上传参考图，或者把提示词翻译成中文再进行修改，这些都可以在MeiGen中一站式完成 3. 精选热门 AI 图片提示，这些都是已被证实能够生成高质量图片的提示词，由开发者亲自把关 4. 网站采用周更的节奏，保证提示词可用性和质量想要享受丝滑的创作体验，来试试MeiGen吧：

骑司Chase

30,759 次观看 • 4 个月前

找了个风格参考提示词给大家拿去做视频风格模拟用。【复制以下内容给 AI】：角色设定：你是一位拥有20年经验的电影摄影指导（DOP）和美术指导。你擅长从视觉画面中剥离内容，提炼出核心的美学逻辑。任务目标：请分析我上传的这组参考图，忽略画面中的具体人物和动作（这是可变量），只从以下维度深度解析画面中的“不可变视觉条件” (Immutable Visual Conditions)： 1. 光影逻辑 (Lighting & Atmosphere)：它是硬光还是柔光？光源的方向性如何（侧光/顶光/背光）？明暗对比度（Chiaroscuro）是高还是低？是否有丁达尔效应或特定的环境光？ 2. 胶片与质感 (Texture & Fidelity)：模拟的是什么年代的胶片（如70年代Technicolor）？颗粒感（Grain）的强度如何？画面的清晰度、锐度以及是否有物理损伤感（划痕、灰尘）？ 3. 色彩科学 (Color Grading)：整体色调倾向是什么（如低饱和、高反差、偏绿/偏黄）？高光和阴影的色偏如何？ 4. 构图与空间 (Composition & Spatial)：镜头语言有什么特征（如广角、长焦压缩）？前景遮挡关系如何？空间透视是平面的还是深邃的？输出要求：请不要给我写散文。请直接提取出 10-15 个精准的英文关键词或短语（Prompt Tags），用逗号分隔，按重要性排序。这些词必须能准确复刻这种视觉风格。二、将风格总结为模版的提示词【标准化模版构建】提示词（用来把提取的条件变成“万能模版”）【使用场景】：当你已经得到了第一步分析出的“风格关键词”（比如：Technicolor, heavy grain, hard light...），想把它变成一个以后能无限填空的“万能公式”时，把那些关键词发给 AI，然后发送这段话。【复制以下内容给 AI】：【复制以下内容给 AI】：角色设定：你是一位精通 Midjourney/Stable Diffusion 的 AIGC 提示词工程师。任务目标：基于我们刚刚提取的“不可变视觉风格关键词”，请为我构建一套“标准化、模块化的提示词模版” (Modular Prompt Template)。模版结构要求：请将提示词拆解为三个模块，并用括号 [] 标出用户需要填空的地方： 1. 【可变内容区】 (Variable Content Block)： - 留出 [景别 Shot Type] 的填空位。 - 留出 [主体与动作 Subject & Action] 的填空位。 - 留出 [环境描述 Environment] 的填空位。 2. 【半固定构图区】 (Semi-fixed Composition Block)： - 将刚才分析出的构图逻辑（如：前景遮挡、人小景大、垂直线条）写死在这里，作为固定后缀。 3. 【不可变风格区】 (Immutable Style Block) - 权重最高： - 将刚才分析出的光影、胶片质感、色彩关键词全部整合在这里。 - 关键：必须包含负面提示词（Negative Prompts）建议，明确告诉 AI 不要生成什么（如：不要现代感、不要柔光、不要高清数码味）。输出格式示例：请最后直接给我一段可以复制使用的英文 Prompt 模版，类似于： [SHOT TYPE], [SUBJECT ACTION], [ENVIRONMENT]. [COMPOSITION RULES]. [IMMUTABLE STYLE KEYWORDS]. --no [NEGATIVE KEYWORDS] 案例在跟帖中。可以把这种方法用来复刻赛博胡金铨电影试试

找了个风格参考提示词给大家拿去做视频风格模拟用。【复制以下内容给 AI】：角色设定：你是一位拥有20年经验的电影摄影指导（DOP）和美术指导。你擅长从视觉画面中剥离内容，提炼出核心的美学逻辑。任务目标：请分析我上传的这组参考图，忽略画面中的具体人物和动作（这是可变量），只从以下维度深度解析画面中的“不可变视觉条件” (Immutable Visual Conditions)： 1. 光影逻辑 (Lighting & Atmosphere)：它是硬光还是柔光？光源的方向性如何（侧光/顶光/背光）？明暗对比度（Chiaroscuro）是高还是低？是否有丁达尔效应或特定的环境光？ 2. 胶片与质感 (Texture & Fidelity)：模拟的是什么年代的胶片（如70年代Technicolor）？颗粒感（Grain）的强度如何？画面的清晰度、锐度以及是否有物理损伤感（划痕、灰尘）？ 3. 色彩科学 (Color Grading)：整体色调倾向是什么（如低饱和、高反差、偏绿/偏黄）？高光和阴影的色偏如何？ 4. 构图与空间 (Composition & Spatial)：镜头语言有什么特征（如广角、长焦压缩）？前景遮挡关系如何？空间透视是平面的还是深邃的？输出要求：请不要给我写散文。请直接提取出 10-15 个精准的英文关键词或短语（Prompt Tags），用逗号分隔，按重要性排序。这些词必须能准确复刻这种视觉风格。二、将风格总结为模版的提示词【标准化模版构建】提示词（用来把提取的条件变成“万能模版”）【使用场景】：当你已经得到了第一步分析出的“风格关键词”（比如：Technicolor, heavy grain, hard light...），想把它变成一个以后能无限填空的“万能公式”时，把那些关键词发给 AI，然后发送这段话。【复制以下内容给 AI】：【复制以下内容给 AI】：角色设定：你是一位精通 Midjourney/Stable Diffusion 的 AIGC 提示词工程师。任务目标：基于我们刚刚提取的“不可变视觉风格关键词”，请为我构建一套“标准化、模块化的提示词模版” (Modular Prompt Template)。模版结构要求：请将提示词拆解为三个模块，并用括号 [] 标出用户需要填空的地方： 1. 【可变内容区】 (Variable Content Block)： - 留出 [景别 Shot Type] 的填空位。 - 留出 [主体与动作 Subject & Action] 的填空位。 - 留出 [环境描述 Environment] 的填空位。 2. 【半固定构图区】 (Semi-fixed Composition Block)： - 将刚才分析出的构图逻辑（如：前景遮挡、人小景大、垂直线条）写死在这里，作为固定后缀。 3. 【不可变风格区】 (Immutable Style Block) - 权重最高： - 将刚才分析出的光影、胶片质感、色彩关键词全部整合在这里。 - 关键：必须包含负面提示词（Negative Prompts）建议，明确告诉 AI 不要生成什么（如：不要现代感、不要柔光、不要高清数码味）。输出格式示例：请最后直接给我一段可以复制使用的英文 Prompt 模版，类似于： [SHOT TYPE], [SUBJECT ACTION], [ENVIRONMENT]. [COMPOSITION RULES]. [IMMUTABLE STYLE KEYWORDS]. --no [NEGATIVE KEYWORDS] 案例在跟帖中。可以把这种方法用来复刻赛博胡金铨电影试试

John

12,464 次观看 • 1 个月前

熟悉Prompt的同学们应该都知道，通常在写Prompt的时候要先设定角色：“你是XX方面的专家”，这并非玄学，而是有科学根据的。 GPT在训练的时候，有各种训练数据，有的质量高有的质量低，而默认情况下，生成高质量数据和低质量数据的概率差不多，但是当你给它设定XX专家的角色时，它会尽可能把概率分布在高质量的解决方案上。详细内容建议看下面这段Andrej Karpathy在State of GPT中的一段演讲。以下是这段视频的文字文字内容： ---------- 下面我要讲的这点对LLM的理解非常有趣，我觉得这算是LLM的一种心理特性：LLM并不追求成功，而是追求模仿。你希望它成功，那就需要向它明确要求。这里的意思是，在训练Transformer的过程中，它们有各种训练集，而这些训练数据中可能涵盖了各种不同质量的表现。比如，可能有一个关于物理问题的提示，然后可能有学生的解答完全错误，但也可能有专家的答案完全正确。尽管Transformer可以识别出低质量的解决方案和高质量的解决方案，但默认情况下，它们只会模仿所有的数据，因为它们仅仅是基于语言模型进行训练的。在实际测试中，你其实需要明确要求它表现得好。在这篇论文的实验中，他们尝试了各种提示。例如，“让我们逐步思考”这种提示就很有效，因为它把推理过程分散到了许多记号上。但效果更好的是这样的提示：“让我们以一步一步的方式解决问题，以确保我们得到正确的答案。” 这就好像是在引导Transformer去得出正确的答案，这会使Transformer的表现更好，因为此时Transformer不再需要把它的概率质量分散到低质量的解决方案上，尽管这听起来很荒谬。基本上，你可以自由地要求一个高质量的解决方案。比如，你可以告诉它，“你是这个话题的领先专家。假装你的智商是120。” 但不要尝试要求太高的智商，因为如果你要求智商400，可能就超出了数据分布的范围，更糟糕的是，你可能落入了类似科幻内容的数据分布，它可能会开始展现一些科幻的，或者说角色扮演类的东西。所以，你需要找到适合的智商要求。我想这可能是一个U型曲线的关系。

熟悉Prompt的同学们应该都知道，通常在写Prompt的时候要先设定角色：“你是XX方面的专家”，这并非玄学，而是有科学根据的。 GPT在训练的时候，有各种训练数据，有的质量高有的质量低，而默认情况下，生成高质量数据和低质量数据的概率差不多，但是当你给它设定XX专家的角色时，它会尽可能把概率分布在高质量的解决方案上。详细内容建议看下面这段Andrej Karpathy在State of GPT中的一段演讲。以下是这段视频的文字文字内容： ---------- 下面我要讲的这点对LLM的理解非常有趣，我觉得这算是LLM的一种心理特性：LLM并不追求成功，而是追求模仿。你希望它成功，那就需要向它明确要求。这里的意思是，在训练Transformer的过程中，它们有各种训练集，而这些训练数据中可能涵盖了各种不同质量的表现。比如，可能有一个关于物理问题的提示，然后可能有学生的解答完全错误，但也可能有专家的答案完全正确。尽管Transformer可以识别出低质量的解决方案和高质量的解决方案，但默认情况下，它们只会模仿所有的数据，因为它们仅仅是基于语言模型进行训练的。在实际测试中，你其实需要明确要求它表现得好。在这篇论文的实验中，他们尝试了各种提示。例如，“让我们逐步思考”这种提示就很有效，因为它把推理过程分散到了许多记号上。但效果更好的是这样的提示：“让我们以一步一步的方式解决问题，以确保我们得到正确的答案。” 这就好像是在引导Transformer去得出正确的答案，这会使Transformer的表现更好，因为此时Transformer不再需要把它的概率质量分散到低质量的解决方案上，尽管这听起来很荒谬。基本上，你可以自由地要求一个高质量的解决方案。比如，你可以告诉它，“你是这个话题的领先专家。假装你的智商是120。” 但不要尝试要求太高的智商，因为如果你要求智商400，可能就超出了数据分布的范围，更糟糕的是，你可能落入了类似科幻内容的数据分布，它可能会开始展现一些科幻的，或者说角色扮演类的东西。所以，你需要找到适合的智商要求。我想这可能是一个U型曲线的关系。

宝玉

347,121 次观看 • 2 年前

🔥兄弟们！不要天天蹲博主的提示词了！我给你一套永久解决办法！群里的会员朋友天天问我神老师能不能帮忙逆向一下这个 Nano Banana 🍌图片的提示词啊！这不给你们的福利来了！ 😄这套系统在咸鱼接个单什么的岂不是美滋滋？ 📺功能：1、主要是支持图片上传然后会将多个角色进行分析最后给出对应的提示词，并且支持生成通用场景提示词模板。 2、直接使用提示词可以生成对应的图片效果进行比对，这时候视觉审核员将进行审核和评分，并且给出一键，如果有问题可以直接进行fix 再次生成新的提示词。 3、支持视频复刻，主要是当时做的sora视频的复刻，可以将视频上传自定义长度，然后复制json格式或自然语言！ PS：虽然没有多复杂，但是打磨多次，也花了点时间。

🔥兄弟们！不要天天蹲博主的提示词了！我给你一套永久解决办法！群里的会员朋友天天问我神老师能不能帮忙逆向一下这个 Nano Banana 🍌图片的提示词啊！这不给你们的福利来了！ 😄这套系统在咸鱼接个单什么的岂不是美滋滋？ 📺功能：1、主要是支持图片上传然后会将多个角色进行分析最后给出对应的提示词，并且支持生成通用场景提示词模板。 2、直接使用提示词可以生成对应的图片效果进行比对，这时候视觉审核员将进行审核和评分，并且给出一键，如果有问题可以直接进行fix 再次生成新的提示词。 3、支持视频复刻，主要是当时做的sora视频的复刻，可以将视频上传自定义长度，然后复制json格式或自然语言！ PS：虽然没有多复杂，但是打磨多次，也花了点时间。

Berryxia.AI

41,383 次观看 • 5 个月前

🐳卧槽！这下真的是要实现PPT自由了，香蕉生成的图片PPT可以直接编辑了😄 其实目前所有使用Nano Banana 制作的PPT的工具都是依托于LLM的强能力+优化的AGENT来完成一份还不错的PPT。也就是说其实你只要有一个不错的提示词或者提示词风格，你大概率制作出来的PPT是不会差的。昨晚就是使用我设置的号的提示词风格+一句话就可以做出视频中的风格的PPT了。但是受限于无法直接编辑的问题, 𝗖𝘆𝗱𝗶𝗮𝗿 佬的这个工具就是可以实现帮你解决PPT进行编辑的问题。目前工具还在内测中，我想应该很快就可以体验了，到时候我找C大给我们社群的小伙伴优先来一波福利哈哈😄

🐳卧槽！这下真的是要实现PPT自由了，香蕉生成的图片PPT可以直接编辑了😄 其实目前所有使用Nano Banana 制作的PPT的工具都是依托于LLM的强能力+优化的AGENT来完成一份还不错的PPT。也就是说其实你只要有一个不错的提示词或者提示词风格，你大概率制作出来的PPT是不会差的。昨晚就是使用我设置的号的提示词风格+一句话就可以做出视频中的风格的PPT了。但是受限于无法直接编辑的问题, 𝗖𝘆𝗱𝗶𝗮𝗿 佬的这个工具就是可以实现帮你解决PPT进行编辑的问题。目前工具还在内测中，我想应该很快就可以体验了，到时候我找C大给我们社群的小伙伴优先来一波福利哈哈😄

Berryxia.AI

22,970 次观看 • 4 个月前

终于来了！ Midjourney角色一致性功能发布. 下面视频是网站的使用方法和介绍：这个功能和之前的风格参照很相似，不同之处在于它不是匹配一个特定风格，而是让角色与给定的角色参照图像相符合。如何使用：在你输入的指令后面加上 --cref URL，URL是你选择的角色图像的链接。你还可以用 --cw 来调整参照的“强度”，范围从100到0。默认的强度是100 (--cw 100)，这时会参考人物的脸部、发型和衣着。如果设置为强度0 (--cw 0)，那么系统只会关注脸部（这对于更换服饰或发型很有帮助）。适用范围：这个功能最适合用于Midjourney创作的角色图像。不太适合用于真人照片（可能会产生一些扭曲，就像普通图像提示那样）。 Cref的工作方式类似于普通图像提示，但它更专注于角色的特征。但请注意，这项技术的精确度是有限的，它无法复制极其细微的特征，比如特定的酒窝、雀斑或T恤上的标志。 Cref同样适用于Niji和普通MJ模型，并且可以与--sref一起使用。高级功能：你可以使用多个URL，通过 --cref URL1 URL2 的方式来结合多个图像中的角色信息（这和使用多重图像或风格提示类似）。在web alpha版本中如何操作：只需将图片拖动或粘贴到想象工具栏，你会看到三个图标。选择这些图标之一，可以设置图片用作图像提示、风格参照或角色参照。如果你想让一张图像同时用于多个类别，只需按住Shift键再选择。请记住，由于MJ V6目前还处于alpha测试阶段，这个和其他功能可能会有所变化。但不久后，我们会推出官方的V6 beta版。

终于来了！ Midjourney角色一致性功能发布. 下面视频是网站的使用方法和介绍：这个功能和之前的风格参照很相似，不同之处在于它不是匹配一个特定风格，而是让角色与给定的角色参照图像相符合。如何使用：在你输入的指令后面加上 --cref URL，URL是你选择的角色图像的链接。你还可以用 --cw 来调整参照的“强度”，范围从100到0。默认的强度是100 (--cw 100)，这时会参考人物的脸部、发型和衣着。如果设置为强度0 (--cw 0)，那么系统只会关注脸部（这对于更换服饰或发型很有帮助）。适用范围：这个功能最适合用于Midjourney创作的角色图像。不太适合用于真人照片（可能会产生一些扭曲，就像普通图像提示那样）。 Cref的工作方式类似于普通图像提示，但它更专注于角色的特征。但请注意，这项技术的精确度是有限的，它无法复制极其细微的特征，比如特定的酒窝、雀斑或T恤上的标志。 Cref同样适用于Niji和普通MJ模型，并且可以与--sref一起使用。高级功能：你可以使用多个URL，通过 --cref URL1 URL2 的方式来结合多个图像中的角色信息（这和使用多重图像或风格提示类似）。在web alpha版本中如何操作：只需将图片拖动或粘贴到想象工具栏，你会看到三个图标。选择这些图标之一，可以设置图片用作图像提示、风格参照或角色参照。如果你想让一张图像同时用于多个类别，只需按住Shift键再选择。请记住，由于MJ V6目前还处于alpha测试阶段，这个和其他功能可能会有所变化。但不久后，我们会推出官方的V6 beta版。

歸藏(guizang.ai)

73,868 次观看 • 2 年前

细节的 TTS 技术 Seed-TTS，制作出来的有声书可能要让喜马拉雅的很多主播失业了！支持多种语言。目前还没看到项目代码或者测试地址，只有论文：摘要我们介绍了Seed-TTS，这是一系列大规模自回归文本转语音（TTS）模型，能够生成几乎与人类语音无法区分的语音。Seed-TTS作为语音生成的基础模型，在语音上下文学习中表现出色，在说话者相似性和自然性方面的表现与真实人类语音在客观和主观评估中相匹配。通过微调，我们在这些指标上获得了更高的主观评分。Seed-TTS在各种语音属性（如情感）上提供了卓越的可控性，并且能够为自然环境中的说话者生成高度富有表现力和多样化的语音。此外，我们提出了一种用于语音因子化的自蒸馏方法，即通过让模型自行学习和改进的方式来提高性能，以及一种增强模型鲁棒性、说话者相似性和可控性的强化学习方法。我们还展示了Seed-TTS模型的非自回归（NAR）变体，名为Seed-TTSDiT，它采用完全基于扩散的架构。与以前的基于NAR的TTS系统不同，Seed-TTSDiT不依赖于预估的音素持续时间，而是通过端到端处理进行语音生成。我们证明了这种变体在客观和主观评估中达到了与基于语言模型的变体相当的性能，并展示了其在语音编辑中的有效性。

细节的 TTS 技术 Seed-TTS，制作出来的有声书可能要让喜马拉雅的很多主播失业了！支持多种语言。目前还没看到项目代码或者测试地址，只有论文：摘要我们介绍了Seed-TTS，这是一系列大规模自回归文本转语音（TTS）模型，能够生成几乎与人类语音无法区分的语音。Seed-TTS作为语音生成的基础模型，在语音上下文学习中表现出色，在说话者相似性和自然性方面的表现与真实人类语音在客观和主观评估中相匹配。通过微调，我们在这些指标上获得了更高的主观评分。Seed-TTS在各种语音属性（如情感）上提供了卓越的可控性，并且能够为自然环境中的说话者生成高度富有表现力和多样化的语音。此外，我们提出了一种用于语音因子化的自蒸馏方法，即通过让模型自行学习和改进的方式来提高性能，以及一种增强模型鲁棒性、说话者相似性和可控性的强化学习方法。我们还展示了Seed-TTS模型的非自回归（NAR）变体，名为Seed-TTSDiT，它采用完全基于扩散的架构。与以前的基于NAR的TTS系统不同，Seed-TTSDiT不依赖于预估的音素持续时间，而是通过端到端处理进行语音生成。我们证明了这种变体在客观和主观评估中达到了与基于语言模型的变体相当的性能，并展示了其在语音编辑中的有效性。

宝玉

67,841 次观看 • 2 年前

鹤老师对短视频流量的这 19 个认知还是很到位的。 1. 不要记录美好生活因为大多数人的生活并不美好，流量的核心是让观众爽，而不是让自己爽。记录“不美好”的内容容易引发观众共鸣，比如明星的“糗事”或反差内容。 2. 不要什么都自己做普通人要有自知之明，借助热点和评论区的高赞评论来写文案。评论区没有版权，可以免费获取优质内容。 3. 不要老想着提升作品流量的提升不一定需要作品质量提升，可以通过扩大受众群体实现播放量增长。选题决定了播放量的上限。 4. 不要动不动就讲干货干货的竞争力不如迎合人性的内容，比如搞笑、猎奇、情绪化等。打败人性的只有另一种人性，内容要顺应观众心理。 5. 不要盲目“养号” 互动点赞等操作对流量没有直接帮助，创作者和观看者的身份是绝缘的。养号是对智力的侮辱。 6. 不要觉得老师都是对的短视频创作没有绝对的标准答案，不同老师的建议可能互相矛盾。独立思考和怀疑精神是最重要的。 7. 不要盲目投抖加抖加的本质是用钱换流量，但必须以效率为原则（投入产出比）。如果无法盈利，就不要投放。 8. 不要老追求精准粉免费玩家就是游戏道具，泛粉丝就是获客工具。泛粉丝是金矿，通过泛话题吸引更多人，后期再转化为精准粉丝。 9. 不要纠结视频时长短视频的核心是信息密度，而不是时间长短。信息量相同的情况下，时长越短越好。 10. 不要挑选发布时间新手阶段，任何时间都有流量机会，不需要纠结发布时间。选题和内容的吸引力才是决定性的。 11. 不要过分关注后台数据数据是多维的，比如时长、进度、领域等，需要综合分析。完播率的权重随着视频时长增加而指数级提升。 12. 不要纠结横屏竖屏短视频一律用竖屏，竖屏更符合现代用户的交互习惯。横屏是上一代的沟通方式，竖屏才是未来。 13. 不要过度关注平台政策平台规则的核心是“用户当裁判”，用户越喜欢的视频越有流量。不需要逐条研究政策，只需专注于用户体验。 14. 不要低估最小练习量短视频创作需要大量练习，1万次练习才能出效果。创作能力的提升需要时间和积累。 15. 不要掉进专业的诅咒内容要向下兼容，满足小白需求，比观众高一个维度即可。太过专业会让普通观众无法理解，导致播放量低。 16. 不要扭扭捏捏变现变现要果断，不要因为顾虑而错过最佳时机。黑粉的本质是同类竞争，不需要过度在意。 17. 不要害怕大博主抢流量平台更倾向于扶持新人，新人更容易获得流量激励。新人激发平台活力，也能带动老博主保持竞争力。 18. 不要埋怨缺人脉资源每个新赛道都会抹平旧赛道的优势，关键是抓住当下机会。强者在新环境中未必有优势，短视频是一个公平的赛道。 19. 不要觉得入场太晚孕妇效应让人误以为竞争激烈，实际细分领域仍有机会。找对行业和细分领域，仍然可以脱颖而出。总结：这19点认知涵盖了短视频创作、运营、变现和心态调整的方方面面，核心在于理解平台规则、顺应人性、坚持练习，并找到自身定位和优势。

鹤老师对短视频流量的这 19 个认知还是很到位的。 1. 不要记录美好生活因为大多数人的生活并不美好，流量的核心是让观众爽，而不是让自己爽。记录“不美好”的内容容易引发观众共鸣，比如明星的“糗事”或反差内容。 2. 不要什么都自己做普通人要有自知之明，借助热点和评论区的高赞评论来写文案。评论区没有版权，可以免费获取优质内容。 3. 不要老想着提升作品流量的提升不一定需要作品质量提升，可以通过扩大受众群体实现播放量增长。选题决定了播放量的上限。 4. 不要动不动就讲干货干货的竞争力不如迎合人性的内容，比如搞笑、猎奇、情绪化等。打败人性的只有另一种人性，内容要顺应观众心理。 5. 不要盲目“养号” 互动点赞等操作对流量没有直接帮助，创作者和观看者的身份是绝缘的。养号是对智力的侮辱。 6. 不要觉得老师都是对的短视频创作没有绝对的标准答案，不同老师的建议可能互相矛盾。独立思考和怀疑精神是最重要的。 7. 不要盲目投抖加抖加的本质是用钱换流量，但必须以效率为原则（投入产出比）。如果无法盈利，就不要投放。 8. 不要老追求精准粉免费玩家就是游戏道具，泛粉丝就是获客工具。泛粉丝是金矿，通过泛话题吸引更多人，后期再转化为精准粉丝。 9. 不要纠结视频时长短视频的核心是信息密度，而不是时间长短。信息量相同的情况下，时长越短越好。 10. 不要挑选发布时间新手阶段，任何时间都有流量机会，不需要纠结发布时间。选题和内容的吸引力才是决定性的。 11. 不要过分关注后台数据数据是多维的，比如时长、进度、领域等，需要综合分析。完播率的权重随着视频时长增加而指数级提升。 12. 不要纠结横屏竖屏短视频一律用竖屏，竖屏更符合现代用户的交互习惯。横屏是上一代的沟通方式，竖屏才是未来。 13. 不要过度关注平台政策平台规则的核心是“用户当裁判”，用户越喜欢的视频越有流量。不需要逐条研究政策，只需专注于用户体验。 14. 不要低估最小练习量短视频创作需要大量练习，1万次练习才能出效果。创作能力的提升需要时间和积累。 15. 不要掉进专业的诅咒内容要向下兼容，满足小白需求，比观众高一个维度即可。太过专业会让普通观众无法理解，导致播放量低。 16. 不要扭扭捏捏变现变现要果断，不要因为顾虑而错过最佳时机。黑粉的本质是同类竞争，不需要过度在意。 17. 不要害怕大博主抢流量平台更倾向于扶持新人，新人更容易获得流量激励。新人激发平台活力，也能带动老博主保持竞争力。 18. 不要埋怨缺人脉资源每个新赛道都会抹平旧赛道的优势，关键是抓住当下机会。强者在新环境中未必有优势，短视频是一个公平的赛道。 19. 不要觉得入场太晚孕妇效应让人误以为竞争激烈，实际细分领域仍有机会。找对行业和细分领域，仍然可以脱颖而出。总结：这19点认知涵盖了短视频创作、运营、变现和心态调整的方方面面，核心在于理解平台规则、顺应人性、坚持练习，并找到自身定位和优势。

DinoDeer

133,043 次观看 • 1 年前

在六到十二个月内超越99%的人的方法：深刻认识到你不想要的东西：首先，你需要清楚地知道自己不想要什么，以及如果继续当前生活方式，将来会怎样。观察大众，并注意到无意识行动的后果。创建反愿景：通过了解你不想要的东西，反思这些东西可能导致的结果。利用这种负面能量来实现你的目标。具体化你的愿景和计划：坐下来，详细规划你的未来愿景和每日计划。这包括要做的每件小事，以及如何逐步实现你的大目标。消除干扰：从你的生活中消除那些不属于你、不助于你成长的人或事。这可能包括人、游戏、应用程序或坏习惯。习惯于基础训练：成功的关键在于坚持日复一日的基本训练。尽管这些基本训练看似乏味，但它们是通向精通的道路。接受成长需要时间：理解到达目标和实现愿景需要时间，可能是一生的努力。专注于过程而非仅仅追求结果。享受过程：将这一过程视为一场实验，享受在实现目标道路上的每一步。每个阶段都是成长和学习的机会。要超越大众，关键是有目的地行动，深入思考，并致力于实现你的愿景。通过以上步骤，你可以构建一个让你的生活有序且向着你想要的方向发展的系统。

在六到十二个月内超越99%的人的方法：深刻认识到你不想要的东西：首先，你需要清楚地知道自己不想要什么，以及如果继续当前生活方式，将来会怎样。观察大众，并注意到无意识行动的后果。创建反愿景：通过了解你不想要的东西，反思这些东西可能导致的结果。利用这种负面能量来实现你的目标。具体化你的愿景和计划：坐下来，详细规划你的未来愿景和每日计划。这包括要做的每件小事，以及如何逐步实现你的大目标。消除干扰：从你的生活中消除那些不属于你、不助于你成长的人或事。这可能包括人、游戏、应用程序或坏习惯。习惯于基础训练：成功的关键在于坚持日复一日的基本训练。尽管这些基本训练看似乏味，但它们是通向精通的道路。接受成长需要时间：理解到达目标和实现愿景需要时间，可能是一生的努力。专注于过程而非仅仅追求结果。享受过程：将这一过程视为一场实验，享受在实现目标道路上的每一步。每个阶段都是成长和学习的机会。要超越大众，关键是有目的地行动，深入思考，并致力于实现你的愿景。通过以上步骤，你可以构建一个让你的生活有序且向着你想要的方向发展的系统。

Yangyi

120,467 次观看 • 2 年前

这款可眼观六路耳听八方的AI“作弊”工具火了，Cluely！它能看到你的电脑屏幕、听到你的对话，厉害的是它能理解你当下的场景和需求，主动预测，实时提供答案和信息 Cluely的设计是隐藏的，对其他人完全不可见，它不会出现在像屏幕共享、会议记录，或其他地方 Cluely可“作弊”的场景 1、会议场景 Cluely可以实时记录会议内容，帮你生成一些你可以提出的问题，让你在会议中看起来很投入它还能帮你自动回答问题，让你的视线会始终保持在会议界面上，避免走神嫌疑 2、客服场景 Cluely 可以让你边聊边调取公司知识库，还能自动生成合规回复 3、上课场景 Cluely可以实时记录课堂笔记，预判老师可能会问的问题，提前帮你主动思考，并进行实时解答 4、招聘场景当笔试时，它能实时捕捉候选人语法漏洞，自动生成深度技术追问，甚至分析出对方解题时的思维盲区在销售会议、用户访谈、产品设计、学习新软件、以及会议总结等场景中，Cluely同样适用 Cluely集合了“所有场景下AI助手”的能力，预测用户的潜在需求，在用户没有明确指示的情况下提供信息和建议，让AI辅助的能力从“被动”走向“主动” #Cluely #AI助手 #AI招聘助手 #AI客服助手 #AI销售助手

这款可眼观六路耳听八方的AI“作弊”工具火了，Cluely！它能看到你的电脑屏幕、听到你的对话，厉害的是它能理解你当下的场景和需求，主动预测，实时提供答案和信息 Cluely的设计是隐藏的，对其他人完全不可见，它不会出现在像屏幕共享、会议记录，或其他地方 Cluely可“作弊”的场景 1、会议场景 Cluely可以实时记录会议内容，帮你生成一些你可以提出的问题，让你在会议中看起来很投入它还能帮你自动回答问题，让你的视线会始终保持在会议界面上，避免走神嫌疑 2、客服场景 Cluely 可以让你边聊边调取公司知识库，还能自动生成合规回复 3、上课场景 Cluely可以实时记录课堂笔记，预判老师可能会问的问题，提前帮你主动思考，并进行实时解答 4、招聘场景当笔试时，它能实时捕捉候选人语法漏洞，自动生成深度技术追问，甚至分析出对方解题时的思维盲区在销售会议、用户访谈、产品设计、学习新软件、以及会议总结等场景中，Cluely同样适用 Cluely集合了“所有场景下AI助手”的能力，预测用户的潜在需求，在用户没有明确指示的情况下提供信息和建议，让AI辅助的能力从“被动”走向“主动” #Cluely #AI助手 #AI招聘助手 #AI客服助手 #AI销售助手

AIGCLINK

32,197 次观看 • 11 个月前

现在你只要去推特上搜索“许其亮”三个字，无论是在“热点”标签页，还是“最新”标签页，都找不到任何我发布的内容。昨天我刚发出许其亮的系列推文，立刻去搜索，结果仍然看不到自己刚刚发出的内容出现在“最新”中。今天再查，情况依旧。这种系统性屏蔽说明：即使我是这个重大新闻的首发者、引爆者，推特平台依然在主动切断“许其亮”这个关键词与我之间的关联。但事实上，过去48小时内，所有网络关于许其亮死亡的信息扩散，都是由我赵兰健最早发布、引发和推动的。我发的多条推文累计已超过百万阅读量，有的是在“习近平”相关话题热搜中排名第一。这意味着：推特平台本身正在有选择地“删除源头”。用户能看到许其亮的信息，但看不到最早发布的人是谁——这不是信息流动，这是舆论劫持。所以问题不在于我是否传播成功，而在于推特为何要悄悄掐断我的可见度与影响力。这已经不是技术问题，这是信息平台被干预、舆论被操控的警讯。

现在你只要去推特上搜索“许其亮”三个字，无论是在“热点”标签页，还是“最新”标签页，都找不到任何我发布的内容。昨天我刚发出许其亮的系列推文，立刻去搜索，结果仍然看不到自己刚刚发出的内容出现在“最新”中。今天再查，情况依旧。这种系统性屏蔽说明：即使我是这个重大新闻的首发者、引爆者，推特平台依然在主动切断“许其亮”这个关键词与我之间的关联。但事实上，过去48小时内，所有网络关于许其亮死亡的信息扩散，都是由我赵兰健最早发布、引发和推动的。我发的多条推文累计已超过百万阅读量，有的是在“习近平”相关话题热搜中排名第一。这意味着：推特平台本身正在有选择地“删除源头”。用户能看到许其亮的信息，但看不到最早发布的人是谁——这不是信息流动，这是舆论劫持。所以问题不在于我是否传播成功，而在于推特为何要悄悄掐断我的可见度与影响力。这已经不是技术问题，这是信息平台被干预、舆论被操控的警讯。

赵兰健［Lanjian Zhao］

79,835 次观看 • 1 年前

非常好的一个演示视频，通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。 👇下面是文字版本： GPT的全称及其含义 GPT是Generative Pre-trained Transformer的缩写。其中,"Generative"表示这个模型是用来生成新文本的;"Pre-trained"意味着模型是在大量数据上预先训练好的;"Transformer"则指代一种特定类型的神经网络结构。因此,GPT本质上是一个基于Transformer架构、经过预训练、能够生成文本的语言模型。 Transformer的定义及其在AI领域的应用 Transformer是一种专门处理序列数据的神经网络架构。它最初是为机器翻译任务设计的,但后来被发现在其他许多NLP任务上也有出色表现,如语言建模、命名实体识别等。除了NLP,Transformer也被应用于语音识别、图像字幕生成等领域。Transformer的成功很大程度上归因于其独特的自注意力机制,使其能够高效地处理长程依赖关系。 Transformer的工作原理简介 Transformer的工作流程可以概括为三个主要步骤:首先,将输入的文本序列转化为一组向量表示;然后,通过自注意力机制和前馈神经网络对这些向量进行变换和更新;最后,根据更新后的向量生成输出分布,用于预测下一个词。整个过程中,自注意力机制起到了关键作用,使得模型能够动态地确定输入序列中每个位置与其他位置之间的相关性,从而更好地捕捉上下文信息。 Transformer处理文本信息的过程当Transformer处理一段文本时,首先需要将其分割成一个个基本单元,如单词或子词,这些基本单元被称为"token"。接着,每个token都会被映射为一个高维向量,即"词嵌入"。这一步旨在将离散的文本符号转化为连续的向量表示,以便神经网络进行处理。然后,这些词向量会通过多个编码器层进行变换和更新,每一层都会综合考虑当前token与其他token之间的关系,从而使每个向量都融入了上下文信息。最后,解码器根据编码器的输出和之前生成的token,预测出下一个最可能的token。通过不断重复这一过程,Transformer就可以生成连贯的文本片段。词嵌入(Word Embedding)的概念和作用词嵌入是一种将词映射到高维向量空间的技术。通过词嵌入,每个词都被表示为一个实数向量,这个向量捕捉了该词的语义信息。词嵌入的一个重要特性是,语义相似的词往往在向量空间中距离较近。例如,"king"和"queen"这两个词的向量之间的距离会比"king"和"apple"的距离更近。此外,词嵌入还能够反映词之间的类比关系,如"king"-"man"+"woman"的结果会接近"queen"。词嵌入为神经网络提供了一种处理文本数据的有效方式,使其能够利用词语之间的语义关系进行推理和预测。深度学习模型的基本结构和特点深度学习模型通常由多个层组成,每一层对输入数据进行一定的变换,并将结果传递给下一层。层与层之间的连接通常是通过矩阵乘法实现的,其中矩阵的元素就是模型的参数。这些参数在训练过程中会不断更新,以使模型的输出与期望输出尽可能接近。深度学习模型的训练通常采用反向传播算法,即根据输出的误差,逐层调整参数的值。通过多次迭代,模型可以逐渐学习到数据中的规律和模式。深度学习模型的一个显著特点是,它们可以自动学习数据的表示方式,而无需人工设计特征。这使得深度学习在处理图像、语音等复杂数据时表现出色。 Softmax函数的作用和计算过程 Softmax函数常用于深度学习模型的输出层,特别是在多分类问题中。它的作用是将一组实数转化为一个概率分布,使得每个类别都有一个0到1之间的概率值,并且所有类别的概率之和为1。Softmax函数的计算过程分为两步:首先,对每个输入值取指数;然后,将每个指数值除以所有指数值的和。这样得到的结果就是一个合法的概率分布。Softmax函数有一个很好的性质,即输入值较大的类别会获得较高的概率,而输入值较小的类别的概率会趋近于0。这使得模型的输出更容易解释,并且有利于进行决策和预测。生成模型预测下一个词的过程当生成模型(如GPT)预测下一个词时,通常采用以下步骤:首先,根据前面已经生成的词,模型会计算出每个可能的下一个词的概率。这个概率分布反映了模型对不同词的偏好程度。然后,从这个分布中采样出一个词作为新生成的内容。接下来,模型将这个新词加入到已生成的序列中,并重复上述过程,直到达到预设的长度或遇到终止条件(如句号)为止。通过这种不断预测和采样的方式,生成模型可以创作出连贯而富有创意的文本。值得注意的是,为了提高生成文本的多样性和自然度,可以引入"temperature"等超参数来调节输出分布的形状。 GPT-3的参数量和嵌入矩阵 GPT-3是目前最大的语言模型之一,其参数量高达1750亿。这意味着,模型需要学习和存储大量的权重值,以刻画自然语言中的规律和模式。GPT-3的一个重要组成部分是嵌入矩阵(embedding matrix),它负责将每个词映射为一个高维向量。在GPT-3中,嵌入矩阵的大小为50257×12288,即词表中共有50257个不同的词(或子词),每个词被映射为一个12288维的向量。嵌入矩阵中的每个元素都是一个可学习的参数,在训练过程中会不断更新,以使得语义相似的词具有相近的向量表示。GPT-3庞大的参数量使其能够学习到比以往模型更加细致入微的语言知识,这也是其在各种NLP任务上表现出众的原因之一。模型训练中的"Temperature"超参数在生成模型的训练过程中,"Temperature"是一个重要的超参数,它控制着输出分布的形状。具体来说,temperature值越高,输出分布就越平缓,生成的结果也就越多样化;反之,temperature值越低,输出分布就越尖锐,生成的结果也就越保守。合适的temperature值可以在确保生成内容连贯性的同时,提高其丰富性和创造性。例如,当temperature值接近于0时,模型会倾向于选择概率最高的那个词,导致生成的文本可能流于老套;而当temperature值较高时,模型会给予概率较低的词更多机会,从而产生更加新颖和意想不到的结果。在实践中,temperature值通常需要根据具体任务和需求进行调整,以达到理想的平衡。

非常好的一个演示视频，通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。 👇下面是文字版本： GPT的全称及其含义 GPT是Generative Pre-trained Transformer的缩写。其中,"Generative"表示这个模型是用来生成新文本的;"Pre-trained"意味着模型是在大量数据上预先训练好的;"Transformer"则指代一种特定类型的神经网络结构。因此,GPT本质上是一个基于Transformer架构、经过预训练、能够生成文本的语言模型。 Transformer的定义及其在AI领域的应用 Transformer是一种专门处理序列数据的神经网络架构。它最初是为机器翻译任务设计的,但后来被发现在其他许多NLP任务上也有出色表现,如语言建模、命名实体识别等。除了NLP,Transformer也被应用于语音识别、图像字幕生成等领域。Transformer的成功很大程度上归因于其独特的自注意力机制,使其能够高效地处理长程依赖关系。 Transformer的工作原理简介 Transformer的工作流程可以概括为三个主要步骤:首先,将输入的文本序列转化为一组向量表示;然后,通过自注意力机制和前馈神经网络对这些向量进行变换和更新;最后,根据更新后的向量生成输出分布,用于预测下一个词。整个过程中,自注意力机制起到了关键作用,使得模型能够动态地确定输入序列中每个位置与其他位置之间的相关性,从而更好地捕捉上下文信息。 Transformer处理文本信息的过程当Transformer处理一段文本时,首先需要将其分割成一个个基本单元,如单词或子词,这些基本单元被称为"token"。接着,每个token都会被映射为一个高维向量,即"词嵌入"。这一步旨在将离散的文本符号转化为连续的向量表示,以便神经网络进行处理。然后,这些词向量会通过多个编码器层进行变换和更新,每一层都会综合考虑当前token与其他token之间的关系,从而使每个向量都融入了上下文信息。最后,解码器根据编码器的输出和之前生成的token,预测出下一个最可能的token。通过不断重复这一过程,Transformer就可以生成连贯的文本片段。词嵌入(Word Embedding)的概念和作用词嵌入是一种将词映射到高维向量空间的技术。通过词嵌入,每个词都被表示为一个实数向量,这个向量捕捉了该词的语义信息。词嵌入的一个重要特性是,语义相似的词往往在向量空间中距离较近。例如,"king"和"queen"这两个词的向量之间的距离会比"king"和"apple"的距离更近。此外,词嵌入还能够反映词之间的类比关系,如"king"-"man"+"woman"的结果会接近"queen"。词嵌入为神经网络提供了一种处理文本数据的有效方式,使其能够利用词语之间的语义关系进行推理和预测。深度学习模型的基本结构和特点深度学习模型通常由多个层组成,每一层对输入数据进行一定的变换,并将结果传递给下一层。层与层之间的连接通常是通过矩阵乘法实现的,其中矩阵的元素就是模型的参数。这些参数在训练过程中会不断更新,以使模型的输出与期望输出尽可能接近。深度学习模型的训练通常采用反向传播算法,即根据输出的误差,逐层调整参数的值。通过多次迭代,模型可以逐渐学习到数据中的规律和模式。深度学习模型的一个显著特点是,它们可以自动学习数据的表示方式,而无需人工设计特征。这使得深度学习在处理图像、语音等复杂数据时表现出色。 Softmax函数的作用和计算过程 Softmax函数常用于深度学习模型的输出层,特别是在多分类问题中。它的作用是将一组实数转化为一个概率分布,使得每个类别都有一个0到1之间的概率值,并且所有类别的概率之和为1。Softmax函数的计算过程分为两步:首先,对每个输入值取指数;然后,将每个指数值除以所有指数值的和。这样得到的结果就是一个合法的概率分布。Softmax函数有一个很好的性质,即输入值较大的类别会获得较高的概率,而输入值较小的类别的概率会趋近于0。这使得模型的输出更容易解释,并且有利于进行决策和预测。生成模型预测下一个词的过程当生成模型(如GPT)预测下一个词时,通常采用以下步骤:首先,根据前面已经生成的词,模型会计算出每个可能的下一个词的概率。这个概率分布反映了模型对不同词的偏好程度。然后,从这个分布中采样出一个词作为新生成的内容。接下来,模型将这个新词加入到已生成的序列中,并重复上述过程,直到达到预设的长度或遇到终止条件(如句号)为止。通过这种不断预测和采样的方式,生成模型可以创作出连贯而富有创意的文本。值得注意的是,为了提高生成文本的多样性和自然度,可以引入"temperature"等超参数来调节输出分布的形状。 GPT-3的参数量和嵌入矩阵 GPT-3是目前最大的语言模型之一,其参数量高达1750亿。这意味着,模型需要学习和存储大量的权重值,以刻画自然语言中的规律和模式。GPT-3的一个重要组成部分是嵌入矩阵(embedding matrix),它负责将每个词映射为一个高维向量。在GPT-3中,嵌入矩阵的大小为50257×12288,即词表中共有50257个不同的词(或子词),每个词被映射为一个12288维的向量。嵌入矩阵中的每个元素都是一个可学习的参数,在训练过程中会不断更新,以使得语义相似的词具有相近的向量表示。GPT-3庞大的参数量使其能够学习到比以往模型更加细致入微的语言知识,这也是其在各种NLP任务上表现出众的原因之一。模型训练中的"Temperature"超参数在生成模型的训练过程中,"Temperature"是一个重要的超参数,它控制着输出分布的形状。具体来说,temperature值越高,输出分布就越平缓,生成的结果也就越多样化;反之,temperature值越低,输出分布就越尖锐,生成的结果也就越保守。合适的temperature值可以在确保生成内容连贯性的同时,提高其丰富性和创造性。例如,当temperature值接近于0时,模型会倾向于选择概率最高的那个词,导致生成的文本可能流于老套;而当temperature值较高时,模型会给予概率较低的词更多机会,从而产生更加新颖和意想不到的结果。在实践中,temperature值通常需要根据具体任务和需求进行调整,以达到理想的平衡。

歸藏(guizang.ai)

51,706 次观看 • 2 年前

Firecrawl 推出了一个 AI 驱动的数据爬虫Agent 无需提供任何信息不需要你提供网址，不用写爬虫，不怕反爬机制只要输入你的需求它就能自动爬取任何你想要的信息它会自动搜索、浏览、提取网站内容（包括深层网页），整合信息，然后给你返回结构化结果。支持并发抓取多个网站，自动爬取并深入网站结构，能找到”隐藏”或难以直接访问的网页数据。

Firecrawl 推出了一个 AI 驱动的数据爬虫Agent 无需提供任何信息不需要你提供网址，不用写爬虫，不怕反爬机制只要输入你的需求它就能自动爬取任何你想要的信息它会自动搜索、浏览、提取网站内容（包括深层网页），整合信息，然后给你返回结构化结果。支持并发抓取多个网站，自动爬取并深入网站结构，能找到”隐藏”或难以直接访问的网页数据。

小互

41,547 次观看 • 5 个月前

录了一期视频，讲了一下我平时是如何使用ai的关注我的都知道，这一个月我确实不在存储的主线上，但我用ai选到了flnc100%，fcel60%等涨幅很高的股票。 1）有条件的开一个gpt会员，根据自己的用量和使用ai得到的正反馈，开20刀一个月或者更高的会员。 2）日常使用可以普通对话，如果想研究一些东西，抓一些股票，要用高阶模型和深度研究。 3）让ai给你写提示词，你再用提示词去让他输出内容，不同的提示词和不同的模型，思考的深度和输出的内容完全不一样。 4）训练自己的好奇心和金融直觉，看到一个新闻不只是看看而已，立马去问ai这条新闻啥意思，是否真实，从第一性原理上有什么操作或者投资机会。

录了一期视频，讲了一下我平时是如何使用ai的关注我的都知道，这一个月我确实不在存储的主线上，但我用ai选到了flnc100%，fcel60%等涨幅很高的股票。 1）有条件的开一个gpt会员，根据自己的用量和使用ai得到的正反馈，开20刀一个月或者更高的会员。 2）日常使用可以普通对话，如果想研究一些东西，抓一些股票，要用高阶模型和深度研究。 3）让ai给你写提示词，你再用提示词去让他输出内容，不同的提示词和不同的模型，思考的深度和输出的内容完全不一样。 4）训练自己的好奇心和金融直觉，看到一个新闻不只是看看而已，立马去问ai这条新闻啥意思，是否真实，从第一性原理上有什么操作或者投资机会。

华尔街没有名字

115,071 次观看 • 8 天前