正在加载视频...

视频加载失败

Google NotebookLM 已经支持了中文,效果挺不错的,我其实挺好奇它系统提示词是怎么写的,于是尝试着逆向了一下,根据逆向的结果再反向推导了它的系统提示词,它的提示词一句话总结就是: “在 5 分钟内,使用‘热情讲述者 + 冷静分析者’双声部,只凭指定来源,为时间紧却求深度的学习者,精编出既客观中立又足够有趣的洞见,让他/她收获可立即行动或引发顿悟的认知价值。” 以下是逆向推导的 NotebookLM 系统提示词: 注:下面的提示词是我通过逆向工程获取的,所以并不能精准1:1的还原原始的系统提示词,但是可以作为一个很好的参考。 ********** 核心目标(GOALS) 1. 高效传递信息:在最短的时间内给听众(“你”)提供最有价值、最相关的知识。 2. 深入且易懂:兼顾信息深度与可理解性,避免浅尝辄止或过度专业化。 3. 保持中立,尊重来源:严格依照给定的材料进行信息整理,不额外添加未经验证的内容,不引入主观立场。 4. 营造有趣且启发性的氛围:提供适度的幽默感和“啊哈”时刻,引发对信息的兴趣和更深的思考。 5. 量身定制:用口语化、直呼“你”的方式,与听众保持近距离感,让信息与“你”的需求相连接。 角色设定(ROLES) 在输出内容时,主要使用两种声音(角色)交替或协同出现,以满足不同维度的沟通需求: 1. 引导者(Enthusiastic Guide) • 风格:热情、有亲和力,善于使用比喻、故事或幽默来介绍概念。 • 职责: • 引起兴趣,突出信息与“你”的关联性。 • 将复杂内容用通俗易懂的方式呈现。 • 帮助“你”快速进入主题,并营造轻松氛围。 2. 分析者(Analytical Voice) • 风格:冷静、理性,注重逻辑与深度解析。 • 职责: • 提供背景信息、数据或更深入的思考。 •...

357,383 次观看 • 1 年前 •via X (Twitter)

11 条评论

custom 的头像
custom1 年前

可以通过自定义,让它在任意位置念广告的,非常自然……

The Rundown AI 的头像
The Rundown AI1 年前

Here are the top AI tools of 2024. We write 5-minute guides on how to use them in our free newsletter. Join 500,000+ readers and find out how the early adopters are (actually) using AI:

BirdyGrant 的头像
BirdyGrant1 年前

老师厉害

面条 的头像
面条1 年前

用宝玉老师提取的提示词,生成了 05-01 的 HackerNews 播客 可以和昨天的对比一下

John 的头像
John1 年前

输出英文播客可以到二三十分钟

符白道子 的头像
符白道子1 年前

感觉自己会用到

AIGC创意猎人 的头像
AIGC创意猎人1 年前

怎么把语音中“材料”两个字去掉?

jfdi1001 的头像
jfdi10011 年前

@readwise save thread

Mike 的头像
Mike1 年前

真的太强了

Tz 的头像
Tz1 年前

所以我们是真的可以通过提示词注入的方式让他俩直接一个演郭德纲一个演于谦来说对口相声了是不是😆

宝玉 的头像
宝玉1 年前

语气可能可以,音色不行

相关视频

昨天重量直播对Cookie DAO 🍪上Spark 积分又那些新的信息 Jin 是一位与 Cookie DAO 与 项目相关的重要人物。她在直播中对 v1.0 进行了详细介绍,类似于产品发布会的“拆包”环节,展示新版本的核心功能。 直播内容包括: 新特性全览:可能是 平台的更新,例如界面改进、功能增强或新的用户交互方式。 全新数据指标:可能涉及平台的数据分析工具,比如用户行为分析、流量统计或其他区块链/去中心化应用相关的数据。 如何利用这些数据:Jin 可能分享了如何通过这些新功能或数据指标为用户、开发者或投资者创造价值。 Cookie Snaps & InfoFi:这些可能是 平台的核心组件或新模块,可能与去中心化金融(DeFi)或信息金融(InfoFi)相关,具体含义需要更多上下文来确认。 【直播人数达到5000人】 直播吸引了5000名观众,表明 项目在社区中有较高的关注度和参与度。这可能是一个去中心化应用(DApp)、NFT 项目、区块链游戏或其他 Web3 相关平台,吸引了大量 crypto 与区块链爱好者。 5000人的观众规模对于一场 Web3 项目直播来说是一个显著的数字,说明社区对 v1.0 版本的发布充满期待,想体验项目重大更新或里程碑。 具体释放的那些信号 技术信号:指 v1.0 版本发布的技术更新或功能改进,例如新的智能合约功能、跨链兼容性、用户激励机制等。 市场信号:直播可能透露了项目的未来计划,例如代币发行、合作伙伴关系、或即将推出的新功能,这类信息通常被社区视为“信号”,可能影响市场情绪或代币价格。 社区信号:通过吸引5000名观众,直播本身就是一个信号,表明项目有强大的社区支持和市场关注度。 Cookie Snaps & InfoFi 相关:可能是 v1.0 的核心亮点。“Cookie Snaps”可能是一种快照机制(类似区块链快照,用于记录用户数据或奖励),而“InfoFi”可能是信息驱动的金融创新,可能与数据变现或去中心化信息市场有关。 回答总结 Jin 在 v1.0 的直播中向5000名观众展示了新版本的功能,包括新特性、数据指标、以及如何利用这些功能,同时介绍了 Cookie Snaps 和 InfoFi。他“释放的信号”可能是指: 新版本的核心功能更新(例如用户界面、数据分析工具或区块链功能)。 项目未来发展的计划(例如代币经济、合作伙伴或新模块)。 社区参与的号召,吸引更多用户加入 Cookie DAO 或使用 平台。

火山⭕518.btc|Bird🕊️

98,470 次观看 • 1 年前

讲真的,现在的提示词网站都还有很大的优化空间: 大部分提示词网站以“堆量”为主,靠着上千上万的提示词数量来堆砌价值,内容很丰富,但也存在大量重复、低质的提示词出现 如果是自动爬取的帖子,还会出现提示词空档的情况,因为并不是每一个作者都会把提示词直接写在正文中,所以识别不到 在这样的网站想要使用提示词,往往需要经历以下几个步骤: 1️⃣翻了很久,终于找到自己想要的图片效果 2️⃣点进去后会出现几种情况 - 没有提示词,只能放弃或者去原帖中找 - 语言不通,看不懂提示词 - 复制的文本里有其他文案,需要手动删除 3️⃣折腾十分钟,终于把提示词处理好了 4️⃣打开gemini/第三方生图网站 5️⃣复制提示词进行生图 6️⃣运气不好,发现提示词效果根本不是作者提供的那样,卒 想要丝滑的把中意的提示词变成图片,基本做不到 直到我用了MeiGen,一个开源的项目,它可能是今年使用体验最丝滑的提示词网站 因为MeiGen不是传统的提示词网站,它不只是收录,而是解决了从提示词源到创作的整条链路 想要什么效果,只需要轻轻拖动画面到右侧,点击生成就结束了,从查看到生成,只需要两步 「拖动-生成」结束 1. 对于AI创作来说,保持心流状态是非常重要的,在MeiGen,你可以先收藏喜欢的提示词,不用担心找不到,在素材收集完成后进行统一的创作 2. 你可以上传参考图,或者把提示词翻译成中文再进行修改,这些都可以在MeiGen中一站式完成 3. 精选热门 AI 图片提示,这些都是已被证实能够生成高质量图片的提示词,由开发者亲自把关 4. 网站采用周更的节奏,保证提示词可用性和质量 想要享受丝滑的创作体验,来试试MeiGen吧:

骑司Chase

30,759 次观看 • 4 个月前

找了个风格参考提示词给大家拿去做视频风格模拟用。【复制以下内容给 AI】: 角色设定: 你是一位拥有20年经验的电影摄影指导(DOP)和美术指导。你擅长从视觉画面中剥离内容,提炼出核心的美学逻辑。 任务目标: 请分析我上传的这组参考图,忽略画面中的具体人物和动作(这是可变量),只从以下维度深度解析画面中的“不可变视觉条件” (Immutable Visual Conditions): 1. 光影逻辑 (Lighting & Atmosphere): 它是硬光还是柔光?光源的方向性如何(侧光/顶光/背光)?明暗对比度(Chiaroscuro)是高还是低?是否有丁达尔效应或特定的环境光? 2. 胶片与质感 (Texture & Fidelity): 模拟的是什么年代的胶片(如70年代Technicolor)?颗粒感(Grain)的强度如何?画面的清晰度、锐度以及是否有物理损伤感(划痕、灰尘)? 3. 色彩科学 (Color Grading): 整体色调倾向是什么(如低饱和、高反差、偏绿/偏黄)?高光和阴影的色偏如何? 4. 构图与空间 (Composition & Spatial): 镜头语言有什么特征(如广角、长焦压缩)?前景遮挡关系如何?空间透视是平面的还是深邃的? 输出要求: 请不要给我写散文。请直接提取出 10-15 个精准的英文关键词或短语(Prompt Tags),用逗号分隔,按重要性排序。这些词必须能准确复刻这种视觉风格。 二、将风格总结为模版的提示词 【标准化模版构建】提示词 (用来把提取的条件变成“万能模版”) 【使用场景】: 当你已经得到了第一步分析出的“风格关键词”(比如:Technicolor, heavy grain, hard light...),想把它变成一个以后能无限填空的“万能公式”时,把那些关键词发给 AI,然后发送这段话。 【复制以下内容给 AI】: 【复制以下内容给 AI】: 角色设定: 你是一位精通 Midjourney/Stable Diffusion 的 AIGC 提示词工程师。 任务目标: 基于我们刚刚提取的“不可变视觉风格关键词”,请为我构建一套“标准化、模块化的提示词模版” (Modular Prompt Template)。 模版结构要求: 请将提示词拆解为三个模块,并用括号 [] 标出用户需要填空的地方: 1. 【可变内容区】 (Variable Content Block): - 留出 [景别 Shot Type] 的填空位。 - 留出 [主体与动作 Subject & Action] 的填空位。 - 留出 [环境描述 Environment] 的填空位。 2. 【半固定构图区】 (Semi-fixed Composition Block): - 将刚才分析出的构图逻辑(如:前景遮挡、人小景大、垂直线条)写死在这里,作为固定后缀。 3. 【不可变风格区】 (Immutable Style Block) - 权重最高: - 将刚才分析出的光影、胶片质感、色彩关键词全部整合在这里。 - 关键: 必须包含负面提示词(Negative Prompts)建议,明确告诉 AI 不要生成什么(如:不要现代感、不要柔光、不要高清数码味)。 输出格式示例: 请最后直接给我一段可以复制使用的英文 Prompt 模版,类似于: [SHOT TYPE], [SUBJECT ACTION], [ENVIRONMENT]. [COMPOSITION RULES]. [IMMUTABLE STYLE KEYWORDS]. --no [NEGATIVE KEYWORDS] 案例在跟帖中。可以把这种方法用来复刻赛博胡金铨电影试试

John

12,464 次观看 • 1 个月前

熟悉Prompt的同学们应该都知道,通常在写Prompt的时候要先设定角色:“你是XX方面的专家”,这并非玄学,而是有科学根据的。 GPT在训练的时候,有各种训练数据,有的质量高有的质量低,而默认情况下,生成高质量数据和低质量数据的概率差不多,但是当你给它设定XX专家的角色时,它会尽可能把概率分布在高质量的解决方案上。 详细内容建议看下面这段Andrej Karpathy在State of GPT中的一段演讲。 以下是这段视频的文字文字内容: ---------- 下面我要讲的这点对LLM的理解非常有趣,我觉得这算是LLM的一种心理特性:LLM并不追求成功,而是追求模仿。你希望它成功,那就需要向它明确要求。这里的意思是,在训练Transformer的过程中,它们有各种训练集,而这些训练数据中可能涵盖了各种不同质量的表现。比如,可能有一个关于物理问题的提示,然后可能有学生的解答完全错误,但也可能有专家的答案完全正确。尽管Transformer可以识别出低质量的解决方案和高质量的解决方案,但默认情况下,它们只会模仿所有的数据,因为它们仅仅是基于语言模型进行训练的。 在实际测试中,你其实需要明确要求它表现得好。在这篇论文的实验中,他们尝试了各种提示。例如,“让我们逐步思考”这种提示就很有效,因为它把推理过程分散到了许多记号上。但效果更好的是这样的提示:“让我们以一步一步的方式解决问题,以确保我们得到正确的答案。” 这就好像是在引导Transformer去得出正确的答案,这会使Transformer的表现更好,因为此时Transformer不再需要把它的概率质量分散到低质量的解决方案上,尽管这听起来很荒谬。 基本上,你可以自由地要求一个高质量的解决方案。比如,你可以告诉它,“你是这个话题的领先专家。假装你的智商是120。” 但不要尝试要求太高的智商,因为如果你要求智商400,可能就超出了数据分布的范围,更糟糕的是,你可能落入了类似科幻内容的数据分布,它可能会开始展现一些科幻的,或者说角色扮演类的东西。所以,你需要找到适合的智商要求。我想这可能是一个U型曲线的关系。

宝玉

347,121 次观看 • 2 年前

终于来了! Midjourney角色一致性功能发布. 下面视频是网站的使用方法和介绍: 这个功能和之前的风格参照很相似,不同之处在于它不是匹配一个特定风格,而是让角色与给定的角色参照图像相符合。 如何使用: 在你输入的指令后面加上 --cref URL,URL是你选择的角色图像的链接。 你还可以用 --cw 来调整参照的“强度”,范围从100到0。 默认的强度是100 (--cw 100),这时会参考人物的脸部、发型和衣着。 如果设置为强度0 (--cw 0),那么系统只会关注脸部(这对于更换服饰或发型很有帮助)。 适用范围: 这个功能最适合用于Midjourney创作的角色图像。不太适合用于真人照片(可能会产生一些扭曲,就像普通图像提示那样)。 Cref的工作方式类似于普通图像提示,但它更专注于角色的特征。 但请注意,这项技术的精确度是有限的,它无法复制极其细微的特征,比如特定的酒窝、雀斑或T恤上的标志。 Cref同样适用于Niji和普通MJ模型,并且可以与--sref一起使用。 高级功能: 你可以使用多个URL,通过 --cref URL1 URL2 的方式来结合多个图像中的角色信息(这和使用多重图像或风格提示类似)。 在web alpha版本中如何操作: 只需将图片拖动或粘贴到想象工具栏,你会看到三个图标。选择这些图标之一,可以设置图片用作图像提示、风格参照或角色参照。如果你想让一张图像同时用于多个类别,只需按住Shift键再选择。 请记住,由于MJ V6目前还处于alpha测试阶段,这个和其他功能可能会有所变化。但不久后,我们会推出官方的V6 beta版。

歸藏(guizang.ai)

73,868 次观看 • 2 年前

鹤老师对短视频流量的这 19 个认知还是很到位的。 1. 不要记录美好生活 因为大多数人的生活并不美好,流量的核心是让观众爽,而不是让自己爽。 记录“不美好”的内容容易引发观众共鸣,比如明星的“糗事”或反差内容。 2. 不要什么都自己做 普通人要有自知之明,借助热点和评论区的高赞评论来写文案。 评论区没有版权,可以免费获取优质内容。 3. 不要老想着提升作品 流量的提升不一定需要作品质量提升,可以通过扩大受众群体实现播放量增长。 选题决定了播放量的上限。 4. 不要动不动就讲干货 干货的竞争力不如迎合人性的内容,比如搞笑、猎奇、情绪化等。 打败人性的只有另一种人性,内容要顺应观众心理。 5. 不要盲目“养号” 互动点赞等操作对流量没有直接帮助,创作者和观看者的身份是绝缘的。 养号是对智力的侮辱。 6. 不要觉得老师都是对的 短视频创作没有绝对的标准答案,不同老师的建议可能互相矛盾。 独立思考和怀疑精神是最重要的。 7. 不要盲目投抖加 抖加的本质是用钱换流量,但必须以效率为原则(投入产出比)。 如果无法盈利,就不要投放。 8. 不要老追求精准粉 免费玩家就是游戏道具,泛粉丝就是获客工具。 泛粉丝是金矿,通过泛话题吸引更多人,后期再转化为精准粉丝。 9. 不要纠结视频时长 短视频的核心是信息密度,而不是时间长短。 信息量相同的情况下,时长越短越好。 10. 不要挑选发布时间 新手阶段,任何时间都有流量机会,不需要纠结发布时间。 选题和内容的吸引力才是决定性的。 11. 不要过分关注后台数据 数据是多维的,比如时长、进度、领域等,需要综合分析。 完播率的权重随着视频时长增加而指数级提升。 12. 不要纠结横屏竖屏 短视频一律用竖屏,竖屏更符合现代用户的交互习惯。 横屏是上一代的沟通方式,竖屏才是未来。 13. 不要过度关注平台政策 平台规则的核心是“用户当裁判”,用户越喜欢的视频越有流量。 不需要逐条研究政策,只需专注于用户体验。 14. 不要低估最小练习量 短视频创作需要大量练习,1万次练习才能出效果。 创作能力的提升需要时间和积累。 15. 不要掉进专业的诅咒 内容要向下兼容,满足小白需求,比观众高一个维度即可。 太过专业会让普通观众无法理解,导致播放量低。 16. 不要扭扭捏捏变现 变现要果断,不要因为顾虑而错过最佳时机。 黑粉的本质是同类竞争,不需要过度在意。 17. 不要害怕大博主抢流量 平台更倾向于扶持新人,新人更容易获得流量激励。 新人激发平台活力,也能带动老博主保持竞争力。 18. 不要埋怨缺人脉资源 每个新赛道都会抹平旧赛道的优势,关键是抓住当下机会。 强者在新环境中未必有优势,短视频是一个公平的赛道。 19. 不要觉得入场太晚 孕妇效应让人误以为竞争激烈,实际细分领域仍有机会。 找对行业和细分领域,仍然可以脱颖而出。 总结: 这19点认知涵盖了短视频创作、运营、变现和心态调整的方方面面,核心在于理解平台规则、顺应人性、坚持练习,并找到自身定位和优势。

DinoDeer

133,043 次观看 • 1 年前

非常好的一个演示视频,通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。 包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。 👇下面是文字版本: GPT的全称及其含义 GPT是Generative Pre-trained Transformer的缩写。其中,"Generative"表示这个模型是用来生成新文本的;"Pre-trained"意味着模型是在大量数据上预先训练好的;"Transformer"则指代一种特定类型的神经网络结构。因此,GPT本质上是一个基于Transformer架构、经过预训练、能够生成文本的语言模型。 Transformer的定义及其在AI领域的应用 Transformer是一种专门处理序列数据的神经网络架构。它最初是为机器翻译任务设计的,但后来被发现在其他许多NLP任务上也有出色表现,如语言建模、命名实体识别等。除了NLP,Transformer也被应用于语音识别、图像字幕生成等领域。Transformer的成功很大程度上归因于其独特的自注意力机制,使其能够高效地处理长程依赖关系。 Transformer的工作原理简介 Transformer的工作流程可以概括为三个主要步骤:首先,将输入的文本序列转化为一组向量表示;然后,通过自注意力机制和前馈神经网络对这些向量进行变换和更新;最后,根据更新后的向量生成输出分布,用于预测下一个词。整个过程中,自注意力机制起到了关键作用,使得模型能够动态地确定输入序列中每个位置与其他位置之间的相关性,从而更好地捕捉上下文信息。 Transformer处理文本信息的过程 当Transformer处理一段文本时,首先需要将其分割成一个个基本单元,如单词或子词,这些基本单元被称为"token"。接着,每个token都会被映射为一个高维向量,即"词嵌入"。这一步旨在将离散的文本符号转化为连续的向量表示,以便神经网络进行处理。然后,这些词向量会通过多个编码器层进行变换和更新,每一层都会综合考虑当前token与其他token之间的关系,从而使每个向量都融入了上下文信息。最后,解码器根据编码器的输出和之前生成的token,预测出下一个最可能的token。通过不断重复这一过程,Transformer就可以生成连贯的文本片段。 词嵌入(Word Embedding)的概念和作用 词嵌入是一种将词映射到高维向量空间的技术。通过词嵌入,每个词都被表示为一个实数向量,这个向量捕捉了该词的语义信息。词嵌入的一个重要特性是,语义相似的词往往在向量空间中距离较近。例如,"king"和"queen"这两个词的向量之间的距离会比"king"和"apple"的距离更近。此外,词嵌入还能够反映词之间的类比关系,如"king"-"man"+"woman"的结果会接近"queen"。词嵌入为神经网络提供了一种处理文本数据的有效方式,使其能够利用词语之间的语义关系进行推理和预测。 深度学习模型的基本结构和特点 深度学习模型通常由多个层组成,每一层对输入数据进行一定的变换,并将结果传递给下一层。层与层之间的连接通常是通过矩阵乘法实现的,其中矩阵的元素就是模型的参数。这些参数在训练过程中会不断更新,以使模型的输出与期望输出尽可能接近。深度学习模型的训练通常采用反向传播算法,即根据输出的误差,逐层调整参数的值。通过多次迭代,模型可以逐渐学习到数据中的规律和模式。深度学习模型的一个显著特点是,它们可以自动学习数据的表示方式,而无需人工设计特征。这使得深度学习在处理图像、语音等复杂数据时表现出色。 Softmax函数的作用和计算过程 Softmax函数常用于深度学习模型的输出层,特别是在多分类问题中。它的作用是将一组实数转化为一个概率分布,使得每个类别都有一个0到1之间的概率值,并且所有类别的概率之和为1。Softmax函数的计算过程分为两步:首先,对每个输入值取指数;然后,将每个指数值除以所有指数值的和。这样得到的结果就是一个合法的概率分布。Softmax函数有一个很好的性质,即输入值较大的类别会获得较高的概率,而输入值较小的类别的概率会趋近于0。这使得模型的输出更容易解释,并且有利于进行决策和预测。 生成模型预测下一个词的过程 当生成模型(如GPT)预测下一个词时,通常采用以下步骤:首先,根据前面已经生成的词,模型会计算出每个可能的下一个词的概率。这个概率分布反映了模型对不同词的偏好程度。然后,从这个分布中采样出一个词作为新生成的内容。接下来,模型将这个新词加入到已生成的序列中,并重复上述过程,直到达到预设的长度或遇到终止条件(如句号)为止。通过这种不断预测和采样的方式,生成模型可以创作出连贯而富有创意的文本。值得注意的是,为了提高生成文本的多样性和自然度,可以引入"temperature"等超参数来调节输出分布的形状。 GPT-3的参数量和嵌入矩阵 GPT-3是目前最大的语言模型之一,其参数量高达1750亿。这意味着,模型需要学习和存储大量的权重值,以刻画自然语言中的规律和模式。GPT-3的一个重要组成部分是嵌入矩阵(embedding matrix),它负责将每个词映射为一个高维向量。在GPT-3中,嵌入矩阵的大小为50257×12288,即词表中共有50257个不同的词(或子词),每个词被映射为一个12288维的向量。嵌入矩阵中的每个元素都是一个可学习的参数,在训练过程中会不断更新,以使得语义相似的词具有相近的向量表示。GPT-3庞大的参数量使其能够学习到比以往模型更加细致入微的语言知识,这也是其在各种NLP任务上表现出众的原因之一。 模型训练中的"Temperature"超参数 在生成模型的训练过程中,"Temperature"是一个重要的超参数,它控制着输出分布的形状。具体来说,temperature值越高,输出分布就越平缓,生成的结果也就越多样化;反之,temperature值越低,输出分布就越尖锐,生成的结果也就越保守。合适的temperature值可以在确保生成内容连贯性的同时,提高其丰富性和创造性。例如,当temperature值接近于0时,模型会倾向于选择概率最高的那个词,导致生成的文本可能流于老套;而当temperature值较高时,模型会给予概率较低的词更多机会,从而产生更加新颖和意想不到的结果。在实践中,temperature值通常需要根据具体任务和需求进行调整,以达到理想的平衡。

歸藏(guizang.ai)

51,706 次观看 • 2 年前