正在加载视频...

视频加载失败

加载此视频时出现问题。这可能是由于临时网络问题，或视频可能不可用。

在我们调用OpenAI的API的时候，除了Prompt和模型，还有几个参数可以选：Temperature、Top K和Top P。大部分都知道温度（Temperature）参数是可以控制输出的确定性的，温度越低，输出结果越确定；反之温度越高，输出结果越具有多样性。那么Top K和Top P是什么呢？看完这个视频你会找到答案！

宝玉

229,224 subscribers

75,945 次观看 • 3 年前 •via X (Twitter)

科学技术教育健康养生

Anya Rossi• Live Now

Private livecam show

10 条评论

宝玉的头像

宝玉3 年前

这个视频来自Google的Generative AI learning path课程系列的《Introduction to Generative AI Studio 生成式人工智能工作室介绍》完整视频：

宝玉的头像

宝玉3 年前

Top K 可以让模型从可能性最高的前 K 个词中随机返回一个词，这种方法可以让模型不会总是选概率最高的那个，而是从概率最高的前K个词中随机选择一个词。但这种方法有一个缺陷，比如说你指定Top K是3，但如果概率最高的前3个词里面，第3个词其实概率很低相关度很弱，那么就会导致生成的结果不够好。 Top P则是另一种选择方式，让模型可以从一组总和不超过 P 的词中选择。例如，Top P为0.75意味着你从一组累积概率大于0.75的词中取样。这样可以避免概率很低的词被选中。不过通常来说，你是用不上Top K和Top P的，但是知道一下它们是什么意思总是不错的。

Erik Yi Loo 的头像

Erik Yi Loo3 年前

感觉它用同一张图来说明Top K和Top P会有点误导，一开始我没看懂这两有啥区别，看上去都是前N个值。Top K是前K个词选择没问题，但Top P影响的实际是由前面的语句预测出来的下一个词集的结果。它如果用2个不同的预测来说明Top P可能更好。

自力hzlzh 的头像

自力hzlzh3 年前

Nice，直观好懂

天生反骨的头像

天生反骨3 年前

@SaveToNotion #tweet #chatgpt #topk

fabsOU 的头像

fabsOU3 年前

理解 Temperature、Top K和Top P #prompt

synia 的头像

synia3 年前

Top P感觉更有用些

Ted Zhang🇨🇦 的头像

Ted Zhang🇨🇦3 年前

@threadreaderapp unroll

Thread Reader App 的头像

Thread Reader App3 年前

@dotey @tedzhang2891 Hello, the unroll you asked for: See you soon. 🤖

ⓧ xy 的头像

ⓧ xy3 年前

@SaveToNotion #thread

相关视频

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期9——生成配置 #大型语言模型与生成式AI 这个视频介绍了如何利用配置参数影响大型语言模型（LLM）的输出。每个模型都有一套可以在推理时调用的配置参数，包括“Max new tokens”（最大新标记数）等。视频还讨论了贪婪解码和随机抽样等解码方式，以及如何使用top k和top p抽样技术限制随机抽样并增加输出有意义的可能性。此外，还介绍了一个名为“temperature”的参数，可以控制模型输出的随机性。温度越高，随机性越大；温度越低，随机性越小。这些知识可以帮助我们更好地理解和控制模型生成的内容，提高其性能。课程地址：播放列表：

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期9——生成配置 #大型语言模型与生成式AI 这个视频介绍了如何利用配置参数影响大型语言模型（LLM）的输出。每个模型都有一套可以在推理时调用的配置参数，包括“Max new tokens”（最大新标记数）等。视频还讨论了贪婪解码和随机抽样等解码方式，以及如何使用top k和top p抽样技术限制随机抽样并增加输出有意义的可能性。此外，还介绍了一个名为“temperature”的参数，可以控制模型输出的随机性。温度越高，随机性越大；温度越低，随机性越小。这些知识可以帮助我们更好地理解和控制模型生成的内容，提高其性能。课程地址：播放列表：

宝玉

12,463 次观看 • 3 年前

姚顺雨这段话很有价值：无论是企业还是个人，我觉得越来越重要的事情是Context 因为模型越来越擅长把一个非常复杂的输入变成一个输出，很多时候你的竞争壁垒就来自于你有没有最原始的输入

姚顺雨这段话很有价值：无论是企业还是个人，我觉得越来越重要的事情是Context 因为模型越来越擅长把一个非常复杂的输入变成一个输出，很多时候你的竞争壁垒就来自于你有没有最原始的输入

马识途

68,370 次观看 • 29 天前

为什么会有这么多穷人？罗伯特·清崎是这么说的「他们不知道什么是真钱，什么是假钱」如果你用假钱，去买实物，就会越来越穷，如果你用假钱，去买真钱，就会越来越富有。看完视频后会重新建立你的金钱观这个视频一定值得你点赞，收藏，分享。

为什么会有这么多穷人？罗伯特·清崎是这么说的「他们不知道什么是真钱，什么是假钱」如果你用假钱，去买实物，就会越来越穷，如果你用假钱，去买真钱，就会越来越富有。看完视频后会重新建立你的金钱观这个视频一定值得你点赞，收藏，分享。

Web3老吴

377,994 次观看 • 5 个月前

你有想过，如果你在不同的地方长大，会成为什么样的人吗？越来越多研究正试图回答这个长久以来的“先天与后天”之争。从某个角度来看，每个人的DNA都是独一无二的，而且无论我们搬到哪里，基因的基本结构都不会改变。但科学家指出，DNA并不能单独决定我们是谁。

你有想过，如果你在不同的地方长大，会成为什么样的人吗？越来越多研究正试图回答这个长久以来的“先天与后天”之争。从某个角度来看，每个人的DNA都是独一无二的，而且无论我们搬到哪里，基因的基本结构都不会改变。但科学家指出，DNA并不能单独决定我们是谁。

BBC News 中文

59,666 次观看 • 4 个月前

非常好的一个演示视频，通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。 👇下面是文字版本： GPT的全称及其含义 GPT是Generative Pre-trained Transformer的缩写。其中,"Generative"表示这个模型是用来生成新文本的;"Pre-trained"意味着模型是在大量数据上预先训练好的;"Transformer"则指代一种特定类型的神经网络结构。因此,GPT本质上是一个基于Transformer架构、经过预训练、能够生成文本的语言模型。 Transformer的定义及其在AI领域的应用 Transformer是一种专门处理序列数据的神经网络架构。它最初是为机器翻译任务设计的,但后来被发现在其他许多NLP任务上也有出色表现,如语言建模、命名实体识别等。除了NLP,Transformer也被应用于语音识别、图像字幕生成等领域。Transformer的成功很大程度上归因于其独特的自注意力机制,使其能够高效地处理长程依赖关系。 Transformer的工作原理简介 Transformer的工作流程可以概括为三个主要步骤:首先,将输入的文本序列转化为一组向量表示;然后,通过自注意力机制和前馈神经网络对这些向量进行变换和更新;最后,根据更新后的向量生成输出分布,用于预测下一个词。整个过程中,自注意力机制起到了关键作用,使得模型能够动态地确定输入序列中每个位置与其他位置之间的相关性,从而更好地捕捉上下文信息。 Transformer处理文本信息的过程当Transformer处理一段文本时,首先需要将其分割成一个个基本单元,如单词或子词,这些基本单元被称为"token"。接着,每个token都会被映射为一个高维向量,即"词嵌入"。这一步旨在将离散的文本符号转化为连续的向量表示,以便神经网络进行处理。然后,这些词向量会通过多个编码器层进行变换和更新,每一层都会综合考虑当前token与其他token之间的关系,从而使每个向量都融入了上下文信息。最后,解码器根据编码器的输出和之前生成的token,预测出下一个最可能的token。通过不断重复这一过程,Transformer就可以生成连贯的文本片段。词嵌入(Word Embedding)的概念和作用词嵌入是一种将词映射到高维向量空间的技术。通过词嵌入,每个词都被表示为一个实数向量,这个向量捕捉了该词的语义信息。词嵌入的一个重要特性是,语义相似的词往往在向量空间中距离较近。例如,"king"和"queen"这两个词的向量之间的距离会比"king"和"apple"的距离更近。此外,词嵌入还能够反映词之间的类比关系,如"king"-"man"+"woman"的结果会接近"queen"。词嵌入为神经网络提供了一种处理文本数据的有效方式,使其能够利用词语之间的语义关系进行推理和预测。深度学习模型的基本结构和特点深度学习模型通常由多个层组成,每一层对输入数据进行一定的变换,并将结果传递给下一层。层与层之间的连接通常是通过矩阵乘法实现的,其中矩阵的元素就是模型的参数。这些参数在训练过程中会不断更新,以使模型的输出与期望输出尽可能接近。深度学习模型的训练通常采用反向传播算法,即根据输出的误差,逐层调整参数的值。通过多次迭代,模型可以逐渐学习到数据中的规律和模式。深度学习模型的一个显著特点是,它们可以自动学习数据的表示方式,而无需人工设计特征。这使得深度学习在处理图像、语音等复杂数据时表现出色。 Softmax函数的作用和计算过程 Softmax函数常用于深度学习模型的输出层,特别是在多分类问题中。它的作用是将一组实数转化为一个概率分布,使得每个类别都有一个0到1之间的概率值,并且所有类别的概率之和为1。Softmax函数的计算过程分为两步:首先,对每个输入值取指数;然后,将每个指数值除以所有指数值的和。这样得到的结果就是一个合法的概率分布。Softmax函数有一个很好的性质,即输入值较大的类别会获得较高的概率,而输入值较小的类别的概率会趋近于0。这使得模型的输出更容易解释,并且有利于进行决策和预测。生成模型预测下一个词的过程当生成模型(如GPT)预测下一个词时,通常采用以下步骤:首先,根据前面已经生成的词,模型会计算出每个可能的下一个词的概率。这个概率分布反映了模型对不同词的偏好程度。然后,从这个分布中采样出一个词作为新生成的内容。接下来,模型将这个新词加入到已生成的序列中,并重复上述过程,直到达到预设的长度或遇到终止条件(如句号)为止。通过这种不断预测和采样的方式,生成模型可以创作出连贯而富有创意的文本。值得注意的是,为了提高生成文本的多样性和自然度,可以引入"temperature"等超参数来调节输出分布的形状。 GPT-3的参数量和嵌入矩阵 GPT-3是目前最大的语言模型之一,其参数量高达1750亿。这意味着,模型需要学习和存储大量的权重值,以刻画自然语言中的规律和模式。GPT-3的一个重要组成部分是嵌入矩阵(embedding matrix),它负责将每个词映射为一个高维向量。在GPT-3中,嵌入矩阵的大小为50257×12288,即词表中共有50257个不同的词(或子词),每个词被映射为一个12288维的向量。嵌入矩阵中的每个元素都是一个可学习的参数,在训练过程中会不断更新,以使得语义相似的词具有相近的向量表示。GPT-3庞大的参数量使其能够学习到比以往模型更加细致入微的语言知识,这也是其在各种NLP任务上表现出众的原因之一。模型训练中的"Temperature"超参数在生成模型的训练过程中,"Temperature"是一个重要的超参数,它控制着输出分布的形状。具体来说,temperature值越高,输出分布就越平缓,生成的结果也就越多样化;反之,temperature值越低,输出分布就越尖锐,生成的结果也就越保守。合适的temperature值可以在确保生成内容连贯性的同时,提高其丰富性和创造性。例如,当temperature值接近于0时,模型会倾向于选择概率最高的那个词,导致生成的文本可能流于老套;而当temperature值较高时,模型会给予概率较低的词更多机会,从而产生更加新颖和意想不到的结果。在实践中,temperature值通常需要根据具体任务和需求进行调整,以达到理想的平衡。

非常好的一个演示视频，通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。 👇下面是文字版本： GPT的全称及其含义 GPT是Generative Pre-trained Transformer的缩写。其中,"Generative"表示这个模型是用来生成新文本的;"Pre-trained"意味着模型是在大量数据上预先训练好的;"Transformer"则指代一种特定类型的神经网络结构。因此,GPT本质上是一个基于Transformer架构、经过预训练、能够生成文本的语言模型。 Transformer的定义及其在AI领域的应用 Transformer是一种专门处理序列数据的神经网络架构。它最初是为机器翻译任务设计的,但后来被发现在其他许多NLP任务上也有出色表现,如语言建模、命名实体识别等。除了NLP,Transformer也被应用于语音识别、图像字幕生成等领域。Transformer的成功很大程度上归因于其独特的自注意力机制,使其能够高效地处理长程依赖关系。 Transformer的工作原理简介 Transformer的工作流程可以概括为三个主要步骤:首先,将输入的文本序列转化为一组向量表示;然后,通过自注意力机制和前馈神经网络对这些向量进行变换和更新;最后,根据更新后的向量生成输出分布,用于预测下一个词。整个过程中,自注意力机制起到了关键作用,使得模型能够动态地确定输入序列中每个位置与其他位置之间的相关性,从而更好地捕捉上下文信息。 Transformer处理文本信息的过程当Transformer处理一段文本时,首先需要将其分割成一个个基本单元,如单词或子词,这些基本单元被称为"token"。接着,每个token都会被映射为一个高维向量,即"词嵌入"。这一步旨在将离散的文本符号转化为连续的向量表示,以便神经网络进行处理。然后,这些词向量会通过多个编码器层进行变换和更新,每一层都会综合考虑当前token与其他token之间的关系,从而使每个向量都融入了上下文信息。最后,解码器根据编码器的输出和之前生成的token,预测出下一个最可能的token。通过不断重复这一过程,Transformer就可以生成连贯的文本片段。词嵌入(Word Embedding)的概念和作用词嵌入是一种将词映射到高维向量空间的技术。通过词嵌入,每个词都被表示为一个实数向量,这个向量捕捉了该词的语义信息。词嵌入的一个重要特性是,语义相似的词往往在向量空间中距离较近。例如,"king"和"queen"这两个词的向量之间的距离会比"king"和"apple"的距离更近。此外,词嵌入还能够反映词之间的类比关系,如"king"-"man"+"woman"的结果会接近"queen"。词嵌入为神经网络提供了一种处理文本数据的有效方式,使其能够利用词语之间的语义关系进行推理和预测。深度学习模型的基本结构和特点深度学习模型通常由多个层组成,每一层对输入数据进行一定的变换,并将结果传递给下一层。层与层之间的连接通常是通过矩阵乘法实现的,其中矩阵的元素就是模型的参数。这些参数在训练过程中会不断更新,以使模型的输出与期望输出尽可能接近。深度学习模型的训练通常采用反向传播算法,即根据输出的误差,逐层调整参数的值。通过多次迭代,模型可以逐渐学习到数据中的规律和模式。深度学习模型的一个显著特点是,它们可以自动学习数据的表示方式,而无需人工设计特征。这使得深度学习在处理图像、语音等复杂数据时表现出色。 Softmax函数的作用和计算过程 Softmax函数常用于深度学习模型的输出层,特别是在多分类问题中。它的作用是将一组实数转化为一个概率分布,使得每个类别都有一个0到1之间的概率值,并且所有类别的概率之和为1。Softmax函数的计算过程分为两步:首先,对每个输入值取指数;然后,将每个指数值除以所有指数值的和。这样得到的结果就是一个合法的概率分布。Softmax函数有一个很好的性质,即输入值较大的类别会获得较高的概率,而输入值较小的类别的概率会趋近于0。这使得模型的输出更容易解释,并且有利于进行决策和预测。生成模型预测下一个词的过程当生成模型(如GPT)预测下一个词时,通常采用以下步骤:首先,根据前面已经生成的词,模型会计算出每个可能的下一个词的概率。这个概率分布反映了模型对不同词的偏好程度。然后,从这个分布中采样出一个词作为新生成的内容。接下来,模型将这个新词加入到已生成的序列中,并重复上述过程,直到达到预设的长度或遇到终止条件(如句号)为止。通过这种不断预测和采样的方式,生成模型可以创作出连贯而富有创意的文本。值得注意的是,为了提高生成文本的多样性和自然度,可以引入"temperature"等超参数来调节输出分布的形状。 GPT-3的参数量和嵌入矩阵 GPT-3是目前最大的语言模型之一,其参数量高达1750亿。这意味着,模型需要学习和存储大量的权重值,以刻画自然语言中的规律和模式。GPT-3的一个重要组成部分是嵌入矩阵(embedding matrix),它负责将每个词映射为一个高维向量。在GPT-3中,嵌入矩阵的大小为50257×12288,即词表中共有50257个不同的词(或子词),每个词被映射为一个12288维的向量。嵌入矩阵中的每个元素都是一个可学习的参数,在训练过程中会不断更新,以使得语义相似的词具有相近的向量表示。GPT-3庞大的参数量使其能够学习到比以往模型更加细致入微的语言知识,这也是其在各种NLP任务上表现出众的原因之一。模型训练中的"Temperature"超参数在生成模型的训练过程中,"Temperature"是一个重要的超参数,它控制着输出分布的形状。具体来说,temperature值越高,输出分布就越平缓,生成的结果也就越多样化;反之,temperature值越低,输出分布就越尖锐,生成的结果也就越保守。合适的temperature值可以在确保生成内容连贯性的同时,提高其丰富性和创造性。例如,当temperature值接近于0时,模型会倾向于选择概率最高的那个词,导致生成的文本可能流于老套;而当temperature值较高时,模型会给予概率较低的词更多机会,从而产生更加新颖和意想不到的结果。在实践中,temperature值通常需要根据具体任务和需求进行调整,以达到理想的平衡。

歸藏(guizang.ai)

51,767 次观看 • 2 年前

支持通过图片插值控制 Animatediff 生成视频的ComfyUI 插件和对应的工作流Steerable Motion升级到 1.3。这个工作流玩好的话，可以制作很多神奇的效果。增加了可控性，流畅度和高分辨率输出。这个流程跟我昨天发的那个视频的工作流类似。主要设置项如下：关键帧间隔：指定在您设置的每两个关键帧之间生成的帧数。影响范围：确定 IP-适配器（IPA）的影响应用于哪些帧的范围。影响强度：设定每一帧的最低和最高影响点。图像忠实度：设定对原始输入图像保持忠实的程度。

支持通过图片插值控制 Animatediff 生成视频的ComfyUI 插件和对应的工作流Steerable Motion升级到 1.3。这个工作流玩好的话，可以制作很多神奇的效果。增加了可控性，流畅度和高分辨率输出。这个流程跟我昨天发的那个视频的工作流类似。主要设置项如下：关键帧间隔：指定在您设置的每两个关键帧之间生成的帧数。影响范围：确定 IP-适配器（IPA）的影响应用于哪些帧的范围。影响强度：设定每一帧的最低和最高影响点。图像忠实度：设定对原始输入图像保持忠实的程度。

歸藏(guizang.ai)

13,763 次观看 • 2 年前

印度肯定是不行了，越南没有那么差，而且会越来越好的，这个哥们这么说有流量，是玩明白了😄

印度肯定是不行了，越南没有那么差，而且会越来越好的，这个哥们这么说有流量，是玩明白了😄

WangNextDoor

29,528 次观看 • 2 个月前

菜就多骑，骑不动就不骑。以前是以前，现在是现在~ （这是个梗）（我来了你们想看什么）（我的手机256G+256G+512G+512G 内存有四分之三都是录的）（部分定制也会拿片段出来发一发的为了有新的好大哥定制）（这里是不是什么都可以发= =~）

菜就多骑，骑不动就不骑。以前是以前，现在是现在~ （这是个梗）（我来了你们想看什么）（我的手机256G+256G+512G+512G 内存有四分之三都是录的）（部分定制也会拿片段出来发一发的为了有新的好大哥定制）（这里是不是什么都可以发= =~）

1米59的宝马教练

12,890 次观看 • 2 年前

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

歸藏(guizang.ai)

46,883 次观看 • 1 个月前

有人在之前推文里问像这样的数字人是怎么做的，推荐 HeyGen 这款数字人产品。它可以选择不同的数字人，套用不同的模板，生成各种演说类的视频口型准确，效果还是很逼真的，如果你不会的话，也可以找我。 🔗 #AIgirl #aitools

有人在之前推文里问像这样的数字人是怎么做的，推荐 HeyGen 这款数字人产品。它可以选择不同的数字人，套用不同的模板，生成各种演说类的视频口型准确，效果还是很逼真的，如果你不会的话，也可以找我。 🔗 #AIgirl #aitools

Cellier

132,131 次观看 • 3 年前

无人机的作用会越来越大，之后用于管控是必然结果。他会极大增加执法效率，和人们对于铁拳的恐惧。这部短篇以后就是现实。名字叫请别挂机，全片没有一个恐怖镜头，但是极度恐怖，各位可以去看看。

无人机的作用会越来越大，之后用于管控是必然结果。他会极大增加执法效率，和人们对于铁拳的恐惧。这部短篇以后就是现实。名字叫请别挂机，全片没有一个恐怖镜头，但是极度恐怖，各位可以去看看。

投机实验室

35,738 次观看 • 3 个月前

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 次观看 • 7 个月前

确实，让同性恋者可以结婚可以极大化幸福，也确实没有人明显利益受损。但逻辑推导：如果男男、女女可以结婚，那么人兽可不可以？人和猪可不可以？说不定也是真爱啊？！如果婚姻制度被突破，人类将守不住任何制度性原则，正常社会的秩序也会被颠覆。所以，反同性恋和反同性恋婚姻制度不是一回事。

确实，让同性恋者可以结婚可以极大化幸福，也确实没有人明显利益受损。但逻辑推导：如果男男、女女可以结婚，那么人兽可不可以？人和猪可不可以？说不定也是真爱啊？！如果婚姻制度被突破，人类将守不住任何制度性原则，正常社会的秩序也会被颠覆。所以，反同性恋和反同性恋婚姻制度不是一回事。

西蒙•冯•弗雷德里希•胥库兹Simon Von Friedrich Xurcuz

69,227 次观看 • 1 年前

AI会永远对你撒谎。这不是bug，是数学定律。我，卡内基梅隆大学的数学学生，用数学告诉你为什么。所有语言模型，只做一件事：根据它读过的所有资料，预测下一个最有可能的词。但这里有个死结。模型的猜测，我们叫它q(x)。真实世界的概率，我们叫它p(x)。 q(x)永远不可能等于p(x)。它们之间，永远有一道鸿沟。有个数学公式，就是用来测量这道鸿沟的。只要模型不能完美预测下一个词它永远不能那这个鸿沟就永远不会是零。所以，当AI不知道真相的时候会发生什么？它不能停机，它必须给你一个答案。它只能硬着头皮，输出一个它认为“最像”答案的答案。哪怕那是错的。这就是“幻觉”。一个基于不完整信息，却无比自信的猜测。最要命的是，数学甚至给出了一个下限。就算最完美的模型，它的幻觉率也永远不可能低于这个数字。只要它不知道关于这个世界的一切它永远不可能知道。它就总会有概率，编造事实。所以，无论AI变得多强大，它都会撒谎。因为数学就是这么写的。

AI会永远对你撒谎。这不是bug，是数学定律。我，卡内基梅隆大学的数学学生，用数学告诉你为什么。所有语言模型，只做一件事：根据它读过的所有资料，预测下一个最有可能的词。但这里有个死结。模型的猜测，我们叫它q(x)。真实世界的概率，我们叫它p(x)。 q(x)永远不可能等于p(x)。它们之间，永远有一道鸿沟。有个数学公式，就是用来测量这道鸿沟的。只要模型不能完美预测下一个词它永远不能那这个鸿沟就永远不会是零。所以，当AI不知道真相的时候会发生什么？它不能停机，它必须给你一个答案。它只能硬着头皮，输出一个它认为“最像”答案的答案。哪怕那是错的。这就是“幻觉”。一个基于不完整信息，却无比自信的猜测。最要命的是，数学甚至给出了一个下限。就算最完美的模型，它的幻觉率也永远不可能低于这个数字。只要它不知道关于这个世界的一切它永远不可能知道。它就总会有概率，编造事实。所以，无论AI变得多强大，它都会撒谎。因为数学就是这么写的。

墓碑科技

73,491 次观看 • 6 个月前

如何向 8 岁小学生解释ChatGPT 的运行原理？【3B1B：LLM的本质是单词预测器】 LLM的本质是一个复杂的数学函数，它只做一件事：针对给出的任何文本，预测下一个单词。要构建一个聊天机器人，你需要先给出一些文本，描述用户与假想的AI助手之间互动。用户的输入是这次互动的开始，然后，你让模型反复预测AI助手会“说出”的下一个单词，这就是用户得到的输出结果。但是，LLM 并非以确定方式预测下一个单词，而是为所有可能的下一个单词分别分配一个概率。这样的话，如果你允许LLM以更随机方式，选择可能性更低的下一个单词，输出结果会看起来更自然。因此，这意味着，对于一个固定的提示词，LLM 每次给出的答案通常是不同的。

如何向 8 岁小学生解释ChatGPT 的运行原理？【3B1B：LLM的本质是单词预测器】 LLM的本质是一个复杂的数学函数，它只做一件事：针对给出的任何文本，预测下一个单词。要构建一个聊天机器人，你需要先给出一些文本，描述用户与假想的AI助手之间互动。用户的输入是这次互动的开始，然后，你让模型反复预测AI助手会“说出”的下一个单词，这就是用户得到的输出结果。但是，LLM 并非以确定方式预测下一个单词，而是为所有可能的下一个单词分别分配一个概率。这样的话，如果你允许LLM以更随机方式，选择可能性更低的下一个单词，输出结果会看起来更自然。因此，这意味着，对于一个固定的提示词，LLM 每次给出的答案通常是不同的。

howie.serious

121,792 次观看 • 1 年前

OpenClaw 实在惊艳了，越用越有惊喜。连续高强度用了几天后，我把所有我希望在刚上手时就能知道的内容，都总结在了这个视频里：👇

OpenClaw 实在惊艳了，越用越有惊喜。连续高强度用了几天后，我把所有我希望在刚上手时就能知道的内容，都总结在了这个视频里：👇

木子不写代码

311,708 次观看 • 4 个月前

Claude的确达到了网络飞轮效应,越是知识型的专家越喜欢用Claude,越用它蒸馏大家的知识自我迭代就越多! 如果中国用户都用不了Claude Gemini 和 ChatGPT那生产效率就会大打折扣. 这个不用杠, 用的都懂.

Claude的确达到了网络飞轮效应,越是知识型的专家越喜欢用Claude,越用它蒸馏大家的知识自我迭代就越多! 如果中国用户都用不了Claude Gemini 和 ChatGPT那生产效率就会大打折扣. 这个不用杠, 用的都懂.

WangNextDoor

26,191 次观看 • 2 个月前

只有马赛克出现的时候你才能撸！正常女人的身体可不是为你这种傻逼准备的倒计时越往后数视频越糊，射出来的时候的画面只剩下一大团马赛克，什么也看不见... 被折磨训练的精神失常，爱上对马赛克打飞机的感觉，越傻逼结果射的还越多，彻底废了完整版：

只有马赛克出现的时候你才能撸！正常女人的身体可不是为你这种傻逼准备的倒计时越往后数视频越糊，射出来的时候的画面只剩下一大团马赛克，什么也看不见... 被折磨训练的精神失常，爱上对马赛克打飞机的感觉，越傻逼结果射的还越多，彻底废了完整版：

你看你妈呢？纯纯大傻逼来看马赛克

28,393 次观看 • 5 个月前

今天发的东西，和之前不太一样，今天发的东西，非常有趣，非常试验性。我和几个小伙伴都是 Vibe Coding 的狂热爱好者，有一天，我们想如果你可以实时和 Codex 对话，那可不就可以在开车的时候也 Vibe Coding 了？所以我们做了这个 Realtime 的 Codex —— Hey Codex 通过这个 App，你可以直接与 Codex 对话，他也会给你实时回复，告诉你他正在做什么。下面是一些 Demo 视频

今天发的东西，和之前不太一样，今天发的东西，非常有趣，非常试验性。我和几个小伙伴都是 Vibe Coding 的狂热爱好者，有一天，我们想如果你可以实时和 Codex 对话，那可不就可以在开车的时候也 Vibe Coding 了？所以我们做了这个 Realtime 的 Codex —— Hey Codex 通过这个 App，你可以直接与 Codex 对话，他也会给你实时回复，告诉你他正在做什么。下面是一些 Demo 视频

Hwang

47,460 次观看 • 1 个月前

录了一期视频，讲了一下我平时是如何使用ai的关注我的都知道，这一个月我确实不在存储的主线上，但我用ai选到了flnc100%，fcel60%等涨幅很高的股票。 1）有条件的开一个gpt会员，根据自己的用量和使用ai得到的正反馈，开20刀一个月或者更高的会员。 2）日常使用可以普通对话，如果想研究一些东西，抓一些股票，要用高阶模型和深度研究。 3）让ai给你写提示词，你再用提示词去让他输出内容，不同的提示词和不同的模型，思考的深度和输出的内容完全不一样。 4）训练自己的好奇心和金融直觉，看到一个新闻不只是看看而已，立马去问ai这条新闻啥意思，是否真实，从第一性原理上有什么操作或者投资机会。

录了一期视频，讲了一下我平时是如何使用ai的关注我的都知道，这一个月我确实不在存储的主线上，但我用ai选到了flnc100%，fcel60%等涨幅很高的股票。 1）有条件的开一个gpt会员，根据自己的用量和使用ai得到的正反馈，开20刀一个月或者更高的会员。 2）日常使用可以普通对话，如果想研究一些东西，抓一些股票，要用高阶模型和深度研究。 3）让ai给你写提示词，你再用提示词去让他输出内容，不同的提示词和不同的模型，思考的深度和输出的内容完全不一样。 4）训练自己的好奇心和金融直觉，看到一个新闻不只是看看而已，立马去问ai这条新闻啥意思，是否真实，从第一性原理上有什么操作或者投资机会。

华尔街没有名字

121,918 次观看 • 1 个月前