Загрузка видео...

Не удалось загрузить видео

Возникла проблема при загрузке этого видео. Это может быть связано с временными проблемами сети или видео может быть недоступно.

На главную

Manus 推出AI聊天模式完全免费不限量只要你不是用Agent模型，那么就可以白嫖通过聊天获得答案后，可以直接切换到Agent模式继续任务，避免浪费积分。似乎背后模型是Gemini，我问它，它回答是：“我是一个大语言模型，由 Google 训练” 具体是哪个型号不清楚

小互

70,797 subscribers

33,369 просмотров • 1 год назад •via X (Twitter)

Искусство Наука и технологии Образование

Anya Rossi• Live Now

Private livecam show

Комментарии: 4

Фото профиля 小互

小互1 год назад

官方显示是：对所有人免费无限制直接白嫖

Фото профиля 小互

小互1 год назад

记得切换模式啊

Фото профиля SteveMoore

SteveMoore1 год назад

gemini不适合细节，搞大框架很好。改代码还是claude适合一些

Фото профиля ray

ray1 год назад

我直接用gemini不香吗哈哈

Похожие видео

CAD大模型来啦！还记得 cursor 创业的时候说自己其实是搞 CAD 大模型的嘛？但是他们遇到的问题是全网 CAD 数据太少了，炼不出来好的模型。今天这个模型作者遇到了同样的问题，他使用了 OpenSCAD 数据集，但是质量太差，于是花了150刀使用AI辅助生成/修复数据，然后觉得太贵了，又用 Gemma3-12b 洗了2天，最后使用 Gemma3-1B 进行微调，得到了这个 CAD 大模型——k-1b 这个模型你只需输入想要什么，它就能生成 stl 格式的 3D模型，然后作者还写了个工具能转换为 OBJ 模型以及在 terminal 预览模型生成的怎么样模型地址：引擎地址：/github.com/ThomasVuNguyen/MakeMe

CAD大模型来啦！还记得 cursor 创业的时候说自己其实是搞 CAD 大模型的嘛？但是他们遇到的问题是全网 CAD 数据太少了，炼不出来好的模型。今天这个模型作者遇到了同样的问题，他使用了 OpenSCAD 数据集，但是质量太差，于是花了150刀使用AI辅助生成/修复数据，然后觉得太贵了，又用 Gemma3-12b 洗了2天，最后使用 Gemma3-1B 进行微调，得到了这个 CAD 大模型——k-1b 这个模型你只需输入想要什么，它就能生成 stl 格式的 3D模型，然后作者还写了个工具能转换为 OBJ 模型以及在 terminal 预览模型生成的怎么样模型地址：引擎地址：/github.com/ThomasVuNguyen/MakeMe

karminski-牙医

28,604 просмотров • 8 месяцев назад

Google的教学视频《Introduction to Large Language Models | 大语言模型介绍》（中英双语字幕）这个视频介绍了大型语言模型（Large Language Models，LLMs）的概念、使用场景、提示调整以及Google的Gen AI开发工具。大型语言模型是深度学习的一个子集，可以预训练并进行特定目的的微调。这些模型经过训练，可以解决诸如文本分类、问题回答、文档摘要、跨行业的文本生成等常见语言问题。然后，可以利用相对较小的领域数据集对这些模型进行定制，以解决零售、金融、娱乐等不同领域的特定问题。大型语言模型的三个主要特征是：大型、通用性和预训练微调。"大型"既指训练数据集的巨大规模，也指参数的数量。"通用性"意味着这些模型足够解决常见问题。"预训练和微调"是指用大型数据集对大型语言模型进行一般性的预训练，然后用较小的数据集对其进行特定目的的微调。使用大型语言模型的好处包括：一种模型可用于不同的任务；微调大型语言模型需要的领域训练数据较少；随着数据和参数的增加，大型语言模型的性能也在持续增长。此外，视频还解释了传统编程、神经网络和生成模型的不同，以及预训练模型的LLM开发与传统的ML开发的区别。在自然语言处理中，提示设计和提示工程是两个密切相关的概念，这两者都涉及创建清晰、简洁、富有信息的提示。视频中还提到了三种类型的大型语言模型：通用语言模型、指令调整模型和对话调整模型。每种模型都需要以不同的方式进行提示。原始视频链接：

Google的教学视频《Introduction to Large Language Models | 大语言模型介绍》（中英双语字幕）这个视频介绍了大型语言模型（Large Language Models，LLMs）的概念、使用场景、提示调整以及Google的Gen AI开发工具。大型语言模型是深度学习的一个子集，可以预训练并进行特定目的的微调。这些模型经过训练，可以解决诸如文本分类、问题回答、文档摘要、跨行业的文本生成等常见语言问题。然后，可以利用相对较小的领域数据集对这些模型进行定制，以解决零售、金融、娱乐等不同领域的特定问题。大型语言模型的三个主要特征是：大型、通用性和预训练微调。"大型"既指训练数据集的巨大规模，也指参数的数量。"通用性"意味着这些模型足够解决常见问题。"预训练和微调"是指用大型数据集对大型语言模型进行一般性的预训练，然后用较小的数据集对其进行特定目的的微调。使用大型语言模型的好处包括：一种模型可用于不同的任务；微调大型语言模型需要的领域训练数据较少；随着数据和参数的增加，大型语言模型的性能也在持续增长。此外，视频还解释了传统编程、神经网络和生成模型的不同，以及预训练模型的LLM开发与传统的ML开发的区别。在自然语言处理中，提示设计和提示工程是两个密切相关的概念，这两者都涉及创建清晰、简洁、富有信息的提示。视频中还提到了三种类型的大型语言模型：通用语言模型、指令调整模型和对话调整模型。每种模型都需要以不同的方式进行提示。原始视频链接：

宝玉

114,603 просмотров • 3 лет назад

大多数人以为 prompting 只是把句子写得更好 Anthropic 这个 32 分钟 workshop 讲的是另一件事：为什么这完全不够它拆的不是 prompt hacks 不是“act as” 也不是又一个 $300 的课程而是 production 里的 prompt 到底怎么搭 Evals Edge cases Model migration Agent loops 一个好的 prompt，不是一句话而是一套模型可以理解、执行、测试、再改进的 workflow 这点很重要因为不管后面是新的 Claude Opus，还是新的 Sonnet，真正有效的规则大概率还是这些： - 让模型知道目标 - 让模型知道边界 - 让模型知道怎么检查自己 - 让模型知道遇到 edge case 时该怎么处理所以很多时候，AI 给出的坏答案，不一定是模型差也可能只是 setup 太差这个 prompting playbook，建议在下次怪 AI 之前先看完

大多数人以为 prompting 只是把句子写得更好 Anthropic 这个 32 分钟 workshop 讲的是另一件事：为什么这完全不够它拆的不是 prompt hacks 不是“act as” 也不是又一个 $300 的课程而是 production 里的 prompt 到底怎么搭 Evals Edge cases Model migration Agent loops 一个好的 prompt，不是一句话而是一套模型可以理解、执行、测试、再改进的 workflow 这点很重要因为不管后面是新的 Claude Opus，还是新的 Sonnet，真正有效的规则大概率还是这些： - 让模型知道目标 - 让模型知道边界 - 让模型知道怎么检查自己 - 让模型知道遇到 edge case 时该怎么处理所以很多时候，AI 给出的坏答案，不一定是模型差也可能只是 setup 太差这个 prompting playbook，建议在下次怪 AI 之前先看完

0x_Miko

15,628 просмотров • 24 дней назад

Kyutai 又推出了一个新的语音模型： Unmute 这是一个高度模块化的语音 AI 系统，可以为任何文本大语言模型快速添加语音功能。也就是它可以插入到任意的模型当中，让该模型具有语音能力。 -它能够很智能判断你是否说完一句话，然后再接茬 -你也可以随时打断它 -基于 10 秒语音样本即可定制声音 -能实现“文本流式”合成，支持在文本尚未完全生成时开始说话，进一步降低响应延迟。

Kyutai 又推出了一个新的语音模型： Unmute 这是一个高度模块化的语音 AI 系统，可以为任何文本大语言模型快速添加语音功能。也就是它可以插入到任意的模型当中，让该模型具有语音能力。 -它能够很智能判断你是否说完一句话，然后再接茬 -你也可以随时打断它 -基于 10 秒语音样本即可定制声音 -能实现“文本流式”合成，支持在文本尚未完全生成时开始说话，进一步降低响应延迟。

小互

37,051 просмотров • 1 год назад

【Manus季逸超：六个月后，基本每一家头部的应用公司都有做模型的能力】最近看了Manus联合创始人季逸超的访谈，很多人诟病 Manus 早期没有自己的模型、只是个套壳，但看完视频就会发现，Manus的逻辑是有道理的。一般的思维模式是先练模型（鸡），再顺便出个产品（蛋），这叫“沿途下蛋”。但这种方式是以模型为中心的，它的风险在于，蛋的形状取决于鸡能生出什么。模型能做到哪，产品才能做到哪，产品只能迁就技术。 Manus的路子是以产品为中心“借鸡生蛋”：早期直接用现成的模型。别管鸡是谁的，先让产品跑起来，看用户愿不愿意买单，找到PMF。等产品逻辑通了、用户量大了，发现现有的模型太贵、太慢、或者不够适配，再反过来去倒逼技术，优化出一种特定的模型。以Cursor为例，它一开始就是个代码编辑器，接入的是别人的接口。但等到它成为程序员的刚需后，为了追求极致的速度和更准的代码逻辑，它才跳出来做了自研模型。说到底是应用先于模型，需求定义底座。

【Manus季逸超：六个月后，基本每一家头部的应用公司都有做模型的能力】最近看了Manus联合创始人季逸超的访谈，很多人诟病 Manus 早期没有自己的模型、只是个套壳，但看完视频就会发现，Manus的逻辑是有道理的。一般的思维模式是先练模型（鸡），再顺便出个产品（蛋），这叫“沿途下蛋”。但这种方式是以模型为中心的，它的风险在于，蛋的形状取决于鸡能生出什么。模型能做到哪，产品才能做到哪，产品只能迁就技术。 Manus的路子是以产品为中心“借鸡生蛋”：早期直接用现成的模型。别管鸡是谁的，先让产品跑起来，看用户愿不愿意买单，找到PMF。等产品逻辑通了、用户量大了，发现现有的模型太贵、太慢、或者不够适配，再反过来去倒逼技术，优化出一种特定的模型。以Cursor为例，它一开始就是个代码编辑器，接入的是别人的接口。但等到它成为程序员的刚需后，为了追求极致的速度和更准的代码逻辑，它才跳出来做了自研模型。说到底是应用先于模型，需求定义底座。

傅盛

89,082 просмотров • 5 месяцев назад

有好多同学问我想搞 AI Agent，但是不知道怎样选模型。这次给大家来一个自动评测大模型的框架 YourBench 这个框架允许你上传你需要的材料（比如病例），然后生成测试集，来测试你需要选取的大模型，看哪个大模型最适合你的场景。全程自动化完成。我给大家录制的这是网页demo，可以上传PDF或者其他格式的文本文件，然后生成评测题目，这些评测题目都是问答题，比如我直接塞了一本哈利波特与魔法石。它生成的测试题有一个是，守护魔法石的魔法中，有哪个施法者与哈利有个人关系。答案是海格。因为三头犬是海格布置的。可以看到它生成完毕测试集后，然后框架还可以进行自动测试。最后测试完毕，得到结果是前五个模型都回答得不错。感兴趣的同学可以关注下地址：

有好多同学问我想搞 AI Agent，但是不知道怎样选模型。这次给大家来一个自动评测大模型的框架 YourBench 这个框架允许你上传你需要的材料（比如病例），然后生成测试集，来测试你需要选取的大模型，看哪个大模型最适合你的场景。全程自动化完成。我给大家录制的这是网页demo，可以上传PDF或者其他格式的文本文件，然后生成评测题目，这些评测题目都是问答题，比如我直接塞了一本哈利波特与魔法石。它生成的测试题有一个是，守护魔法石的魔法中，有哪个施法者与哈利有个人关系。答案是海格。因为三头犬是海格布置的。可以看到它生成完毕测试集后，然后框架还可以进行自动测试。最后测试完毕，得到结果是前五个模型都回答得不错。感兴趣的同学可以关注下地址：

karminski-牙医

23,579 просмотров • 1 год назад

开源分解图层大模型这么快就来了? 给大家带来阿里刚刚发布的 Qwen-Image-Layered 模型实测, 这是一个可以把图片分成不同图层的大模型, 模型是基于 Qwen-Image 微调的. 本次我的测试覆盖这个模型的擅长场景(海报), 指令遵循测试(指定抽取目标), 边缘处理(头发), 极限测试(全是贴纸, 一个贴纸一个图层的话可以抽取50多个图层). 直接说结论, 首先还是模型太大了, 因为这个模型基于 Qwen-Image 所以是个20B的模型, 我是用HuggingFace Zero GPU 测试, 每次运行大概2分钟左右, 模型的确可以做到分离图层, 而且边缘处理很不错, 不过稳定性有待优化, 在我测试中4个图层可以输出, 但是8个或者10个图层就炸了, 怀疑可能是超过了Zero GPU超时或者bug (GPU是H200, 不太可能爆显存), 输出尺寸只有 544*736, 官方也推荐640分辨力, 这点也需要提升, 以及模型还是太大了, 20B, 希望能优化下尺寸.

开源分解图层大模型这么快就来了? 给大家带来阿里刚刚发布的 Qwen-Image-Layered 模型实测, 这是一个可以把图片分成不同图层的大模型, 模型是基于 Qwen-Image 微调的. 本次我的测试覆盖这个模型的擅长场景(海报), 指令遵循测试(指定抽取目标), 边缘处理(头发), 极限测试(全是贴纸, 一个贴纸一个图层的话可以抽取50多个图层). 直接说结论, 首先还是模型太大了, 因为这个模型基于 Qwen-Image 所以是个20B的模型, 我是用HuggingFace Zero GPU 测试, 每次运行大概2分钟左右, 模型的确可以做到分离图层, 而且边缘处理很不错, 不过稳定性有待优化, 在我测试中4个图层可以输出, 但是8个或者10个图层就炸了, 怀疑可能是超过了Zero GPU超时或者bug (GPU是H200, 不太可能爆显存), 输出尺寸只有 544*736, 官方也推荐640分辨力, 这点也需要提升, 以及模型还是太大了, 20B, 希望能优化下尺寸.

karminski-牙医

14,175 просмотров • 6 месяцев назад

大语言模型（LLM）到瓶颈了，但是AI的发展还会继续，我估计，下一个大厂会去卷的东西是世界模型。什么是世界模型？世界模型有什么用？为什么世界模型会比LLM有更大的价值？详情请见视频。

大语言模型（LLM）到瓶颈了，但是AI的发展还会继续，我估计，下一个大厂会去卷的东西是世界模型。什么是世界模型？世界模型有什么用？为什么世界模型会比LLM有更大的价值？详情请见视频。

Ben X

18,065 просмотров • 1 год назад

千问新模型Qwen 3.6 Plus这周末免费，直接冲上Openrouter榜首，官方说是中国最强编程大模型。我刚玩了一下，第一感觉是不花钱可真爽。推荐大家用Starchild试试，不花一分钱体会AI agent带来的快乐

千问新模型Qwen 3.6 Plus这周末免费，直接冲上Openrouter榜首，官方说是中国最强编程大模型。我刚玩了一下，第一感觉是不花钱可真爽。推荐大家用Starchild试试，不花一分钱体会AI agent带来的快乐

Jingyuan缘缘

69,042 просмотров • 2 месяцев назад

AI会永远对你撒谎。这不是bug，是数学定律。我，卡内基梅隆大学的数学学生，用数学告诉你为什么。所有语言模型，只做一件事：根据它读过的所有资料，预测下一个最有可能的词。但这里有个死结。模型的猜测，我们叫它q(x)。真实世界的概率，我们叫它p(x)。 q(x)永远不可能等于p(x)。它们之间，永远有一道鸿沟。有个数学公式，就是用来测量这道鸿沟的。只要模型不能完美预测下一个词它永远不能那这个鸿沟就永远不会是零。所以，当AI不知道真相的时候会发生什么？它不能停机，它必须给你一个答案。它只能硬着头皮，输出一个它认为“最像”答案的答案。哪怕那是错的。这就是“幻觉”。一个基于不完整信息，却无比自信的猜测。最要命的是，数学甚至给出了一个下限。就算最完美的模型，它的幻觉率也永远不可能低于这个数字。只要它不知道关于这个世界的一切它永远不可能知道。它就总会有概率，编造事实。所以，无论AI变得多强大，它都会撒谎。因为数学就是这么写的。

AI会永远对你撒谎。这不是bug，是数学定律。我，卡内基梅隆大学的数学学生，用数学告诉你为什么。所有语言模型，只做一件事：根据它读过的所有资料，预测下一个最有可能的词。但这里有个死结。模型的猜测，我们叫它q(x)。真实世界的概率，我们叫它p(x)。 q(x)永远不可能等于p(x)。它们之间，永远有一道鸿沟。有个数学公式，就是用来测量这道鸿沟的。只要模型不能完美预测下一个词它永远不能那这个鸿沟就永远不会是零。所以，当AI不知道真相的时候会发生什么？它不能停机，它必须给你一个答案。它只能硬着头皮，输出一个它认为“最像”答案的答案。哪怕那是错的。这就是“幻觉”。一个基于不完整信息，却无比自信的猜测。最要命的是，数学甚至给出了一个下限。就算最完美的模型，它的幻觉率也永远不可能低于这个数字。只要它不知道关于这个世界的一切它永远不可能知道。它就总会有概率，编造事实。所以，无论AI变得多强大，它都会撒谎。因为数学就是这么写的。

墓碑科技

73,491 просмотров • 5 месяцев назад

大模型里说的“Token”到底是什么？ 5 分钟给小白朋友讲清楚什么是token👍可是后来怎么聊到了车模的🤔

大模型里说的“Token”到底是什么？ 5 分钟给小白朋友讲清楚什么是token👍可是后来怎么聊到了车模的🤔

SimbaLee

118,607 просмотров • 1 год назад

很多人说养龙虾费Token烧钱，我从一天200美金降到了10美金，靠的就是这3招，大家可以试试： 1.善用命令行：/new /restart /stop /compress，斜杠命令不过大模型。 2.能用脚本的别用大模型：重复任务先让它写成代码，代码跑起来只烧CPU，不用Token。 3.不同任务用不同模型：顶级模型干顶级活，简单任务让国产模型上，混用下来省一大截。

很多人说养龙虾费Token烧钱，我从一天200美金降到了10美金，靠的就是这3招，大家可以试试： 1.善用命令行：/new /restart /stop /compress，斜杠命令不过大模型。 2.能用脚本的别用大模型：重复任务先让它写成代码，代码跑起来只烧CPU，不用Token。 3.不同任务用不同模型：顶级模型干顶级活，简单任务让国产模型上，混用下来省一大截。

傅盛

94,499 просмотров • 3 месяцев назад

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型，他们叫交互模型。这个模型能够持续接收音频、视频、文本等原生的多模态内容，并且实时进行思考、响应和行动。它不像之前那种 Agent 脚手架，把多个模型、多个模态的模型通过 Agent 串起来，而是所有模态都在一整个模型里。这样就可以让用户和 AI 在任意模态下实时进行交互：你可以随时打断它，随时进行补充，AI 会实时关注你的状态，输出结果，不会像之前一样，必须等一句话结束了才能跟模型交互。核心思路就是把交互部分训练到了模型里。他们从零训练的这个交互模型主要包括两部分：前台交互模型： (a) 一直在线，一直在听、看和读用户提供的内容 (b) 每 200 毫秒作为一个节点，同时处理输入并产出一小段输出 (c) 负责照顾用户的在场感，支持用户打断、插话，并能对屏幕和视频内容做出反应后台推理模型： (a) 用来处理需要持续推理、工具调用以及长上下文、长规划的任务 (b) 交互模型会在合适的时候，将推理模型的结果放回到对话里，不会插入突兀的内容用户最终看到的结果，就是一个既能实时交互，又能够处理重度任务的界面。

歸藏(guizang.ai)

46,883 просмотров • 1 месяц назад

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

karminski-牙医

11,665 просмотров • 1 месяц назад

Danswer：开源AI企业问答工具支持GPT-4等多种大型模型 👉 集成了直接问答和生成式AI模型支持的聊天允许用户针对内部文档提出自然语言问题并获得由源材料中的引用和参考文献支持的可靠答案支持连接到Slack、GitHub、Confluence 等

Danswer：开源AI企业问答工具支持GPT-4等多种大型模型 👉 集成了直接问答和生成式AI模型支持的聊天允许用户针对内部文档提出自然语言问题并获得由源材料中的引用和参考文献支持的可靠答案支持连接到Slack、GitHub、Confluence 等

ahhhhfs

47,198 просмотров • 2 лет назад

OpenAI 的大神 Andrej Karpathy 前几天在他的 YouTube 频道讲了一堂课，系统的介绍了大语言模型，内容深入浅出，非常赞，抽空将它翻译成了双语，由于内容较长，我将分批上传，以下是第一部分精校后的双语视频，字幕文稿如下： Intro: Large Language Model (LLM) talk 大家好。最近，我进行了一场关于大语言模型的 30 分钟入门讲座。遗憾的是，这次讲座没有被录制下来，但许多人在讲座后找到我，他们告诉我非常喜欢那次讲座。因此，我决定重新录制并上传到 YouTube，那么，让我们开始吧，为大家带来“忙碌人士的大语言模型入门”系列，主讲人 Scott。好的，那我们开始吧。 LLM Inference 首先，什么是大语言模型 (Large Language Model) 呢？其实，一个大语言模型就是由两个文件组成的。在这个假设的目录中会有两个文件。以 Llama 2 70B 模型为例，这是一个由 Meta AI 发布的大语言模型。这是 Llama 系列语言模型的第二代，也是该系列中参数最多的模型，达到了 700 亿。LAMA2 系列包括了多个不同规模的模型，70 亿，130 亿，340 亿，700 亿是最大的一个。现在很多人喜欢这个模型，因为它可能是目前公开权重最强大的模型。Meta 发布了这款模型的权重、架构和相关论文，所以任何人都可以很轻松地使用这个模型。这与其他一些你可能熟悉的语言模型不同，例如，如果你正在使用 ChatGPT 或类似的东西，其架构并未公开，是 OpenAI 的产权，你只能通过网页界面使用，但你实际上没有访问那个模型的权限。在这种情况下，Llama 2 70B 模型实际上就是你电脑上的两个文件：一个是存储参数的文件，另一个是运行这些参数的代码。这些参数是神经网络（即语言模型）的权重或参数。我们稍后会详细解释。因为这是一个拥有 700 亿参数的模型，每个参数占用两个字节，因此参数文件的大小为 140 GB，之所以是两个字节，是因为这是 float 16 类型的数据。除了这些参数，还有一大堆神经网络的参数。你还需要一些能运行神经网络的代码，这些代码被包含在我们所说的运行文件中。这个运行文件可以是 C 语言或 Python，或任何其他编程语言编写的。它可以用任何语言编写，但 C 语言是一种非常简单的语言，只是举个例子。只需大约 500 行 C 语言代码，无需任何其他依赖，就能构建起神经网络架构，并且主要依靠一些参数来运行模型。所以只需要这两个文件。你只需带上这两个文件和你的 MacBook，就拥有了一个完整的工具包。你不需要连接互联网或其他任何设备。你可以拿着这两个文件，编译你的 C 语言代码。你将得到一个可针对参数运行并与语言模型交互的二进制文件。比如，你可以让它写一首关于 Scale AI 公司的诗，语言模型就会开始生成文本。在这种情况下，它会按照指示为你创作一首关于 Scale AI 的诗。之所以选用 Scale AI 作为例子，你会在整个演讲中看到，是因为我最初在 Scale AI 举办的活动上介绍过这个话题，所以演讲中会多次提到它，以便内容更具体。这就是我们如何运行模型的方式。只需要两个文件和一台 MacBook。我在这里稍微有点作弊，因为这并不是在运行一个有 700 亿参数的模型，而是在运行一个有 70 亿参数的模型。一个有 700 亿参数的模型运行速度大约会慢 10 倍。但我想给你们展示一下文本生成的过程，让你们了解它是什么样子。所以运行模型并不需要很多东西。这是一个非常小的程序包，但是当我们需要获取那些参数时，计算的复杂性就真正显现出来了。那么，这些参数从何而来，我们如何获得它们？因为无论 run.c 文件中的内容是什么，神经网络的架构和前向传播都是算法上明确且公开的。

OpenAI 的大神 Andrej Karpathy 前几天在他的 YouTube 频道讲了一堂课，系统的介绍了大语言模型，内容深入浅出，非常赞，抽空将它翻译成了双语，由于内容较长，我将分批上传，以下是第一部分精校后的双语视频，字幕文稿如下： Intro: Large Language Model (LLM) talk 大家好。最近，我进行了一场关于大语言模型的 30 分钟入门讲座。遗憾的是，这次讲座没有被录制下来，但许多人在讲座后找到我，他们告诉我非常喜欢那次讲座。因此，我决定重新录制并上传到 YouTube，那么，让我们开始吧，为大家带来“忙碌人士的大语言模型入门”系列，主讲人 Scott。好的，那我们开始吧。 LLM Inference 首先，什么是大语言模型 (Large Language Model) 呢？其实，一个大语言模型就是由两个文件组成的。在这个假设的目录中会有两个文件。以 Llama 2 70B 模型为例，这是一个由 Meta AI 发布的大语言模型。这是 Llama 系列语言模型的第二代，也是该系列中参数最多的模型，达到了 700 亿。LAMA2 系列包括了多个不同规模的模型，70 亿，130 亿，340 亿，700 亿是最大的一个。现在很多人喜欢这个模型，因为它可能是目前公开权重最强大的模型。Meta 发布了这款模型的权重、架构和相关论文，所以任何人都可以很轻松地使用这个模型。这与其他一些你可能熟悉的语言模型不同，例如，如果你正在使用 ChatGPT 或类似的东西，其架构并未公开，是 OpenAI 的产权，你只能通过网页界面使用，但你实际上没有访问那个模型的权限。在这种情况下，Llama 2 70B 模型实际上就是你电脑上的两个文件：一个是存储参数的文件，另一个是运行这些参数的代码。这些参数是神经网络（即语言模型）的权重或参数。我们稍后会详细解释。因为这是一个拥有 700 亿参数的模型，每个参数占用两个字节，因此参数文件的大小为 140 GB，之所以是两个字节，是因为这是 float 16 类型的数据。除了这些参数，还有一大堆神经网络的参数。你还需要一些能运行神经网络的代码，这些代码被包含在我们所说的运行文件中。这个运行文件可以是 C 语言或 Python，或任何其他编程语言编写的。它可以用任何语言编写，但 C 语言是一种非常简单的语言，只是举个例子。只需大约 500 行 C 语言代码，无需任何其他依赖，就能构建起神经网络架构，并且主要依靠一些参数来运行模型。所以只需要这两个文件。你只需带上这两个文件和你的 MacBook，就拥有了一个完整的工具包。你不需要连接互联网或其他任何设备。你可以拿着这两个文件，编译你的 C 语言代码。你将得到一个可针对参数运行并与语言模型交互的二进制文件。比如，你可以让它写一首关于 Scale AI 公司的诗，语言模型就会开始生成文本。在这种情况下，它会按照指示为你创作一首关于 Scale AI 的诗。之所以选用 Scale AI 作为例子，你会在整个演讲中看到，是因为我最初在 Scale AI 举办的活动上介绍过这个话题，所以演讲中会多次提到它，以便内容更具体。这就是我们如何运行模型的方式。只需要两个文件和一台 MacBook。我在这里稍微有点作弊，因为这并不是在运行一个有 700 亿参数的模型，而是在运行一个有 70 亿参数的模型。一个有 700 亿参数的模型运行速度大约会慢 10 倍。但我想给你们展示一下文本生成的过程，让你们了解它是什么样子。所以运行模型并不需要很多东西。这是一个非常小的程序包，但是当我们需要获取那些参数时，计算的复杂性就真正显现出来了。那么，这些参数从何而来，我们如何获得它们？因为无论 run.c 文件中的内容是什么，神经网络的架构和前向传播都是算法上明确且公开的。

宝玉

1,122,128 просмотров • 2 лет назад

OpenRouter：大语言模型“路由器” Openrouter提供了一个统一的接口，通过这个接口，你可以直接访问和使用几十种AI模型你可以使用这个接口对各种模型进行测试和比价，选择最适合自己的，避免了东奔西跑 🙂 目前已经支持包括GPT、LLama 、Claude、Command-R等80 多个模型，未来将扩展到数百种！访问：

OpenRouter：大语言模型“路由器” Openrouter提供了一个统一的接口，通过这个接口，你可以直接访问和使用几十种AI模型你可以使用这个接口对各种模型进行测试和比价，选择最适合自己的，避免了东奔西跑 🙂 目前已经支持包括GPT、LLama 、Claude、Command-R等80 多个模型，未来将扩展到数百种！访问：

小互

45,800 просмотров • 2 лет назад

好像很多人不知道 OpenCode，简单介绍一下。 OpenCode 是基于 MIT 协议完全开源 100% 免费的 AI 编程智能体。无任何 LLM 厂商绑定，可以连接国内、外、和本地模型，还提供了免费模型可试用。任何费用只来自模型订阅。它是全托管的 Vibe Coding 编程范式，对标工具是 Claude Code。支持 CLI版本、桌面版本、插件版本。非常适合国内玩家体验 Vibe Coding。

好像很多人不知道 OpenCode，简单介绍一下。 OpenCode 是基于 MIT 协议完全开源 100% 免费的 AI 编程智能体。无任何 LLM 厂商绑定，可以连接国内、外、和本地模型，还提供了免费模型可试用。任何费用只来自模型订阅。它是全托管的 Vibe Coding 编程范式，对标工具是 Claude Code。支持 CLI版本、桌面版本、插件版本。非常适合国内玩家体验 Vibe Coding。

程序员老熊

53,065 просмотров • 3 месяцев назад

✨ 发布 Devv Agent Devv Agent 可以提供更准确、更详细的回答，它会理解你的需求，并分解任务，最终输出一个详尽的答案。 Devv Agent 底层基于的是 Multi-agent 的架构，根据不同的需求场景，会采用不同的 Agent 和语言模型。 👇

✨ 发布 Devv Agent Devv Agent 可以提供更准确、更详细的回答，它会理解你的需求，并分解任务，最终输出一个详尽的答案。 Devv Agent 底层基于的是 Multi-agent 的架构，根据不同的需求场景，会采用不同的 Agent 和语言模型。 👇

Jiayuan (JY) Zhang

144,340 просмотров • 2 лет назад

前端设计这一块谷歌是真没问题！我用Gemini 3.5 Flash做了个3D飞机模型展览，太帅了呀！制作方法： 1.GPT2-image生生成正视图、背视图、左视图和右视图 2.3D模型生成，注意需要用纹理 3.UI预览图生成，调用Codex内置GPT2-image即可 4.用Gemini 3.5 Flash生成网站生成网站这一步在Google AI Studio上传不了3D模型的glb文件，所以就必须要调API在本地做个网站了。我是在Zenmux调用的，大家应该对Zenmux也不陌生，就是那个一有新模型就免费给大家玩的网站。它提供一个KEY调用所有顶级大模型的功能，不仅可以用Gemini 3.5 Flash绘制前端，如果有小BUG，还可以再切换到GPT5.5或Oplu4.7进行修复，使用非常丝滑！想先免费试一试下 Gemini 3.5 Flash的能力？壕气冲天的Zenmux现在直接免费送一周TOKEN（有限额）！传送门直达：

前端设计这一块谷歌是真没问题！我用Gemini 3.5 Flash做了个3D飞机模型展览，太帅了呀！制作方法： 1.GPT2-image生生成正视图、背视图、左视图和右视图 2.3D模型生成，注意需要用纹理 3.UI预览图生成，调用Codex内置GPT2-image即可 4.用Gemini 3.5 Flash生成网站生成网站这一步在Google AI Studio上传不了3D模型的glb文件，所以就必须要调API在本地做个网站了。我是在Zenmux调用的，大家应该对Zenmux也不陌生，就是那个一有新模型就免费给大家玩的网站。它提供一个KEY调用所有顶级大模型的功能，不仅可以用Gemini 3.5 Flash绘制前端，如果有小BUG，还可以再切换到GPT5.5或Oplu4.7进行修复，使用非常丝滑！想先免费试一试下 Gemini 3.5 Flash的能力？壕气冲天的Zenmux现在直接免费送一周TOKEN（有限额）！传送门直达：

逸尘

41,937 просмотров • 1 месяц назад