Video wird geladen...

Video konnte nicht geladen werden

Zur Startseite

OpenAI 全新“Deep Research”重磅发布:让 ChatGPT 帮你完成多步骤深度研究 在这个信息爆炸的时代,如何用最短的时间获取最精准、最详实的信息,一直是许多知识工作者面临的难题。如今,OpenAI 带来了全新的 Deep Research 功能,让你的 ChatGPT 化身为一位“研究助理”,能够独立查找、分析并综合海量网络信息,为你提供专业且有完整参考的研究报告。下面,让我们来一起了解这项强大的新功能吧! Deep Research 能做什么? 1. 多步骤研究 相比传统的聊天式问答,Deep Research 具备强大的自主研究能力。它能够从互联网上寻找并分析数百个来源,根据实时获取的信息进行动态调整和推理。短短几十分钟内,它能完成人工需要数小时才能完成的研究工作。 2. 自动化汇总海量信息 你只需要输入研究需求,ChatGPT(在 Deep Research 模式下)就会自动去浏览海量网页、PDF、图片等信息资源,并将它们整合成一份清晰、有理有据的分析报告,犹如一位具有专业分析能力的研究员。 3. 详尽引用与文献记录 Deep Research 每一个输出都附有引用来源,并在侧边栏展示搜索、分析过程,方便你查看、验证信息。同时也提供思路概述,保证研究过程的透明度与可追溯性。 4. 个性化、多场景适用 无论你是做金融、科学、政策、工程等领域的深度研究,还是想为购物(例如汽车、家电或家具等大件商品)做细致比对,Deep Research 都能胜任。它还擅长挖掘各类小众且不直观的信息,只需一次查询,就能节省你大量的时间和精力。 为什么它如此重要? 1. 效率大幅提升 普通用户在网络上搜集信息可能需要自己筛选资料、反复验证。Deep Research 通过自动化的搜寻和分析,大幅缩短研究时间,让你把更多精力放在思考与决策上。 2. 减少重复劳动 Deep Research 擅长处理那些需要浏览无数个网页、文件的繁琐任务。比如撰写报告、整理数据、查找论文资料、对比不同产品参数等。以前这些工作往往让人头疼,现在只需一次提问,就能得到系统、条理化的研究成果。 3. 助力专业领域...

67,470 Aufrufe • vor 1 Jahr •via X (Twitter)

9 Kommentare

Profilbild von Lee
Leevor 1 Jahr

有十个账号基本就够用了。

Profilbild von Wonderchat
Wonderchatvor 2 Jahren

Automate up to 70% of your customer support today. Save time and help your users find answers quickly. Try now at

Profilbild von Valerie Vaughan
Valerie Vaughanvor 1 Jahr

期待宝玉老师给我们带来体验报告😋

Profilbild von 宝玉
宝玉vor 1 Jahr

还用不了,而且还没想好用来干嘛,有啥建议吗?

Profilbild von 金融汪
金融汪vor 1 Jahr

这个和多模态的NotebookLM有什么区别和优劣呢?需要试试看了…,

Profilbild von 宝玉
宝玉vor 1 Jahr

异步的,相当于个小助理帮你找资料

Profilbild von 织言知行
织言知行vor 1 Jahr

看看会不会被免费的干翻

Profilbild von Jaeson Mah
Jaeson Mahvor 1 Jahr

好期待

Profilbild von YANG
YANGvor 1 Jahr

果然还是要给足竞争压力才会快速进步啊! 可惜不是pro用户,期待plus用户能用的时候试试。

Ähnliche Videos

“芒格100模型”研究 X google deep research with gemini 2.5 pro:9分钟,62个英文参考资料(实际访问了数百个网站),输出2万多字中文报告,100模型实际解读13个,任务完成率13%(这不是偶然,下文详解)🤣 一句话结论:单单从”研究芒格100模型“任务看,google deep research得分不超过30(满分100)。 prompt(和openai案例完全一致): > 大航海时代,海盗中间流传着一个传说:海贼王在大海深处埋藏着它的宝藏,找到它的海盗将获得力量、荣耀与权力。互联网上也有一个传说,charlie munger 有 100 个思维模型,掌握这 100 个思维模型的人将拥有大智慧,成为真正的聪明人。 > > 请帮我做一份研究,关于“查理芒格的 100 个思维模型”。包括这种说法的来源,100 模型的内容,以及对 100 个思维模型的每一个进行简要介绍。 > > 介绍每个思维模型时,说明它是什么,为什么重要,举个例子,应用场景。 > > 使用英文搜索,只采纳英文资料(因为互联网上英文资料在数量和质量上都是最好的),用中文回答。 我自己的思考: 1、100个模型只解读了13个,这不是偶然。我做了一个测试,让openai deep research一次性研究包含300本书的书单,o3驱动的deep research产出了史上最长的报告,覆盖了300本书,最终报告6万多字(一个推友研究NBA球队,单个球队的研究报告也到了6万多字)。但是,之前gemini 2.0 flash驱动的google deep research,5千字就糊弄教材,实际完成1/3都不到。 2、为什么gemini 2.5 pro deep research会“糊弄”?要么是指令跟随能力不行(听不懂prompt)?要么是底层模型的推理能力不行?要么是上下文窗口限制?是否还有其他可能? 3、语言质量、报告结构上,这些没有硬性评价标准,每个人观点不同。我从这个案例中的观察是,google deep research有改善,但是确实和o3有差距; 4、context window之迷:gemini 2.5 pro有100万的上下文窗口,为什么只能产出2万字的报告?openai模型的上下文窗口是gemini的1/5,但是,产出报告的细致程度和质量为什么会更高?o1的上下文是20万,输出长度是10万;我估计o3的上下文可能是40万,输出长度可能是20万(毕竟,最终报告6万多汉字,加上中间的思维过程)。 初步个人结论:gemini 2.5 pro口碑这么好,deep research 应该是能用的(毕竟我只测试了一个极端的研究案例,后续我会从我的200多个openai deep research案例中精选出来对比测试)。但是,“一分价钱一分货”的道理目前仍然成立。 google 和openai 报告全文 link 在评论区。👇

howie.serious

96,912 Aufrufe • vor 1 Jahr

发现一个讲的很细的大语言模型微调教程,详细介绍了整个流程,包括数据准备、参数设置、资源监控等关键步骤。 基本没有技术能力也可以完成微调。想要了解 LLM 原理的可以按这个实践一下。 时间轴: 0:00 概念概览 3:02 自定义数据的准备 8:17 微调操作演示(T4 版本) 16:52 微调操作演示(A100 版本) 19:13 在 Hugging Face 上的保存与使用方法 文字版整理: ✲ 如何使用自己的数据对大语言模型进行微调(fine-tuning): 对大语言模型进行微调并不一定非常困难和昂贵。通过使用自己的数据集对预训练模型进行微调,可以让模型更好地适应特定的任务需求。微调过程能够在保留原模型语言理解能力的基础上,进一步提升其在特定领域或任务上的表现。 ✲ 使用Hugging Face模型库和Unslaw工具进行模型微调: Hugging Face提供了丰富的预训练语言模型资源,用户可以根据任务需求选择合适的模型作为基础进行微调。而Unslaw工具则提供了一套简单高效的微调流程,其优点包括出色的内存使用效率以及对扩展上下文窗口的支持。通过Unslaw,用户能够以较低的资源开销完成模型微调。 ✲ 在Google Colab上使用免费/付费GPU资源进行微调: Google Colab提供了免费和付费的GPU资源,用户可以根据任务的复杂程度选择使用T4或A100。对于大多数微调任务而言,免费的T4资源已经足够。但如果数据集较大或模型较为复杂,升级到A100可以获得更充裕的算力支持。Colab为用户提供了一个易于上手的模型微调环境。 ✲ 准备自定义的微调数据集: 准备微调数据的过程并不复杂。用户可以直接使用纯文本文件作为数据来源,而无需进行额外的预处理。为了获得理想的微调效果,建议至少准备100-200个样本。在示例中,为了快速演示,仅使用了几个样本。通过一个简单的Python脚本,可以方便地将原始文本数据转换为微调所需的JSON格式。 ✲ 修改Colab笔记本中的参数设置: 在Colab笔记本中,需要根据实际情况调整一些参数。例如,可以根据数据集的token数量来设置max_sequence_length参数,借助rope scaling技术,模型能够支持任意长度的上下文。此外,还可以选择使用Instruct系列模型作为base model,直接在其基础上进行指令微调。为了节省资源,可以启用4-bit量化。同时,参考Q-Lora论文的建议,调整R值和alpha值,以在资源占用和模型质量之间取得平衡。 ✲ 训练过程中的资源使用监控: 在模型训练过程中,用户可以通过Colab的资源监控选项卡实时观察GPU、内存和硬盘的使用情况。如果发现资源不足,可以考虑从T4升级到A100。通过监控资源占用,用户能够及时调整配置,确保微调任务稳定高效地进行。 ✲ 模型训练的loss变化和最佳checkpoint的选择: 通过记录不同训练步数下的loss值,可以判断模型的收敛情况。理想的做法是选择loss下降曲线趋于平缓的点作为最佳checkpoint,这样既能充分训练模型,又能避免过拟合。为了事后方便筛选,可以设置每隔一定步数保存一次checkpoint。 ✲ 模型微调完成后的保存与使用: 微调完成后,可以选择只保存adapter layers以加快保存速度。但更推荐的做法是保存完整模型,并使用float16精度,这样可以得到一个更通用和标准的模型格式,方便后续的部署和使用。 ✲ 在Hugging Face上公开或私有发布微调后的模型: 用户可以选择在Hugging Face的模型库中公开或私有地发布自己微调后的模型。发布之前,需要在Hugging Face账号中创建一个访问令牌,并在发布时提供相应的用户名和令牌信息。通过在Hugging Face上发布模型,用户可以方便地与他人分享自己的微调成果。 ✲ 使用微调后的模型进行推理(inference): 在使用微调后的模型进行推理时,首先需要加载保存的模型。接着,使用tokenizer对输入的文本进行处理,并将其传入模型。进行推理时,max_length参数需要与训练时保持一致,以确保生成的结果不会被截断。完成以上步骤后,就可以利用微调后的模型进行各种实际应用了。

歸藏(guizang.ai)

61,710 Aufrufe • vor 2 Jahren

Ilya——塑造世界的人工智能科学家 如今,AI 是一项伟大的科技,因为 AI 将解决我们现在面临的所有问题。它能解决就业问题,能治疗疾病,能消除贫困,但同时它也会带来新的问题。假新闻将会愈演愈烈,网络攻击将变得更加严重,我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。 今天早晨,关于人工智能威力的警告再次响起,超过 1300 位科技产业领军人物、研究者及其他人士正呼吁暂停人工智能的发展,以便认真考虑其带来的风险。 扮演上帝,科学家们被指责这么做已经有一段时间了,但我们正在创造的东西确实与我们迄今为止创造的任何东西都截然不同。是的,我们绝对有能力创造出具有自我目标的全自主实体。而且,这些实体变得比人类聪明的时候,确保它们的目标与我们的目标保持一致将变得至关重要。 什么激励我?我喜欢思考根本问题,基本问题。我们的系统不能做什么,而人类却可以做到?我几乎以哲学的方式去思考这些问题。比如,什么是学习?什么是经验?什么是思考?大脑又是如何运作的呢? 我感觉技术就仿佛一种自然力量。在我看来,技术与生物进化之间有许多相似之处。生物进化的过程其实很容易理解,我们有基因的变异,自然选择的过程。我们保留那些有利于生存的变异,随着时间的推移,这个过程将使生物体变得极其复杂。我们不能因为理解了生物进化就能理解人体是如何运作的,但我们可以大概理解这个过程。 我认为目前的机器学习也处在类似的阶段,特别是深度学习,我们有一个非常简单的规则,它从数据中提取信息,并将这些信息输入到模型中,我们只需不断重复这个过程。这个过程的结果就是将数据的复杂性转化为模型的复杂性。因此,最终的模型会变得非常复杂,我们并不能完全了解它的运作机制,需要进行大量的研究,但实现这一切的算法其实很简单。 也许你听说过 ChatGPT,如果你还没听说过,那就做好准备。你可以把它看作是暴风雨来临之前的零星细雨。我们需要对此保持高度警觉,因为我认同这是一个意义重大的时刻。ChatGPT 被誉为颠覆性的创新,在许多方面,它确实做到了,比如在测试中得分超过人类。微软最近的一项研究得出结论,GPT4 是一个初级阶段的,但尚未完全形成的通用人工智能系统。 这就是通用人工智能。通用人工智能,这是一个可以胜任人类能做的任何工作或任务的计算机系统,而且可能做得更好。有可能在短时间内实现通用人工智能,也可能需要更长的时间。但我认为,由于通用人工智能可能在不久的将来出现,这个可能性足够大,我们应该给予它足够的重视。这一点至关重要要确保这些超级智能的系统能按照我们的最大利益去行动。 最初的通用人工智能可能就是大型数据中心,这些中心中充满了大量并行运行的专用神经网络处理器,紧凑、高热、能耗大,其消耗的能量可能相当于一千万个家庭的用电量。这些系统的智能程度可能会大幅提升,我相信它们将对社会产生深远影响。不过,人类真的会从中获益吗?谁会获益,谁又会付出代价呢? 首批通用人工智能的信念和欲望将极为重要,所以我们必须正确地编程这些系统。如果我们做不到这一点,那么就会出现这样的情况:进化的本质,即自然选择,将使这些系统优先考虑自己的生存。并不是说它们会主动对人类产生敌意,甚至想要伤害人类,但它们将变得过于强大。我认为,一个恰当的类比就是人类对待动物的方式。我们并不是憎恨动物,实际上人类往往对动物怀有深深的爱意,但当我们需要在两座城市之间修建高速公路时,我们并不会征求动物的意见,而只是因为这对我们来说非常重要而去做。我认为这也是我们与通用人工智能(AGI)之间的默认关系,那些能真正自主运作并为自己目标服务的 AGI。 许多机器学习领域的专家这些知识渊博和经验丰富的人士,对通用人工智能(AGI)抱有许多疑虑。他们对 AGI 可能出现的时间以及是否真的能够实现表示怀疑。目前,这还是一个鲜为人知的问题。用于神经网络和人工智能的计算机速度可能在未来几年内增加 10 万倍。如果多个团队处于竞相开发通用人工智能的军备竞赛态势中,他们就会没有足够的时间来确保他们构建的通用人工智能会真正关心人类。因为在我看来,这就像是通用人工智能发展的雪崩,一发不可收拾。 我认为将来整个地球的表面很可能布满太阳能板和数据中心。考虑到这些担忧,未来的通用人工智能的建设应该是多国间的合作项目。不论如何,人工智能的未来都将是美好的。如果这同样也能给人类带来福祉,那就更加理想了。 视频来源:

宝玉

45,172 Aufrufe • vor 2 Jahren

最近陶哲轩在 2024 年第 65 届国际数学奥林匹克上,陶哲轩做了一次 AI 和数学的演讲,非常精彩,从数学使用计算计算机的历史开始讲起,一直讲到大语言模型,干货相当多,尤其适合对数学有兴趣的同学。 (对数学没那么感兴趣的同学只想看 AI 部分的建议直接跳到 41 分的位置开始观看) 先摘录几个冷知识: 1. 我们使用机器做数学计算已经有数千年,最早的机器辅助计算可能是罗马人,然后是中国的算盘 2. 二战时就有人肉“计算机”,计算弹道和其他任务,多位女孩子,因为男士们在打仗,所以那时候的计算基本单位不是GPU,而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在,数学家们使用一种现代化的证明辅助编程语言,叫做 Lean。在 Lean 中有一个核心的数学库,通过众包的方式开发的,本科数学课程中看到的内容,比如微积分基础、群论基础或者拓扑学等等,这些都已经被形式化了,所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程,那就是先编写一个称为“蓝图”的详细证明计划,将整个证明分解为数百个小步骤。每个步骤可以单独形式化,然后再将它们整合在一起,这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图,然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。 去年,陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了,使用了蓝图工具,参与的人中有概率论专家,甚至还有一些并非数学家的人,他们是程序员,但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务,并完成了它。 在数学领域,通常很难这么多人一起合作,一般最多可能五个人合作。因为在大项目上合作时,你必须相信每个人的数学都是正确的。但是,一旦超过一定规模,这就无法实现了。但现在借助 Lean 编译器,它能自动检查。团队成员无法上传任何编译不通过的内容,会被拒绝。因此,你可以与一些从未见过的人合作。 最后是讲大语言模型,首先陶哲轩就打脸了 GPT-4 的论文(我猜是微软那篇《GPT-4,通用人工智能的火花》),论文中号称 GPT-4 能解决国际数学奥林匹克问题,但实际上,这个问题不是 2022 年国际奥数竞赛的原始问题,而是一个简化版本,并且他们测试了几百道国际奥数竞赛问题,成功率只有1%,论文里的这个是精心挑选的恰巧能做对的。 并且陶哲轩提到了基于大语言模型的一些改进的方案: 比如 CoT(Chain of Thought),也就是 LLM 做简单的算术运算都做不对,但是如果让它一步步解释,可能就对了。还可以教 AI 一些解题技巧,比如尝试简单的例子,反证法,尝试逐步证明等。 比如让模型和编程语言或者工具连接,将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证,并且迭代的进行修正和验证,直到得到正确的结果,这可以提升大语言模型生成的效果。 即使借助这些手段,大语言模型还远远不能解决大多数数学问题,更不用说数学研究问题了! 当然陶哲轩也没太过打击大家对于 AI 的信心,表示我们在 AI 上还是在不断的取得进展,还提到了他日常是怎么用 AI 的,比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题,我尝试了几种方法,但都无法解决。于是,我尝试询问 GPT,你建议我使用什么其他方法来解决这个问题?GPT 给我提供了 10 种可能的方法,其中有 5 种我已经尝试过,或者明显没有帮助。的确,有几种方法并不实用。但其中有一种我还没尝试过的方法,那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时,我意识到这就是我漏掉的正确方法。所以,将 GPT 视为一个交流伙伴,它确实具有一定的用处。 还有使用 GitHub Copilot 帮他写代码,让它自动生成下一步的证明结果,Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具,你只需要写下一半的证明,它就会尝试猜测接下来的内容。大概有 20% 的情况下,它能猜到接近正确的答案。然后你就可以说,我接受这个答案。好的,那么在这种情况下,我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行,尽管你可能看不清楚,却真的解决了这个问题。所以,你不能盲目接受它的输入,因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解,这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行,它们就能自动完成。现在已经有了这样的实验,即通过迭代地让 AI 提供证明,然后让编译器进行反馈,如果编译出错,就把错误信息反馈给 AI。通过这种方法,我们开始能够验证四五步长的证明。当然,一个大型的证明可能需要数万行。所以,我们还没有达到能够立即得到一个正式证明的程度。但是,这已经是一个相当有用的工具。 对于大家关心的问题: AI 在数学领域现在到了哪一个阶段?是否未来几年利用 AI 能直接解决数学问题? 陶哲轩也给出了他的看法: > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题,你可以定制专门的 AI 来处理一小部分问题。即便如此,它们也不是完全可靠的,但还是有用的。不过至少在接下来的几年里,它们基本上将是非常有用的辅助工具,超越了我们已经熟悉的暴力计算辅助。 他还提到了一些可能的 AI 能在数学领域提供帮助的方向: - AI 能够非常好地生成有价值的猜想 > 比如,我们已经看到了关于结理论的例子,它们已经可以推测出两个不同的统计量之间的关系。因此,我们希望能够创建大量的数据集,输入到 AI 中,它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点,部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在,因为证明定理是如此繁琐和艰难的过程,我们一次只能证明一个定理,如果你效率很高,可能一次能证明两三个。但是有了 AI,你可以设想一下未来的情况,我们不是试图解决一个问题,而是处理一类类似的1000个问题,然后告诉AI,尝试用这个方法解决这 1000 个问题,然后报告结果,哦,我能用这种技术解决 35% 的问题。那么另一种技术呢?我能解决这个百分比的问题。或者如果结合这些方法,又能解决多少问题?你可以开始探索问题的空间,而不是一个接一个地解决问题。这是你现在根本无法做到的事情,或者是你需要几十年时间,通过数十篇论文慢慢搞清楚各种技术能做什么,不能做什么。但是有了这些工具,你真的可以开始做规模前所未有的数学研究。所以,未来将会非常令人兴奋。 演讲环节结束前的最后一句话说的特别好: > 我们仍然会以传统方式证明定理。事实上,我们必须这样做,因为如果我们自己都不知道如何做这些事情,就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。 这恰恰也是我们现在使用 AI 辅助编程的问题:如果我们自己都不知道如何构建软件,就很难引导好 AI 帮助我们生成高质量的代码。 尽管 AI 在数学和编程领域变得越来越有用,但人类的洞察力和创造力仍然是创作价值的关键。 原始 YT 视频:

宝玉

300,761 Aufrufe • vor 1 Jahr

什么是 AI 智能体?(双语字幕) 为了解释这一点,我们必须看一看在生成式 AI 领域看到的各种转变。 *** 从单一模型向复合 AI 系统的转变 单一模型受限于其训练数据,这影响了它们对世界的认知以及它们可以解决的任务类型。而且,这些模型也难以适应变化。尽管可以对模型进行微调,但这需要大量的数据和资源投资。 **** 示例:查询假期天数 例如,我想要为今年夏天计划一次假期,想知道我有多少假期天数可以用。我可以将我的查询输入到一个可以生成回应的模型中。然而,答案会不正确,因为模型并不知道我的身份,也无法访问我的个人信息。因此,模型本身可能对一些任务有所帮助,例如总结文档、撰写电子邮件初稿和各种报告初稿。 但当我们围绕模型构建系统,并将模型集成到现有流程中时,魔力便显现出来。设计一个系统来解决前面提到的问题,需要让模型能访问存储我假期数据的数据库。这样,虽然输入到语言模型中的查询相同,但模型会被提示创建一个搜索查询,这个查询可以访问我的数据库。程序会获取信息并得到答案,再将答案输入语言模型中,生成回答句子,如:“Maya,你的假期数据库里还剩下十天。”这样,我能得到正确的答案。 *** 复合 AI 系统的模块化设计 “系统”意味着有多个组件,因此系统本质上是模块化的。我可以有一个模型,选择微调模型、大语言模型、图像生成模型,但也可以有围绕它的程序化组件。可以有输出验证器、解析查询的程序、与数据库搜索结合的工具、与不同工具结合的程序等。 当我们谈论系统方法时,我可以分解希望程序完成的任务,选择合适的组件来解决问题。这比微调一个模型要容易得多,使过程更快、更方便。 **** 检索增强生成(RAG) 一个流行的复合 AI 系统例子是检索增强生成(RAG)。如果我提出一个完全不同的查询,如问天气情况,这会失败,因为程序的运行路径总是搜索假期数据库,而这与天气无关。因此,复合 AI 系统的大部分都有程序控制逻辑,这些逻辑由人类定义。 *** AI 智能体的作用 另一种控制复合 AI 系统的逻辑方式是让大语言模型负责,这在大语言模型的推理能力显著提高时才可能实现。大语言模型可以处理复杂问题,能根据提示词要求将问题分解并制定解决计划。 在一个极端,我要求系统快速思考,按照设定的规则行动。在另一个极端,可以让系统慢慢思考,制定计划,逐步解决每一部分,理解困难点并调整计划。 当让大语言模型负责逻辑时,就是在采取一种以智能体为中心的方法。 *** 大语言模型智能体的组成部分 **** 推理能力 推理能力将模型置于解决问题的核心位置,在设定计划的过程中对每一步进行推理。 **** 行动能力 行动能力通过称为“工具”的外部程序实现。这些工具是程序的外部模块,模型可以确定何时及如何调用它们以便最有效地解决提出的问题。例如,网络搜索工具、数据库搜索工具、计算器工具、操纵数据库的程序代码、翻译任务的模型等。 **** 访问记忆的能力 “记忆”可以表示几种含义。模型可以通过程序进行思考,类似于自言自语的内部日志,可以存储并随时取用。这也可以是与智能体互动的对话历史,使体验更加个性化。 *** ReACT 方法 配置智能体的受欢迎方法之一是 ReACT 方法,将推理和行动组件结合在一起。 **** 示例:度假计划 例如,我计划下个月去佛罗里达,想知道需要带多少瓶两盎司的防晒霜。这是个复杂的问题,有多步计划: 1. 我打算休多少天假? 2. 我计划在阳光下待多少小时?查看佛罗里达的天气预报。 3. 尝试了解每小时在阳光下的推荐防晒剂剂量。 4. 进行数学运算,确定防晒霜数量。 这个系统非常模块化,可以解决更复杂的问题。 *** 复合 AI 系统的未来 复合 AI 系统将一直存在,2024 年将看到它们变得更加智能。你可以根据问题的复杂程度在 AI 自治程度上做出权衡。对于狭窄、定义明确的问题,程序化方法更有效。而对于需要独立解决复杂任务的系统,智能体方法更有帮助。 大多数情况下,人工仍会参与以提高准确性。 原始视频来源:

宝玉

44,356 Aufrufe • vor 1 Jahr