正在加载视频...

视频加载失败

今天OpenAI推出了下一个能够独立为您工作的智能体——Deep research(深度研究)。 给它一个提示,ChatGPT将查找、分析并综合数百个在线来源,在十几分钟内生成一份全面报告,而这通常需要人类花费数小时才能完成。 以下原文👇

92,016 次观看 • 1 年前 •via X (Twitter)

11 条评论

AI Will 的头像
AI Will1 年前

Deep research由优化版的OpenAI o3驱动,专为网页浏览和Python分析设计,利用推理智能地、广泛地浏览互联网上的文本、图像和PDF。

AI Will 的头像
AI Will1 年前

驱动Deep research的模型在许多针对现实世界问题的公开评估中达到了新的高度,包括“人类最后的考试”。

AI Will 的头像
AI Will1 年前

Deep research是为从事金融、科学、政策和工程等领域密集知识工作的人员打造的,他们需要深入且可靠的研究。 它对于寻找需要仔细研究的个性化推荐的精明购物者也非常有用。

AI Will 的头像
AI Will1 年前

Deep research今天稍后将首先向Pro用户推出。 然后,将扩展到Plus和Team,最终推向Enterprise。

AI Will 的头像
AI Will1 年前

以上就是全部,原作者 @OpenAI 如果您喜欢这个主题: 1.关注我(@FinanceYF5) 2. 点赞+转发下面第一条帖子

PDF GPT 的头像
PDF GPT1 年前

This is my favorite AI tool for reviewing reports. Just upload a report, ask for a summary, and get one in seconds. It's like ChatGPT, but built for documents. Try it for free.

CLONE Tanjil CLONE Kaisar 的头像
CLONE Tanjil CLONE Kaisar1 年前

这听起来像是ChatGPT在为我们节省时间!不过,谁来给我奖励,让我为AI训练提供数据呢?😄 #PublicAI

Meta2045 的头像
Meta20451 年前

重要被迫好好起名字

SoloWind 的头像
SoloWind1 年前

Would it think in Chinese like the mini?

币安交易所高返佣注册(Parody) 的头像
币安交易所高返佣注册(Parody)1 年前

太强大了,未来可期

jfdi1001 的头像
jfdi10011 年前

@readwise save thread

相关视频

OpenAI 全新“Deep Research”重磅发布:让 ChatGPT 帮你完成多步骤深度研究 在这个信息爆炸的时代,如何用最短的时间获取最精准、最详实的信息,一直是许多知识工作者面临的难题。如今,OpenAI 带来了全新的 Deep Research 功能,让你的 ChatGPT 化身为一位“研究助理”,能够独立查找、分析并综合海量网络信息,为你提供专业且有完整参考的研究报告。下面,让我们来一起了解这项强大的新功能吧! Deep Research 能做什么? 1. 多步骤研究 相比传统的聊天式问答,Deep Research 具备强大的自主研究能力。它能够从互联网上寻找并分析数百个来源,根据实时获取的信息进行动态调整和推理。短短几十分钟内,它能完成人工需要数小时才能完成的研究工作。 2. 自动化汇总海量信息 你只需要输入研究需求,ChatGPT(在 Deep Research 模式下)就会自动去浏览海量网页、PDF、图片等信息资源,并将它们整合成一份清晰、有理有据的分析报告,犹如一位具有专业分析能力的研究员。 3. 详尽引用与文献记录 Deep Research 每一个输出都附有引用来源,并在侧边栏展示搜索、分析过程,方便你查看、验证信息。同时也提供思路概述,保证研究过程的透明度与可追溯性。 4. 个性化、多场景适用 无论你是做金融、科学、政策、工程等领域的深度研究,还是想为购物(例如汽车、家电或家具等大件商品)做细致比对,Deep Research 都能胜任。它还擅长挖掘各类小众且不直观的信息,只需一次查询,就能节省你大量的时间和精力。 为什么它如此重要? 1. 效率大幅提升 普通用户在网络上搜集信息可能需要自己筛选资料、反复验证。Deep Research 通过自动化的搜寻和分析,大幅缩短研究时间,让你把更多精力放在思考与决策上。 2. 减少重复劳动 Deep Research 擅长处理那些需要浏览无数个网页、文件的繁琐任务。比如撰写报告、整理数据、查找论文资料、对比不同产品参数等。以前这些工作往往让人头疼,现在只需一次提问,就能得到系统、条理化的研究成果。 3. 助力专业领域 该功能在化学、人文社科、数学等众多专业领域都表现出色,尤其在需要检索专业文献、综合多方信息的复杂任务中,让研究人员更轻松、更高效。 4. 迈向真正的“通用人工智能” OpenAI 一直致力于开发具备创造全新知识能力的通用人工智能(AGI)。Deep Research 作为其新里程碑,进一步展现了 AI 在多领域多模态研究中的潜力,为未来更先进的 AI 系统奠定了基础。 如何使用 Deep Research? 1. 选择 Deep Research 模式 在 ChatGPT 界面中,找到消息输入区域的模式选项,选择“Deep Research”。然后在对话框输入你的研究需求。 2. 附加背景文件/数据 如果你有特定的文件、电子表格或参考资料,也可以上传给 Deep Research。它会结合这些材料,为你做更有针对性的深度分析。 3. 查看研究过程与报告 当 Deep Research 开始运行后,聊天界面会出现一个侧边栏,展示它搜索到的来源以及每一步的推理过程,让你随时掌握研究进展。 一般它会花 5~30 分钟进行深度研究,然后返回一份完整的报告,附带详细引用。如果任务很耗时,你也可以先去忙别的事,等它研究完成再回来查看结果。 4. 报告输出形式 初始版本以文字报告为主,在接下来几周内,Deep Research 将支持在报告中插入图片、数据可视化图表以及其他分析产出,让研究结果更加直观、生动。 技术原理与表现 1. 强化学习驱动 Deep Research 通过端到端强化学习训练,掌握了如何在复杂的网络环境中进行多步搜索和推理,遇到新情况时也能灵活应对。 2. 新的评测成绩 • 在 Humanity’s Last Exam 测试中,为 Deep Research 提供支持的模型取得了 26.6% 的准确率,远超上一代模型的表现。 • 在 GAIA 基准上,它也刷新了排行榜记录,证明了在多模态理解和使用工具(如浏览器、Python)等方面更具突破性。 3. 专业领域的进一步提升 一些专业人士反馈,使用 Deep Research 可以在短时间内完成原本需要数小时的调查工作,无论是找文献还是分析数据,效率提升显著。 注意事项及局限性 1. 依然存在幻觉或错误推断 虽然 Deep Research 生成“错误事实”或逻辑漏洞的概率比现有 ChatGPT 模型更低,但仍有可能出现。用户在使用时应保持警惕,尤其在严谨的学术或商业环境下,要对关键信息进行交叉验证。 2. 区分谣言与权威信息的能力有限 模型仍然可能对信息来源缺乏足够判断力,需要用户根据实际情况和专业常识来判断信息的可信度。 3. 报告格式与耗时 首批上线版本可能会出现小规模的格式问题或引用异常,研究任务也可能因为深度搜索而启动较慢。官方表示,会随着使用量的增加和时间的推移迅速改进这些问题。 谁能访问 Deep Research? 1. Pro 用户率先上线 目前 Deep Research 首先向 ChatGPT Pro 用户开放,每月可使用高达 100 个查询额度。 2. 逐步覆盖更多付费用户 之后会依次向 Plus 和 Team 用户开放,随后是企业版。OpenAI 也在努力面向英国、瑞士以及欧洲经济区的用户开放访问权限。 3. 进一步的扩容 OpenAI 计划推出一个使用更小模型、速度更快且成本更低的 Deep Research 版本,届时所有付费用户都会有更高的调用额度。 后续计划 1. 更广泛的平台支持 Deep Research 目前仅在 ChatGPT 网页端上线,官方将在未来一个月内把这项功能带到移动端与桌面端。 2. 接入更多数据源 不仅能访问互联网的公开信息和用户上传的文件,今后还会扩展到订阅或内网资源,让报告更具深度与个性化。 3. 与其他代理能力融合 OpenAI 正在开发的 Operator 功能,能够在现实世界中执行任务。当 Operator 与 Deep Research 结合,ChatGPT 将可以自主进行更复杂的在线与线下任务,为用户提供更全面的“智能助理”体验。 Deep Research 的到来,让我们看到了一个可以代替人工执行复杂、多步骤研究任务的 AI 时代正逐渐变成现实。无论你是需要大量文献支撑的研究工作者,还是想要做精细购物决策的普通用户,都能借助这个工具大幅提升效率。它不仅代表着 ChatGPT 的新能力,也标志着人类向更高水平的通用人工智能迈出了重要一步。对知识工作者来说,这将是一股全新的生产力,也是人工智能赋能未来的又一有力见证。 想要率先体验 Deep Research 的朋友,如果你是 ChatGPT Pro 用户,不妨立刻去试试看;如果尚未获得资格,也可以继续关注官方更新,相信不久后就有机会亲自感受这项强大的功能啦!

宝玉

67,470 次观看 • 1 年前

突发:ChatGPT创始人在Sam奥特曼被解雇的前一天,他在APEC的一次会议上,暗示了OpenAI已开发出比现在GPT4更加强大,让人无法想象,远超人们期待的东西。奥特曼上周突遭解雇的四天前,有几位内部研究人员致信董事会而发出警告。这封信警告称,他们发现了一种可能对人类构成威胁的重大人工智能技术,被称为Q*。 Q*被一些OpenAI的人认为可能是通向超级智能或人工通用智能(AGI)的重大突破。研究人员认为它可能对人类构成威胁。这封信和该Q*是导致Sam奥特曼被解雇的关键因素。这位匿名者说,新模型能够解决某些数学问题,尽管只有小学生水平,但进行此类测试的结果使研究人员对Q*未来的成功非常乐观。 总裁简报(CEO Briefing)询问了一位斯坦福的人工智能专家,他认为数学是ChatGPT和生成式人工智能发展的前沿。目前,生成式人工智能擅长通过统计预测下一个单词,来写作和语言翻译,对同一个问题的回答可能差异很大。但是,掌握数学能力,在这里只有一个正确答案,意味着人工智能将具有类似于人类智能的更大推理能力。例如,这可应用于新颖的科学研究。 与只能解决有限数量操作的计算器不同,AGI可以泛化、学习和理解。在给董事会的信中,研究人员提到了人工智能的能力和潜在危险,但没有具体说明信中提到的确切安全问题。除了在本月的演示中宣布了一系列新工具外,Sam奥特曼上周在旧金山的聚会上暗示,他相信AGI已经在望。这在暗示,OpenAI内部实现了技术和模型上的巨大飞跃。而Ilya等董事会成员感到恐慌。 奥特曼在APEC峰会上说:“在OpenAI的历史上,现在已经是第四次,最近一次是在过去几周内,我有幸在房间里,当我们推开无知的面纱,将发现的边界向前推进,能够做到这一点是我一生职业上的荣誉。”董事会在第二天就解雇了奥特曼。总裁简报(CEOBriefing)将继续关注OpenAI内斗的发展。创始人被赶出公司的不少,譬如苹果的乔布斯。

总裁简报 CEO Briefing

63,120 次观看 • 2 年前

“芒格100模型”研究 X google deep research with gemini 2.5 pro:9分钟,62个英文参考资料(实际访问了数百个网站),输出2万多字中文报告,100模型实际解读13个,任务完成率13%(这不是偶然,下文详解)🤣 一句话结论:单单从”研究芒格100模型“任务看,google deep research得分不超过30(满分100)。 prompt(和openai案例完全一致): > 大航海时代,海盗中间流传着一个传说:海贼王在大海深处埋藏着它的宝藏,找到它的海盗将获得力量、荣耀与权力。互联网上也有一个传说,charlie munger 有 100 个思维模型,掌握这 100 个思维模型的人将拥有大智慧,成为真正的聪明人。 > > 请帮我做一份研究,关于“查理芒格的 100 个思维模型”。包括这种说法的来源,100 模型的内容,以及对 100 个思维模型的每一个进行简要介绍。 > > 介绍每个思维模型时,说明它是什么,为什么重要,举个例子,应用场景。 > > 使用英文搜索,只采纳英文资料(因为互联网上英文资料在数量和质量上都是最好的),用中文回答。 我自己的思考: 1、100个模型只解读了13个,这不是偶然。我做了一个测试,让openai deep research一次性研究包含300本书的书单,o3驱动的deep research产出了史上最长的报告,覆盖了300本书,最终报告6万多字(一个推友研究NBA球队,单个球队的研究报告也到了6万多字)。但是,之前gemini 2.0 flash驱动的google deep research,5千字就糊弄教材,实际完成1/3都不到。 2、为什么gemini 2.5 pro deep research会“糊弄”?要么是指令跟随能力不行(听不懂prompt)?要么是底层模型的推理能力不行?要么是上下文窗口限制?是否还有其他可能? 3、语言质量、报告结构上,这些没有硬性评价标准,每个人观点不同。我从这个案例中的观察是,google deep research有改善,但是确实和o3有差距; 4、context window之迷:gemini 2.5 pro有100万的上下文窗口,为什么只能产出2万字的报告?openai模型的上下文窗口是gemini的1/5,但是,产出报告的细致程度和质量为什么会更高?o1的上下文是20万,输出长度是10万;我估计o3的上下文可能是40万,输出长度可能是20万(毕竟,最终报告6万多汉字,加上中间的思维过程)。 初步个人结论:gemini 2.5 pro口碑这么好,deep research 应该是能用的(毕竟我只测试了一个极端的研究案例,后续我会从我的200多个openai deep research案例中精选出来对比测试)。但是,“一分价钱一分货”的道理目前仍然成立。 google 和openai 报告全文 link 在评论区。👇

howie.serious

96,912 次观看 • 1 年前