Gemini Deep Research
Deep Research 就是你的私人研究助理,能帮你节省大量时间
该功能由 2.0 Flash Thinking(实验版)模型驱动,现在还能提供音频概览
Deep Research 是什么
借助 Gemini 中的 Deep Research,快速了解各种领域的内容。这一智能体功能可替你自动浏览多达数百个网站、分析搜寻到的结果并生成内容丰富的多页报告,还能将这些报告转换为生动有趣的播客式对话。
规划
Deep Research 能够根据你的需求,将简单的提示转化为专属的多维度研究计划
搜索
Deep Research 能够自主完成网络搜索和深度资料挖掘,为你找到最相关、最新的信息
推理
Deep Research 会不断根据收集到的信息进行推理,思考后才进行下一步,并将整个思路呈现在你眼前
报告
Deep Research 可在几分钟内为你生成内容丰富、高度定制的研究报告,其中包含深入的细节和独到的见解,还能转换为音频概览,替你节省数小时的宝贵时间
如何使用 Deep Research
如果你有复杂的调研任务,不妨交给 Gemini Deep Research。它可以将任务分解,在网络上搜寻答案,并将发现结果综合整理成全面的研究报告。
得益于 2.0 Flash Thinking(实验版),从思路规划到提供更富有参考价值的详细报告,Gemini 在研究的各个环节都实现了全面提升。现在你还能将报告转换为音频概览,一边处理其他事情,一边用聆听的方式掌握报告内容。
竞争分析
了解新产品所面临的竞争格局,包括竞争对手的产品特点、定价策略、市场推广方式和客户反馈信息。
尽职调查
调查潜在客户,分析目标公司的产品组合、过往融资情况、团队实力以及竞争态势。
主题理解
通过辨析关键概念的异同,梳理想法之间的关联,并阐释背后的根本原理,实现对主题的透彻理解。
产品比较
综合考量产品的功能特点、性能表现、售价以及客户评价,对不同型号的电器进行评估。
Deep Research 的推出,标志着我们在迈向更加智能的代理式 AI 的道路上迈出了重要一步。它正逐渐从简单的问答工具,蜕变为能够进行复杂思考与任务执行的真正协作伙伴。
了解实际应用
跟着 Deep Research 资深产品经理 Aarush Selvan 一起认识这项新功能。
如何访问 Deep Research
立即免费试用 Deep Research
-
在桌面设备上
-
在移动设备上
-
适用于 150 个国家/地区
-
支持超过 45 种语言
-
已向 Google Workspace 用户开放
只需从提示栏或模型选择器下拉菜单中选择 Deep Research,即可开始使用,让 Gemini 替你开展研究工作。
Gemini Advanced 用户可在使用 Deep Research 时获享更高的用量上限。
第一版 Deep Research 的诞生
2024 年 12 月我们在 Gemini 体系中首度推出 Deep Research 这项产品类别,并于隔天邀请了部分团队成员聊聊这款产品。
代理式系统
为了构建 Deep Research 功能,我们开发了一种新的规划系统,让 Gemini 应用学会处理复杂问题。针对 Deep Research,我们训练了 Gemini 模型的以下能力:
-
拆解问题:收到复杂的用户问题后,系统首先会制定一个详细的研究计划,将问题拆分为一系列更小、更容易处理的子任务。掌控权仍在用户手中:你可以修改 Gemini 制定的计划,确保研究方向正确。
-
研究:模型开始监督该计划的执行,并会根据子任务的性质,灵活决定哪些工作可以同时处理,哪些工作需要依序完成。模型可以使用搜索和网络浏览等工具来获取信息并进行推理。在每个步骤中,模型都会根据可用信息进行推理,以决定下一步该怎么执行。我们特别为这项功能新增了一个思考面板,方便用户及时了解模型目前学到的内容,以及预计执行的下一步操作。
-
合成:模型确定已经收集到足够的信息后,就会将手上的结果综合成一份详尽的报告。在生成报告的过程中,Gemini 会批判性地评估信息,识别关键主题和不一致之处,并生成一份逻辑清晰且信息丰富的报告,甚至通过多次自我审查来提升报告的清晰度和细节。
新类别,新问题,新解决方案
我们在构建 Deep Research 时必须克服三个重大技术难题:
多步骤规划
研究任务需要分多个步骤反复规划。模型会在每个步骤中,参考目前收集到的所有信息,找出缺漏和不一致之处,并继续探究,同时还要在报告的全面性与计算资源、用户等待时间之间进行权衡。我们以数据高效的方式训练模型,使其能够有效完成长时间的多步骤规划,从而让 Deep Research 可以利用公开资料处理各种类型的研究主题。
耗时较长的推理
典型的 Deep Research 任务可能需要在几分钟内调用多个模型。这无疑给智能体的构建带来了挑战:开发者务必确保单点故障不会导致任务必须从头开始执行。
为了攻克这个问题,我们开发了一种新颖的异步任务管理器,确保负责规划和执行任务的模型保持状态一致,不必重启整个任务也能从容地完成错误恢复。该系统可以做到真正的非同步:在启动 Deep Research 项目后,你可以切换到其他应用,甚至直接关闭电脑;下次打开 Gemini 时,如果研究已完成,系统会发出提醒。
上下文管理
在一次研究过程中,Gemini 就可能会处理数百页的内容。为了保持连贯性并支持后续提问,我们利用了 Gemini 业界领先的 100 万个 token 上下文窗口,同时辅以 RAG 设置作为补充。因此,系统能有效地“记住”在对话期间学到的所有内容,随着互动次数的提升,它会变得越来越聪明。
现在由 2.0 Flash Thinking(实验版)驱动
Deep Research 于 12 月推出时,是由 Gemini 1.5 Pro 驱动的。而随着 Gemini 2.0 Flash Thinking(实验版)的推出,我们得以显著提升该产品的质量和服务效率。在引入推理模型后,Gemini 在执行每个后续步骤前,都会投入更多时间精心规划方法。这种自我反思和规划的固有特性,使其非常适合这类长时间运行的智能体任务。我们发现,现在 Gemini 在研究的各个环节都实现了全面提升,并且能够生成更为详尽的报告。同时,因为 Flash 模型的计算效率更高,我们能够将 Deep Research 推广给更多用户。Flash 和推理模型的开发让我们倍感振奋,期待 Deep Research 功能变得越来越好。
后续发展
我们希望构建一个多功能系统,因此后续,我们将让用户可以进一步掌控模型能浏览哪些内容,并让模型能够使用开放网络之外的多样化来源,持续拓展系统的功能边界,为你提供更丰富的体验。
我们期待见证大家运用 Deep Research 的各种方式,这些实际使用经验将为我们持续构建和改进 Deep Research 提供宝贵的参考价值。最终,我们的目标是打造一个真正具有代理能力、能为所有人提供帮助的 AI 助理。
智能体 Gemini
Gemini 的新型代理式 AI 系统汇聚了 Gemini、Google 搜索和网络技术的优势,能够以持续推理循环的方式,不断地搜索、浏览和仔细分析信息,从而获得更详尽的结果。