Skip to main content

Gemini Deep Research

Deep Research 就是你的私人研究助理,能帮你节省大量时间
该功能由 2.0 Flash Thinking(实验版)模型驱动,现在还能提供音频概览

Deep Research 是什么

借助 Gemini 中的 Deep Research,快速了解各种领域的内容。这一智能体功能可替你自动浏览多达数百个网站、分析搜寻到的结果并生成内容丰富的多页报告,还能将这些报告转换为生动有趣的播客式对话。

规划

Deep Research 能够根据你的需求,将简单的提示转化为专属的多维度研究计划

搜索

Deep Research 能够自主完成网络搜索和深度资料挖掘,为你找到最相关、最新的信息

推理

Deep Research 会不断根据收集到的信息进行推理,思考后才进行下一步,并将整个思路呈现在你眼前

报告

Deep Research 可在几分钟内为你生成内容丰富、高度定制的研究报告,其中包含深入的细节和独到的见解,还能转换为音频概览,替你节省数小时的宝贵时间

如何使用 Deep Research

如果你有复杂的调研任务,不妨交给 Gemini Deep Research。它可以将任务分解,在网络上搜寻答案,并将发现结果综合整理成全面的研究报告。

得益于 2.0 Flash Thinking(实验版),从思路规划到提供更富有参考价值的详细报告,Gemini 在研究的各个环节都实现了全面提升。现在你还能将报告转换为音频概览,一边处理其他事情,一边用聆听的方式掌握报告内容。

竞争分析

了解新产品所面临的竞争格局,包括竞争对手的产品特点、定价策略、市场推广方式和客户反馈信息。

尽职调查

调查潜在客户,分析目标公司的产品组合、过往融资情况、团队实力以及竞争态势。

主题理解

通过辨析关键概念的异同,梳理想法之间的关联,并阐释背后的根本原理,实现对主题的透彻理解。

产品比较

综合考量产品的功能特点、性能表现、售价以及客户评价,对不同型号的电器进行评估。

Deep Research 的推出,标志着我们在迈向更加智能的代理式 AI 的道路上迈出了重要一步。它正逐渐从简单的问答工具,蜕变为能够进行复杂思考与任务执行的真正协作伙伴。

立即免费试用吧

了解实际应用

跟着 Deep Research 资深产品经理 Aarush Selvan 一起认识这项新功能。

如何访问 Deep Research

立即免费试用 Deep Research

  • 在桌面设备上

  • 在移动设备上

  • 适用于 150 个国家/地区

  • 支持超过 45 种语言

  • 已向 Google Workspace 用户开放

只需从提示栏或模型选择器下拉菜单中选择 Deep Research,即可开始使用,让 Gemini 替你开展研究工作。

Gemini Advanced 用户可在使用 Deep Research 时获享更高的用量上限。

第一版 Deep Research 的诞生

2024 年 12 月我们在 Gemini 体系中首度推出 Deep Research 这项产品类别,并于隔天邀请了部分团队成员聊聊这款产品。

代理式系统

为了构建 Deep Research 功能,我们开发了一种新的规划系统,让 Gemini 应用学会处理复杂问题。针对 Deep Research,我们训练了 Gemini 模型的以下能力:

  • 拆解问题:收到复杂的用户问题后,系统首先会制定一个详细的研究计划,将问题拆分为一系列更小、更容易处理的子任务。掌控权仍在用户手中:你可以修改 Gemini 制定的计划,确保研究方向正确。

  • 研究:模型开始监督该计划的执行,并会根据子任务的性质,灵活决定哪些工作可以同时处理,哪些工作需要依序完成。模型可以使用搜索和网络浏览等工具来获取信息并进行推理。在每个步骤中,模型都会根据可用信息进行推理,以决定下一步该怎么执行。我们特别为这项功能新增了一个思考面板,方便用户及时了解模型目前学到的内容,以及预计执行的下一步操作。

  • 合成:模型确定已经收集到足够的信息后,就会将手上的结果综合成一份详尽的报告。在生成报告的过程中,Gemini 会批判性地评估信息,识别关键主题和不一致之处,并生成一份逻辑清晰且信息丰富的报告,甚至通过多次自我审查来提升报告的清晰度和细节。

新类别,新问题,新解决方案

我们在构建 Deep Research 时必须克服三个重大技术难题:

多步骤规划

研究任务需要分多个步骤反复规划。模型会在每个步骤中,参考目前收集到的所有信息,找出缺漏和不一致之处,并继续探究,同时还要在报告的全面性与计算资源、用户等待时间之间进行权衡。我们以数据高效的方式训练模型,使其能够有效完成长时间的多步骤规划,从而让 Deep Research 可以利用公开资料处理各种类型的研究主题。

耗时较长的推理

典型的 Deep Research 任务可能需要在几分钟内调用多个模型。这无疑给智能体的构建带来了挑战:开发者务必确保单点故障不会导致任务必须从头开始执行。

为了攻克这个问题,我们开发了一种新颖的异步任务管理器,确保负责规划和执行任务的模型保持状态一致,不必重启整个任务也能从容地完成错误恢复。该系统可以做到真正的非同步:在启动 Deep Research 项目后,你可以切换到其他应用,甚至直接关闭电脑;下次打开 Gemini 时,如果研究已完成,系统会发出提醒。

上下文管理

在一次研究过程中,Gemini 就可能会处理数百页的内容。为了保持连贯性并支持后续提问,我们利用了 Gemini 业界领先的 100 万个 token 上下文窗口,同时辅以 RAG 设置作为补充。因此,系统能有效地“记住”在对话期间学到的所有内容,随着互动次数的提升,它会变得越来越聪明。

现在由 2.0 Flash Thinking(实验版)驱动

Deep Research 于 12 月推出时,是由 Gemini 1.5 Pro 驱动的。而随着 Gemini 2.0 Flash Thinking(实验版)的推出,我们得以显著提升该产品的质量和服务效率。在引入推理模型后,Gemini 在执行每个后续步骤前,都会投入更多时间精心规划方法。这种自我反思和规划的固有特性,使其非常适合这类长时间运行的智能体任务。我们发现,现在 Gemini 在研究的各个环节都实现了全面提升,并且能够生成更为详尽的报告。同时,因为 Flash 模型的计算效率更高,我们能够将 Deep Research 推广给更多用户。Flash 和推理模型的开发让我们倍感振奋,期待 Deep Research 功能变得越来越好。

后续发展

我们希望构建一个多功能系统,因此后续,我们将让用户可以进一步掌控模型能浏览哪些内容,并让模型能够使用开放网络之外的多样化来源,持续拓展系统的功能边界,为你提供更丰富的体验。

我们期待见证大家运用 Deep Research 的各种方式,这些实际使用经验将为我们持续构建和改进 Deep Research 提供宝贵的参考价值。最终,我们的目标是打造一个真正具有代理能力、能为所有人提供帮助的 AI 助理。

智能体 Gemini

推理
搜索
浏览

Gemini 的新型代理式 AI 系统汇聚了 Gemini、Google 搜索和网络技术的优势,能够以持续推理循环的方式,不断地搜索、浏览和仔细分析信息,从而获得更详尽的结果。