Skip to main content

Gemini Deep Research

運用專屬研究助理 Deep Research 省下數小時寶貴時間
此功能由 Gemini 2.0 Flash Thinking (實驗版) 驅動,現更支援語音摘要

Deep Research 簡介

Deep Research 是 Gemini 的代理功能,能迅速完成幾乎各種工作,例如:代你自動瀏覽高達上千個網站、評估搜尋到的結果、生成詳盡的多頁報告,以及將這類報告轉換成有趣、Podcast 風格的對談內容。

規劃

Deep Research 能把輸入的提示轉換成列出多個要點的專屬研究計畫

搜尋

Deep Research 能自行搜尋並深度瀏覽網站,找出最新相關資訊

推論

Deep Research 會不斷根據收集到的資訊推論,思考後再進行下一步,將整個思路呈現在你眼前

建立報告

Deep Research 能依你指定的條件,在數分鐘內生成完整詳盡的研究報告,並附上洞察資訊,還可提供語音摘要,幫你省下數小時的寶貴時間

如何使用 Deep Research

Gemini Deep Research 擅長處理複雜的研究工作。AI 首先會仔細分析各項工作、在網路上找答案,最後把發現的結果綜合成更完整的內容。

2.0 Flash Thinking Experimental 可提升 Gemini 在各研究階段的表現,包含規劃和提供更詳盡的洞察報告。現在你還能將報告轉換成語音摘要,一邊處理其他事情,一邊聆聽報告內容重點。

競品分析

瞭解新產品所在的競爭對手環境,包括競爭對手的產品/服務、定價、行銷手法和顧客意見回饋。

盡職調查

調查待開發銷售對象、分析公司的產品、資金記錄、團隊和競爭環境。

瞭解主題

透過比較和對照重要概念、找出各想法之間的關係及解釋基礎原則,深入探究主題。

產品比較

根據功能、效能、價格和顧客評論來評估單一裝置的不同型號。

Deep Research 象徵代理式 AI 的升級,不只能回答問題,還可進行複雜推論及執行作業,化身出色的工作夥伴。

立即免付費體驗

觀看實際運作情形

Deep Research 資深產品經理 Aarush Selvan 帶你認識這項新功能。

如何存取 Deep Research

立即免付費體驗 Deep Research

  • 支援電腦

  • 支援行動裝置

  • 服務範圍遍及 150 個國家/地區

  • 支援超過 45 種語言

  • 已向 Google Workspace 使用者開放

從提示列或模型挑選器下拉式選單選取「Deep Research」,Gemini 就會開始代你進行研究。

我們已向 Gemini Advanced 使用者開放 Deep Research。

我們如何建構第一版 Deep Research

2024 年 12 月,Gemini 系列服務首度推出 Deep Research 這類產品。我們也在隔天邀請部分團隊成員聊聊這項產品。

代理式系統

我們為建構 Deep Research 開發出全新規劃系統,讓 Gemini 應用程式學會處理複雜問題,包括訓練 Gemini 模型的以下能力:

  • 拆解問題:Gemini 收到複雜的使用者查詢後,會先產生詳細的研究計畫,將問題分成一系列更小、更容易處理的子工作。掌控權仍在使用者手中:你可以修改 Gemini 顯示的計畫,確保研究不偏離原定方向。

  • 研究:模型開始執行及監控研究計畫,並會根據子工作的性質,靈活決定哪些工作可同時處理,哪些則要依序完成。模型可能會使用搜尋引擎或瀏覽網頁,擷取資訊並進行推論。每個步驟中,模型都會根據可用的資訊推論,決定下一步該怎麼做。我們特別為這項功能新增了一個思考面板,方便追蹤模型當前學到的內容,以及預計執行的下一個動作。

  • 整合:模型判定收集夠多資訊後,就會將手上的資料整理成詳盡的報告。Gemini 產生報告時會審慎評估資訊,找出重要發現和不一致的地方,有邏輯地呈現豐富資訊,甚至會多次評論自己生成的內容,提升報告的詳盡程度。

新類別、新問題、新解法

我們在建構 Deep Research 時必須克服三個重大技術難題:

多步規劃

研究工作需要反覆規劃。Gemini 會在每個步驟,參酌當前收集到的所有資訊,找出缺漏或不一致的地方並繼續探究,同時也會權衡資訊的完整性、運算時間和使用者的等待長度。我們有效率地運用資訊訓練模型,強化 Gemini 進行長時間多步規劃的能力,因此 Deep Research 能運用公開資料處理各種研究主題。

耗時較長的推論

典型的 Deep Research 工作可能需要在數分鐘內呼叫多個模型,但這會造成建構代理上的困難:開發人員必須確保單一故障不會導致工作必須從頭開始。

為解決這項問題,我們開發出全新的非同步工作管理工具,確保負責規劃和執行工作的模型狀態一致,不必重新執行整個工作也能在背景完成錯誤復原。這個系統能做到真正的「非同步」:使用者啟動 Deep Research 專案後,可切換到其他應用程式,或甚至關掉電腦;下次打開 Gemini 時,系統就會提醒你研究已完成。

管理資訊脈絡

研究過程中,Gemini 可能會處理數百頁的內容。為了讓使用者進行後續互動及追加提問,我們結合了 Gemini 領先業界的脈絡窗口 (100 萬個詞元) 和檢索增強生成技術。模型因此能在對話期間有效「記住」接收到的所有資訊,並隨著互動增加而越來越聰明。

現由 2.0 Flash Thinking (實驗版) 驅動

Deep Research 去年 12 月推出時搭載 Gemini 1.5 Pro。隨著 2.0 Flash Thinking (實驗版) 問世,Deep Research 的品質和服務效率也出現飛躍性的成長。由於是推論模型,Gemini 每次進行下一步前都會花較多時間規劃做法。正因這種自我反思和規劃的特性,Deep Research 成為執行長時間代理工作的最佳選擇。我們發現,Gemini 在各研究階段都更得心應手,還能生成更詳盡的報告。此外,Flash 模型的運算資源使用效率較高,有利我們向更多使用者推出 Deep Research。我們等不及要開發更多通用的 Flash 和推論模型,也相信 Deep Research 會越來越好。

後續行動

我們想建構多用途的系統並持續拓展功能、訓練模型引用公開網路外的來源,並讓使用者進一步控管模型可瀏覽的內容。

我們已等不及瞭解大眾如何運用 Deep Research,也會根據這些實際使用體驗繼續開發及改良這項功能,最終打造出真正具備代理能力的全方位 AI 助理。

代理式 Gemini

推理
搜尋
瀏覽

Gemini 的全新代理式 AI 系統結合 Gemini、Google 搜尋和網路技術的優點,能在連續性的推論迴圈中持續搜尋、瀏覽資訊和推論,生成更完整的結果。