Gemini Deep Research
あなたのニーズに応えるリサーチ アシスタント、Deep Research で作業時間を短縮
Gemini 2.0 Flash Thinking(試験運用版)によって音声概要が使えるようになりました
Deep Research とは
Gemini のエージェント機能である Deep Research を利用すると、あらゆる物事について理解を深めることができます。ユーザーの代わりに数百ものウェブサイトを自動的に参照し、得られた結果を分析して、複数のページで構成される分析情報のレポートを作成してくれます。レポートはポッドキャスト形式の会話にも変換できます。
事前準備
Deep Research は入力されたプロンプトに合わせて、多角的な調査プランを作成します
検索
Deep Research はウェブ上を自動的に検索して入念に情報を参照し、関連性の高い最新情報を提示します
推論
Deep Research は、反復的に収集した情報に基づいて推論を行い、次の動作に移る前に考えながら、その思考プロセスを表示します
報告
Deep Research は、詳細情報や分析データを盛り込んだ包括的なカスタム リサーチ レポートを数分で作成します。音声概要も利用できるため、時間を大幅に節約できます
Deep Research の利用方法
Gemini Deep Research は、タスクを細分化し、ウェブを探索して答えを見つけ出し、調査結果を包括的にまとめることで、複雑な調査作業に対応できる仕組みになっています。
2.0 Flash Thinking(試験運用版)により、リサーチにおけるプランから示唆に富んだレポートの提供まで、すべての工程で Gemini がより便利になります。 レポートは音声概要に変換できるため、他の作業をしながらでも情報を入手できます。
競合分析
新製品に関する競合他社の状況(提供サービスや価格設定、マーケティング、顧客からのフィードバックなど)を把握します。
デュー デリジェンス
見込み顧客の調査、企業製品、出資 / 資金調達履歴、チームの環境および競合状況の分析を行います。
トピックの理解
重要な概念を比較して照らし合わせ、複数のアイデアの関係性を解き明かし、基本原理を明確化することで、調査対象についての理解を深めます。
製品の比較
機能や性能、価格、購入者レビューを基に製品のさまざまなモデルを評価します。
この機能は、質問に答えるだけの単純なシステムから脱却し、高度な考察能力や実行力を備えた真のコラボレーション パートナーとして、より役に立つエージェント AI に進化するための一歩です。
今すぐ無料でお試しいただけます。
動画で見る
Deep Research の使用手順について、Deep Research のシニア プロダクト マネージャーである Aarush Selvan がご紹介します。
Deep Research の利用方法
Deep Research を無料でお試しいただけます
-
パソコンで
-
モバイルで
-
150 か国で利用可能
-
45 以上の言語に対応
-
Google Workspace ユーザー向け
プロンプトバーで [Deep Research] を選択するか、プルダウンでモデルを切り替えるだけで、Gemini がリサーチを代わりに行います。
Gemini Advanced をご利用のお客様には、Deep Research の利用範囲を拡大しています。
Deep Research の開発経緯
2024 年 12 月、Gemini で Deep Research のプロダクト カテゴリが立ち上がった翌日。開発チームのメンバーが集まり、ディスカッションが行われました。
エージェント システム
Deep Research を開発するにあたって、新しいプランニング システムを構築し、Gemini アプリが複雑な問題を解決できるようにしました。Deep Research 用には、次のことができるように Gemini モデルのトレーニングを行いました。
-
問題の細分化: 複雑なユーザークエリが提示されると、システムはまず詳細なリサーチプランを策定し、問題を管理しやすい小さなサブタスクに細分化します。プランはユーザーが管理できます。Gemini が提示したプランに対して、正しい領域にしっかり焦点が合うようユーザーが修正することもできます。
-
リサーチ: モデルがプランの実行を監督し、サブタスクのうち同時に処理できるもの、順番に実行する必要があるものを適切に判断します。モデルは、検索やウェブ ブラウジングなどのツールを利用して情報を取得し、推論を行います。それぞれのステップで、モデルは利用可能な情報に基づいて推論を行い、次の動作を決定します。モデルがそれまでに学習したことや、次に行おうとしていることをユーザーが理解できるように、思考パネルを導入しました。
-
統合: 十分な情報が集まったと判断すると、モデルは調査結果を統合して包括的なレポートを作成します。レポートを作成する際、Gemini は情報を批判的に評価して主要テーマや矛盾点を特定し、論理的かつ役立つ情報を提供できるようにレポートを構成します。また、よりわかりやすく詳細な内容にするために、自己批判を複数回行います。
新しいカテゴリ、新しい問題、新しいソリューション
Deep Research を構築するにあたり、次の重要な 3 つの技術的課題に対応する必要がありました。
マルチステップのプランニング
リサーチのタスクでは、複数のステップで構成される反復的なプランニングが必要です。各ステップにおいて、モデルはそれまでに収集された情報に基づいて不足情報や調査すべき相違点を特定する必要があります。その際、包括性は計算時間やユーザーの待ち時間とトレードオフになります。マルチステップからなる長時間のプランニングに有効なモデルを、データ効率のよい方法でトレーニングする。この方法で、Deep Research をあらゆるトピックに対してオープン ドメインな環境で機能させることができるようになりました。
長時間にわたる推論
一般的な Deep Research タスクには、数分間にわたる多くのモデル呼び出しが含まれています。これがエージェントを構築する上で課題となっています。1 つのエラーでタスクを最初からやり直し、ということがないように構築する必要があるためです。
この課題に対処するため、プランナーとタスクモデル間の共有状態を維持する、新しい非同期タスク マネージャーを開発しました。これによって、タスクを最初からやり直さなくても適切にエラー回復ができるようになりました。このシステムは完全な非同期です。そのため Deep Research でプロジェクトを開始した後に他のアプリへ移動したり、PC の電源を切ったりしても、再度 Gemini に戻ればリサーチ完了時に通知を受け取ることができるのです。
コンテキスト管理
リサーチ セッションの間、Gemini は数百ページものコンテンツを処理することができます。継続性を維持し、続けて質問できるようにするために、業界トップクラスである Gemini の 100 万トークン コンテキスト ウィンドウを使用し、RAG セットアップで補完を行っています。これにより、システムはチャット セッション中に学習したすべてを効果的に「記憶する」ことができるようになり、やりとりを重ねるごとに賢くなっていくのです。
2.0 Flash Thinking(試験運用版)の搭載
12 月のリリース時、Deep Research には Gemini 1.5 Pro が利用されていました。その後 Gemini 2.0 Flash Thinking(試験運用版)を導入したことで、品質とサービング効率の両方が劇的に改善されました。Thinking モデルでは、Gemini は次のステップに進む前のアプローチをプランニングするのに、より多くの時間を必要とします。この自己反省とプランニングが持つ本質的な性質が、長時間実行されるエージェント タスクなどに適しているのです。実際、Gemini はリサーチにおけるすべての過程で便利になり、より詳細なレポートを提供できるようになりました。また、Flash モデルのコンピューティング効率によって、もっと多くのユーザーが Deep Research にアクセスできるようになります。今後も、さらなる Flash モデルや Thinking モデルの開発にご期待ください。Deep Research はこれからも進化し続けます。
今後について
このシステムは汎用的に使えるよう構築されています。将来的には、ブラウジング範囲をユーザーがより細かく指定したり、オープンウェブ以外のソースを使用したりすることで、機能はさらに拡張されるでしょう。
Deep Research をさまざまな場面でご活用ください。実際にお使いいただいた皆様からのフィードバックを、サービスの開発や改善に活かしてまいります。私たちの最終目標は、あらゆる場面で役立つエージェント AI アシスタントを実現することです。
エージェント型 Gemini
Gemini の新しいエージェント AI システムには、Google 検索、Gemini、ウェブ テクノロジーを結集した機能が統合されています。継続的な推論ループにより、情報を検索、閲覧、思考し、より包括的な回答を導き出すことができます。