Skip to main content

Gemini Deep Research

Zaoszczędź godziny pracy dzięki własnemu asystentowi badawczemu
Deep Research wykorzystuje model Gemini 2.0 Flash Thinking (wersja eksperymentalna) i obsługuje podsumowania audio

Czym jest Deep Research

Deep Research to funkcja agentowa dostępna w Gemini, która pomoże Ci szybko znaleźć potrzebne informacje. Może ona automatycznie przejrzeć setki stron internetowych i przeanalizować znalezione dane, aby w kilka minut wygenerować rozbudowane raporty na dowolny temat. Raporty te możesz następnie przekształcić w interesujące podcastowe dyskusje.

Planowanie

Deep Research zmienia prompty w spersonalizowane, wielopunktowe plany badawcze

Szukanie

Deep Research samodzielnie wyszukuje i przegląda strony internetowe, aby znaleźć potrzebne i aktualne informacje

Rozumowanie

Deep Research pokazuje przebieg swojej analizy informacji oraz dokładnie planuje następne kroki.

Raportowanie

Deep Research tworzy rozbudowane raporty badawcze (także w postaci podsumowań audio) zawierające więcej szczegółów i wniosków, a przy tym generuje je w kilka minut, oszczędzając Ci godzin pracy.

Jak korzystać z Deep Research

Gemini Deep Research upraszcza wykonywanie skomplikowanych zadań badawczych – rozbija problem na czynniki pierwsze, przeszukuje internet w poszukiwaniu odpowiedzi i wyciąga rozbudowane wyniki na podstawie zebranych danych.

Dzięki modelowi 2.0 Flash Thinking (wersja eksperymentalna) Gemini jeszcze lepiej radzi sobie ze wszystkimi etapami projektu badawczego, od jego planowania po tworzenie wnikliwych i szczegółowych raportów. Raporty można teraz przekształcić w podsumowania audio, które możesz łatwo odsłuchać podczas wykonywania innych zadań.

Analiza konkurencji

Wprowadzasz nowy produkt? Poznaj swoich konkurentów, dowiedz się więcej o ich ofercie, cenach, marketingu i opiniach klientów.

Due diligence

Sprawdź możliwości potencjalnej sprzedaży, zbadaj produkty wybranej firmy, przeanalizuj historię jej finansowania, skład zespołu lub konkurencję.

Analiza tematu

Zbadaj szczegółowo dowolny temat, porównując i zestawiając najważniejsze pojęcia, odnajdując powiązania i wyjaśniając podstawowe zasady.

Porównanie produktów

Oceń różne modele urządzenia pod względem jego funkcji, wydajności, ceny i opinii klientów.

Deep Research to kolejny etap rozwoju naszej agentowej AI. Pomaga rozwiązywać realne problemy, a nie tylko odpowiada na pytania – może być prawdziwym partnerem w analizie skomplikowanych informacji i wyciąganiu przydatnych wniosków.

Wypróbuj bezpłatnie już dziś

Zobacz, jak to działa

Aarush Selvan, Senior Product Manager w zespole Deep Research, opowiada, jak działa ta funkcja.

Jak korzystać z Deep Research

Wypróbuj Deep Research bezpłatnie już dziś

  • Na komputerze

  • Na komórce

  • W 150 krajach

  • W ponad 45 językach

  • Również jeśli jesteś użytkownikiem Google Workspace

Aby rozpocząć, wybierz Deep Research na pasku prompta lub w menu modeli i pozwól Gemini znaleźć wszystkie potrzebne informacje.

Użytkownicy Gemini Advanced mają rozszerzony dostęp do Deep Research.

Jak powstała pierwsza wersja Deep Research

Dzień po tym, jak w grudniu 2024 roku zapowiedzieliśmy wprowadzenie Deep Research w Gemini, zaprosiliśmy nasz zespół zajmujący się tą funkcją na krótką rozmowę.

System agentowy

W ramach prac nad Deep Research stworzyliśmy nowy system planowania, który pozwala aplikacji Gemini rozwiązywać złożone problemy. Na potrzeby tej funkcji wytrenowaliśmy modele Gemini, aby mogły wykonywać te zadania:

  • Analiza problemu: gdy użytkownik zadaje złożone pytanie, system najpierw tworzy szczegółowy plan badawczy i dzieli problem na serię mniejszych podzadań, którymi łatwiej jest zarządzać. Użytkownik ma pełną kontrolę nad całym zadaniem. Gemini wyświetla plan, aby można go było dostosować do swoich potrzeb i upewnić się, że obejmuje odpowiednie tematy.

  • Wyszukiwanie informacji: model nadzoruje realizację planu i w inteligentny sposób określa, które podzadania można przeprowadzać jednocześnie, a które wymagają wykonania po kolei. Do gromadzenia i analizowania informacji model korzysta z takich narzędzi jak wyszukiwarka i przeglądarka. Na każdym etapie wyciąga wnioski z dostępnych danych, aby określić swój następny krok. Deep Research pokazuje przebieg rozumowania, aby użytkownik wiedział, co model zdołał już ustalić i co zamierza zrobić w następnej kolejności.

  • Wnioski: gdy model uzna, że zebrał wystarczająco dużo informacji, tworzy na ich podstawie szczegółowy raport końcowy. Gemini analizuje dane w krytyczny sposób, rozpoznaje najważniejsze zagadnienia, wskazuje niespójności oraz przedstawia raport w logicznym i przejrzystym formacie. Kilkakrotnie sprawdza nawet swoje własne wnioski, aby upewnić się, że są one jasne i szczegółowe.

Nowa funkcja, nowe problemy, nowe rozwiązania

Podczas prac nad Deep Research stanęliśmy przed 3 głównymi wyzwaniami:

Planowanie wieloetapowe

Zadania badawcze wymagają wielu etapów iteracyjnego planowania. Na każdym etapie model musi ocenić zgromadzone do tej pory informacje, a następnie określić, czego mu brakuje, i zbadać ewentualne rozbieżności. Konieczne jest przy tym znalezienie złotego środka między zakresem zbieranych danych a obciążeniem systemów obliczeniowych i czasem oczekiwania na odpowiedź. Dzięki temu, że model został wytrenowany pod kątem skutecznego tworzenia długich planów obejmujących wiele etapów i jednoczesnego efektywnego wykorzystania danych, Deep Research może działać „z otwartą głową” i badać dowolne tematy.

Długotrwałe wnioskowanie

Podczas typowego zadania Deep Research wielokrotnie wywołuje model w czasie kilku minut. Wiąże się z tym wyzwanie dotyczące tworzenia agentów – muszą one mieć taką postać, żeby pojedynczy błąd nie oznaczał konieczności zaczynania wszystkiego od nowa.

W tym celu opracowaliśmy innowacyjnego menedżera zadań, który działa asynchronicznie, przekazując funkcji planowania i modelom zadań jednolite informacje o stanie. Pozwala to na płynne odzyskiwanie danych po wystąpieniu błędu bez konieczności restartowania całego zadania. System działa w pełni asynchronicznie – po rozpoczęciu projektu w Deep Research można przełączyć się na inną aplikację, a nawet faktycznie wyłączyć komputer. Przy następnym otwarciu Gemini pojawi się powiadomienie, że badanie zostało ukończone.

Zarządzanie kontekstem

W trakcie jednej sesji badawczej Gemini może przetworzyć zawartość setek stron. Aby zapewnić ciągłość dostępu do informacji i umożliwić zadawanie dalszych pytań, wykorzystujemy czołowe w branży rozwiązanie Gemini, jakim jest okno kontekstu z milionem tokenów, oraz dodatkowy moduł RAG. Dzięki temu system może „zapamiętać” wszystkie informacje przekazane mu podczas sesji czatu i działa tym inteligentniej, im dłużej użytkownik z nim rozmawia.

Możliwości modelu 2.0 Flash Thinking (wersja eksperymentalna)

W momencie swojej premiery w grudniu 2024 r. funkcja Deep Research opierała się na modelu Gemini 1.5 Pro. Wraz z wprowadzeniem wersji eksperymentalnej modelu Gemini 2.0 Flash Thinking mogliśmy znacząco poprawić zarówno jakość działania tej usługi, jak i jej wydajność. Podczas korzystania z modeli Thinking Gemini przeznacza więcej czasu na zaplanowanie całego zadania, zanim przejdzie do następnych kroków. Taka natywna skłonność do autorefleksji i planowania sprawia, że Gemini świetnie sprawdza się w dłuższych zadaniach agentowych. Zauważamy, że dziś jeszcze lepiej radzi sobie ze wszystkimi etapami badań i generuje jeszcze bardziej szczegółowe raporty. Jednocześnie dzięki wydajności obliczeniowej modelu Flash możemy udostępnić Deep Research znacznie szerszemu gronu użytkowników. Oczywiście dalej będziemy rozwijać nasze modele Flash i Thinking oraz spodziewamy się, że Deep Research będzie działać coraz lepiej.

Co dalej?

Tworzymy nasz system z myślą o uniwersalności. Chcemy, żeby z czasem użytkownicy mieli więcej kontroli nad tym, jakie treści przegląda Deep Research. Planujemy też udostępnić tej funkcji źródła wykraczające poza ogólnodostępny internet.

Bardzo cieszy nas ciepłe przyjęcie Deep Research wśród użytkowników. Dzięki ich opiniom i wrażeniom będziemy lepiej wiedzieli, jak chcemy rozwijać i ulepszać tę funkcję. Zależy nam przede wszystkim na stworzeniu w pełni agentowego i wszechstronnie pomocnego asystenta AI.

Agentyczny Gemini

Rozumowanie
Szukanie
Przeglądanie

Nowy, agentowy system AI w Gemini łączy najlepsze funkcje Gemini, wyszukiwarki Google i technologii internetowych. Może wyszukiwać informacje, przeglądać strony i wyciągać wnioski w ramach jednej, ciągłej pętli rozumowania.