Skip to main content

Gemini Deep Research

Slipp timmar av jobb med Gemini Deep Research som din personliga researchassistent
Drivs av Gemini 2.0 Flash Thinking (experimentell), nu med ljudöversikter

Vad är Deep Research?

Lär dig allt du behöver veta om nästan vad som helst med Deep Research, en agentisk funktion i Gemini. Den kan automatiskt genomsöka hundratals webbplatser åt dig, analysera det den hittar och skapa flera sidor långa, insiktsfulla rapporter som du kan omvandla till engagerande konversationer i poddstil.

Planering

Deep Research omvandlar din prompt till en skräddarsydd forskningsplan med flera punkter

Söker

Deep Research söker automatiskt igenom webben noggrant för att hitta relevant, aktuell information.

Resonemang

Medan den samlar information iterativt visar Deep Research sitt tillvägagångssätt och den analyserar varje steg innan den tar nästa

Rapporter

Deep Research ger dig omfattande, anpassade researchrapporter med mer detaljer och insikter på bara några minuter, vilket gör att du slipper timmar av jobb. Rapporten är även tillgänglig som ljudöversikt.

Så här använder du Deep Research

Gemini Deep Research är skapad för att ta sig an dina komplicerade researchuppgifter genom att dela upp dem i mindre uppgifter, utforska webben för att hitta svar och syntetisera det den hittar till mer kompletta resultat.

Med 2.0 Flash Thinking (experimentell) är Gemini nu ännu bättre på alla researchsteg, från att planera till att leverera ännu mer detaljerade och insiktsfulla rapporter. Nu kan du även omvandla rapporten till en ljudöversikt, så att du kan få koll även om du håller på med något annat.

Konkurrensanalys

Förstå konkurrenterna gällande en ny produkt, till exempel i fråga om erbjudanden, prissättning, marknadsföring och feedback från kunder.

Grundliga kontroller

Undersöka en potentiell kund samt analysera ett företags produkter, finansieringshistorik, teammiljö samt konkurrentsituation.

Ämnesförståelse

Djupdykning i ämnen genom bedömning och jämförelse av viktiga koncept, identifiera relationer mellan idéer samt förklara underliggande principer.

Produktjämförelse

Utvärdera olika modeller av en apparat baserat på funktioner, hur bra den fungerar, priset och kundrecensioner.

Detta är ett steg mot en mer agentisk AI som kan göra mer än att bara svara på enkla frågor. Den kan bli en riktigt bra samarbetspartner som kan föra komplicerade resonemang och utföra svåra uppgifter.

Testa den i dag utan kostnad.

Se hur den fungerar

Aarush Selvan är Senior Product Manager för Deep Research och går igenom den första upplevelsen med Deep Research.

Så här kommer du åt Deep Research

Testa Deep Research i dag utan kostnad

  • På datorn

  • På mobila enheter

  • I 150 länder

  • På över 45 språk

  • Och för Google Workspace-användare

Det är bara att välja Deep Research i promptfältet eller rullgardinsmenyn över modeller för att komma igång och låta Gemini göra din research åt dig.

Gemini Advanced-användare har utökad åtkomst till Deep Research.

Så byggde vi den första Deep Research

Dagen efter att vi lanserade produktkategorin Deep Research på Gemini i december 2024 samlade vi en del av teamet bakom produkten för att ha en diskussion.

Ett agentiskt system

För att bygga Deep Research utvecklade vi ett nytt planeringssystem som gör att Gemini-appen kan lösa komplexa problem. Vi tränade Gemini-modellerna att göra följande för Deep Research:

  • Dela upp problemet: När systemet får en komplex fråga från användaren formulerar det först en detaljerad researchplan, där det delar upp problemet i en rad mindre, hanterbara uppgifter. Du bestämmer över planen: Gemini presenterar den för dig och du kan finjustera den för att se till att den fokuserar på rätt områden.

  • Research: Modellen genomför planen och avgör vilka uppgifter som kan utföras samtidigt och vilka som måste utföras i följd. Modellen kan använda verktyg som sökning och surfning för att hämta information och skapa resonemang kring informationen. Modellen analyserar den tillgängliga informationen under varje steg för att avgöra vad den ska göra härnäst. Vi introducerade en resonemangspanel så att användarna kan följa vad modellen har lärt sig hittills och vad nästa steg är.

  • Syntes: När modellen avgör att den har samlat tillräckligt med information sammanfattar den sina resultat i en utförlig rapport. När Gemini skapar rapporten utvärderar den informationen kritiskt, identifierar viktiga teman och inkonsekvenser, samt strukturerar rapporten på ett logiskt och informativt sätt. Den korrekturläser till och med rapporten flera gånger för att göra den tydligare och mer detaljerad.

Ny kategori, nya problem, nya lösningar

När vi byggde Deep Research behövde vi lösa tre stora tekniska utmaningar:

Planering i flera steg

För researchuppgifter krävs iterativ planering i flera steg. Under varje steg måste modellen utgå från all information den har samlat hittills och sedan identifiera information som saknas och inkonsekvenser att utforska – samtidigt som den balanserar utförlighet mot bearbetningstiden och användarens väntetid. Genom att träna modellen att planera långsiktigt i flera steg på ett dataeffektivt sätt såg vi till att Deep Research fungerade i en öppen domänmiljö för alla ämnen.

Långsiktig härledning

En vanlig Deep Research-uppgift inkluderar många modellanrop under flera minuter. Detta skapar en utmaning: Den måste byggas på ett sätt så att den inte börjar om med uppgiften från början varje gång ett fel inträffar.

För att tackla detta utvecklade vi en ny asynkron aktivitetshanterare som skapar en delad status för planerings- och uppgiftsmodellerna. Detta möjliggör smidig felåterställning utan att hela uppgiften startas om. Systemet är verkligen asynkront: Du kan byta till en annan app eller till och med stänga av datorn efter att du har startat ett Deep Research-projekt. Nästa gång du öppnar Gemini får du en avisering när projektet är klart.

Kontexthantering

Gemini kan bearbeta hundratals sidor med innehåll under en researchsession. För att allt ska vara sammanhängande och för att möjliggöra följdfrågor använder vi Geminis branschledande kontextfönster på 1 miljon tokens tillsammans med en RAG-konfiguration. I praktiken gör detta att systemet ”kommer ihåg” allt det har lärt sig under chattsessionen, vilket gör det smartare ju längre du interagerar med det.

Drivs nu av 2.0 Flash Thinking (experimentell)

När Deep Research lanserades i december drevs den av Gemini 1.5 Pro. Med lanseringen av Gemini 2.0 Flash Thinking (experimentell) har vi kunnat göra stora förbättringar av produktens kvalitet och effektivitet. Med Thinking-modeller lägger Gemini mer tid på att planera sitt tillvägagångssätt innan den tar nästa steg. Den inbyggda förmågan att planera och analysera sitt eget arbete gör denna modell perfekt för dessa sorters långsiktiga agentiska uppgifter. Det vi ser är att Gemini nu har blivit ännu bättre på alla researchsteg och att den levererar mer detaljerade rapporter. Och tack vare Flash-modellens effektivitet kan vi även utöka åtkomsten till Deep Research till många fler användare. Vi ser fram emot att fortsätta utveckla våra Flash- och Thinking-modeller och i samband med det tror vi att Deep Research bara kommer att bli bättre.

Vad vi ska göra härnäst

Vi har byggt systemet för att vara mångsidigt så att vi kan utöka dess funktioner över tid. Framöver kommer du att kunna kontrollera var Deep Research hämtar information och ge den andra källor än den öppna webben.

Vi ser fram emot att se hur människor använder Deep Research, och dessa upplevelser kommer att spela en viktig roll i hur vi fortsätter att bygga och förbättra den. I längden vill vi skapa en sant agentisk AI-assistent som är användbar i alla situationer.

Agentiska Gemini

Resonemang
Sök
Bläddra

Geminis nya agentiska AI-system samlar det bästa av Gemini, Google Sök och webbtekniker för att söka efter, bläddra bland och analysera information i ett kontinuerligt flöde av resonemang för att få mer omfattande resultat.