Gemini Deep Research
Spóroljon meg több órányi munkát személyes asszisztense, a Deep Research segítségével,
amely mögött a Gemini 2.0 Flash Thinking (kísérleti) modell áll – most hangos áttekintéssel
Mi a Deep Research?
A Gemini ügynöki funkciója, a Deep Research segítségével felgyorsíthatja a munkáját, ez ugyanis akár több száz webhelyet is képes automatikusan átnézni Ön helyett, végiggondolni a talált információkat, és hasznos, többoldalas jelentéseket készíteni, amelyeket Ön átalakíthat lebilincselő, podcastjellegű beszélgetésekké.
Tervezés
A Deep Research az Ön utasításait egy személyre szabott, többpontos kutatási tervvé alakítja át.
Keresés
A Deep Research autonóm módon keres és a web mélyére ás, hogy releváns, naprakész információkat találjon.
Érvelés
Megismerheti a Deep Research gondolatait, ahogyan az megindokolja őket az iteráció révén gyűjtött információk alapján, és átgondolja a következő lépését.
Jelentés
A Deep Research részleteket és statisztikákat tartalmazó, átfogó és egyéni kutatási jelentéseket biztosít – akár hangos áttekintés formájában is –, amelyek percek alatt elkészülnek, így több órányi időt spórol meg Önnek.
A Deep Research használata
A Gemini Deep Research úgy lett kifejlesztve, hogy az Ön összetett kutatási feladatait lebontva, a válaszok után az interneten kutatva, a találatokat pedig átfogó eredményekké alakítva oldja meg.
A 2.0 Flash Thinking (kísérleti) modellnek köszönhetően a Gemini még jobban teljesít a kutatás összes fázisában, a tervezéstől a még alaposabb betekintést nyújtó és még részletesebb jelentések elkészítéséig. Ön most már ráadásul hangos áttekintést is készíthet a jelentésekből, hogy akkor is hozzájuthasson a kívánt információkhoz, amikor éppen egyszerre több feladaton dolgozik.
Versenyképességi elemzés
Az új termék versenytársi környezetének feltérképezése, beleértve az ajánlatokat, az árképzést, a marketinget és a vásárlói visszajelzéseket.
Átvilágítás
Egy potenciális értékesítési lead vizsgálata, a vállalat termékeinek, finanszírozási előzményeinek, csapatának és versenykörnyezetének elemzése.
Téma feltérképezése
A témák mélyére ás a kulcsfogalmak összehasonlításával és szembeállításával, az ötletek közötti kapcsolatok azonosításával és a mögöttes elvek magyarázatával.
Termék-összehasonlítás
Egy készülék különböző modelljeinek értékelése a funkciók, a teljesítmény, az ár és az ügyfélvélemények alapján.
Ez egy újabb lépés egy olyan AI-ügynök felé, amely nem pusztán megválaszolja a kérdést, hanem tényleges együttműködő partnerré válik, és képes a kifinomult gondolkodásra és végrehajtásra.
Próbálja ki még ma díjmentesen.
Tekintse meg működés közben!
Aarush Selvan, a Deep Research vezető termékmenedzsere bemutatja az első Deep Research-élményt.
A Deep Research elérése
Próbálja ki a Deep Research modellt még ma, díjmentesen
-
Asztali számítógépen
-
Mobiltelefonon
-
150 országban
-
Több mint 45 nyelven
-
Google Workspace-felhasználóként
Csak válassza ki a Deep Research lehetőséget az utasítássávon vagy a modellválasztó legördülő menüben, és a Gemini már bele is vág a kutatásba Ön helyett.
A Gemini Advanced-felhasználók szélesebb körű hozzáféréssel rendelkeznek a Deep Research funkcióhoz.
Hogyan készült az első Deep Research modell?
Amikor először bemutattuk a Deep Research termékkategóriát a Geminiben 2024 decemberében, leültünk beszélgetni a termék mögött álló csapat néhány tagjával.
Egy ügynöki rendszer
A Deep Research megalkotása érdekében egy olyan új tervezési rendszert fejlesztettünk ki, amely lehetővé teszi összetett problémák kezelését a Gemini app számára. A Deep Research esetében úgy tanítottuk a Gemini-modelleket, hogy képesek legyenek a következőkre:
-
A probléma felbontása: Amikor összetett felhasználói lekérdezést kap, a rendszer először összeállít egy részletes kutatási tervet úgy, hogy a problémát kisebb és könnyebben kezelhető részfeladatokra szedi szét. A terv az Ön irányítása alatt áll: a Gemini megmutatja, Ön pedig finomíthatja, hogy biztosan a megfelelő területekre fókuszáljon.
-
Kutatás: A modell felügyeli a terv végrehajtását, és intelligensen megállapítja, hogy mely részfeladatokat lehet egyszerre menedzselni, és melyeket kell egymás után elvégezni. A modell egyebek mellett keresés és webes böngészés segítségével gyűjtheti és gondolhatja végig az információkat. Mindegyik lépésnél átgondolja a rendelkezésre álló információkat, hogy eldöntse, mi legyen a következő cselekvés. Bevezettük a gondolatmenetet bemutató panelt, ahol a felhasználók nyomon követhetik, hogy a modell mit talált eddig, illetve mit szándékozik tenni a következő lépésben.
-
Összegzés: Amikor a modell úgy dönt, hogy elég információt gyűjtött össze, akkor a talált ismereteket összefoglalja egy átfogó jelentésben. A jelentés összeállításakor a Gemini kritikusan kiértékeli az információkat, azonosítja a fontosabb témákat és következetlenségeket, logikus és informatív módon kialakítja a jelentés struktúráját, és még több önkritikus lépést is elvégez, hogy minél egyértelműbb és részletesebb eredményt biztosíthasson.
Új kategória, új problémák, új megoldások
A Deep Research elkészítésekor három jelentős technológiai kihívással kellett megbirkóznunk:
Többlépéses tervezés
A kutatási feladatoknál többlépéses iteratív tervezésre van szükség. A modellnek minden lépésnél alá kell támasztania az addig összegyűjtött információkat, majd ki kell találnia, hogy milyen hiányzó információkra és ellentmondásokra kell még fókuszálnia – miközben meg kell találnia az egyensúlyt a minden részletre kiterjedő kutatási idő, valamint a számítási és a felhasználói várakozási idő között. Mivel a modellt úgy tanítottuk, hogy adathatékony módon legyen képes a hosszabb, több lépésből álló tervezésre, el tudtuk érni, hogy a Deep Research bármilyen témakört tekintve működjön (ezt „open domain” rendszernek nevezik).
Hosszú levezetések
Egy átlagos Deep Research-feladat során számos modellhívás történik több percen át. Ez azért jelent kihívást az ügynökök létrehozásakor, mert úgy kell kialakítani őket, hogy egyetlen hiba miatt ne kelljen az egész feladatot elölről kezdeni.
Ennek a kihívásnak a kezelése érdekében egy olyan újszerű, aszinkron feladatkezelőt fejlesztettünk, amely megosztott állapotot tart fenn a tervezési és a feladatmodell között, ami megengedőbb hiba utáni helyreállítást tesz lehetővé a teljes feladat újrakezdése nélkül. Ez a rendszer ténylegesen aszinkron módon működik: egy Deep Research-projekt elindítása után Ön átválthat egy másik alkalmazásra, vagy akár ki is kapcsolhatja a számítógépét, és amikor legközelebb újra felkeresi a Geminit, értesítést fog kapni arról, hogy befejeződött a kutatás.
Kontextuskezelés
Egy adott kutatási munkamenet során a Gemini akár több száz oldalnyi tartalmat is feldolgozhat. A folytonosság fenntartása és kiegészítő kérdések feltételének lehetővé tétele érdekében a Gemininek az ágazatban egyedülálló, egymillió tokenes kontextusablakát RAG (Retrieval-Augmented Generation, azaz adatlekérésre alapozott generálás) módszerrel kiegészítve használjuk. Ez lényegében lehetővé teszi a rendszer számára, hogy „emlékezzen” mindenre, amit az adott csevegési munkamenet során megtanult, így minél hosszabban végeznek vele interakciókat, annál okosabb lesz.
Most már a 2.0 Flash Thinking (kísérleti) modellen alapul
Amikor decemberben elindítottuk a Deep Research funkciót, akkor még a Gemini 1.5 Pro modellen alapult. A Gemini 2.0 Flash Thinking (kísérleti) modell bevezetésével jelentős mértékben növelni tudtuk mind a termék minőségét, mind a kiszolgálási hatékonyságát. A Thinking modelleknek köszönhetően a Gemini több időt szán a megközelítése megtervezésére, mielőtt belefogna a következő lépésbe. Ez az alapból meglévő önreflektív és tervező jelleg kiválóan alkalmassá teszi az ilyen hosszan futó ügynöki feladatok elvégzésére. Tapasztalataink alapján a Gemini most még jobban teljesít a kutatás minden fázisában, és részletesebb jelentéseket biztosít. Ugyanakkor a Flash modell számítási hatékonyságának köszönhetően jóval több felhasználónak tudunk hozzáférést biztosítani a Deep Research-höz. Nagyon izgatottak vagyunk a Flash és a Thinking modell általános fejlesztését illetően, és arra számítunk, hogy a Deep Research idővel egyre jobb és jobb lesz.
Mi a következő lépés?
A rendszert úgy alakítottuk ki, hogy sokoldalú legyen, ezért később ki tudjuk bővíteni a képességeit, hogy nagyobb irányítást adjunk az Ön kezébe annak tekintetében, hogy hol böngésszen, valamint hogy képes legyen a nyílt interneten nem megtalálható források között is keresni.
Kíváncsian várjuk, hogy az emberek hogyan fogják használni a Deep Research funkciót, és a valós felhasználásból származó tapasztalatok segíteni fognak nekünk annak eldöntésében, hogyan fejlesszük tovább a Deep Research-öt. A végső célunk az, hogy egy ténylegesen ügynöki jellegű és általánosan hasznos AI-alapú asszisztens legyen belőle.
Agentikus Gemini
A Gemini új AI-ügynök-rendszere egyesíti a Gemini, a Google Kereső és a webes technológiák legjobb tulajdonságait, hogy képes legyen folyamatosan keresni és böngészni az információk között, illetve egy folyamatos érvelési ciklusban átgondolni őket az átfogóbb eredmények érdekében.