Deep Research de Gemini
Ahorra horas de trabajo gracias a Deep Research, tu asistente personal de investigación
Con la tecnología de Gemini 2.0 Flash Thinking (experimental), ahora con Resumen de Audio
¿Qué es Deep Research?
Ponte al día de cualquier tema con Deep Research, una función agente de Gemini que puede navegar automáticamente por cientos de sitios web en tu nombre, analizar la información que encuentre y crear informes reveladores de varias páginas que puedes convertir en interesantes conversaciones al estilo de un pódcast.
Planificación
Deep Research transforma tu petición en un plan de investigación personalizado de varios puntos
Búsqueda
Deep Research busca de forma autónoma y explora la Web en profundidad para encontrar información pertinente y actualizada
Razonamiento
Deep Research muestra su razonamiento mientras procesa la información recogida de forma iterativa y piensa antes de dar el siguiente paso
Informes
Deep Research permite crear informes personalizados y exhaustivos con más detalles y datos reveladores, generados en cuestión de minutos y disponibles como resúmenes de audio, lo que te ahorra horas de trabajo
Cómo usar Deep Research
Deep Research de Gemini se ha diseñado para ayudarte con tareas complejas de investigación desglosándolas, navegando por la Web para encontrar respuestas y sintetizando los hallazgos en resultados exhaustivos.
Con 2.0 Flash Thinking (experimental), Gemini mejora aún más en todas las etapas de la investigación, desde la planificación hasta la entrega de informes aún más reveladores y detallados. Ahora, también puedes convertir los informes en resúmenes de audio para enterarte de todo incluso mientras haces otras cosas.
Análisis de la competencia
Conocer el entorno de competidores de un nuevo producto, incluidas las ofertas, los precios, el marketing y las opiniones de los clientes.
Investigación previa a la firma de un contrato
Investigar una posible oportunidad de venta, analizando los productos de una empresa, su historial de financiación, su equipo y su entorno competitivo.
Comprensión de temas
Profundizar en los temas comparando y contrastando conceptos clave, identificando relaciones entre ideas y explicando principios subyacentes.
Comparativa de productos
Evaluar distintos modelos de un electrodoméstico en función de sus características, consumo, precio y reseñas de clientes.
Es un paso hacia una IA más agente que pueda hacer más que solo responder preguntas para convertirse en un verdadero colaborador capaz de pensar y ejecutar acciones complejas.
Pruébalo hoy mismo sin coste económico.
Mira cómo funciona
Aarush Selvan, responsable de producto sénior de Deep Research, explica cómo son los primeros pasos con esta función.
Cómo acceder a Deep Research
Prueba Deep Research hoy mismo sin coste económico
-
En un ordenador
-
En dispositivos móviles
-
En 150 países
-
En más de 45 idiomas
-
Y para usuarios de Google Workspace
No tienes más que elegir Deep Research en la barra de peticiones o en el selector de modelos desplegable para empezar y dejar que Gemini investigue por ti.
Los usuarios de Gemini Advanced disfrutan de acceso ampliado a Deep Research.
Cómo desarrollamos el primer Deep Research
En diciembre del 2024, al día siguiente de lanzar Deep Research como categoría de producto de Gemini, parte del equipo de desarrollo del producto se reunió para hablar.
Un sistema agente
Para crear Deep Research, desarrollamos un nuevo sistema de planificación que permite a la aplicación de Gemini resolver problemas complejos. Con este objetivo en mente, entrenamos a los modelos de Gemini para ser capaces de:
-
Desglosar el problema: cuando el usuario realiza una consulta compleja, lo primero que hace el sistema es formular un plan de investigación detallado en el que divide el problema en subtareas más pequeñas y manejables. Tú controlas el plan: Gemini te lo muestra, y tú puedes ajustarlo para asegurarte de que se centre en los puntos que te interesan.
-
Investigar: el modelo supervisa la ejecución del plan y determina de forma inteligente qué subtareas pueden llevarse a cabo al mismo tiempo y cuáles deben realizarse de forma secuencial. Puede hacer cosas como navegar por Internet para recoger información y procesarla y, en cada uno de los pasos, el modelo razona según la información disponible para decidir qué hace después. Introdujimos un panel de razonamiento para que los usuarios puedan ver qué ha aprendido el modelo hasta el momento y qué planea hacer a continuación.
-
Sintetizar: cuando el modelo considera que se ha recogido suficiente información, sintetiza los resultados en un informe exhaustivo. Al crear el informe, Gemini evalúa la información de forma crítica, identifica los temas y las incoherencias principales, y organiza el informe de forma lógica e informativa, llegando incluso a realizar varias revisiones autocríticas para mejorar la claridad y pulir los detalles.
Nuevas categorías, nuevos problemas, nuevas soluciones
Al crear Deep Research, tuvimos que resolver tres desafíos técnicos importantes:
Planificación multipaso
Las tareas de investigación requieren varios pasos de planificación iterativa. En cada uno, el modelo debe basarse en toda la información recogida hasta el momento y, luego, identificar los datos que faltan y las discrepancias que quiere explorar, todo ello buscando un equilibrio entre la exhaustividad y el tiempo de procesamiento y el que debe esperar el usuario. Entrenar el modelo para elaborar planificaciones extensas multipaso y gestionar los datos de forma eficaz nos permitió lograr que Deep Research trabajara en un entorno de dominio abierto con toda clase de temas.
Inferencia prolongada
Una tarea típica de Deep Research conlleva llamar al modelo varias veces durante varios minutos. Esto supone un reto a la hora de crear agentes, porque debe desarrollarse de forma que un único fallo no obligue a reiniciar la tarea desde cero.
Para abordar esta cuestión, desarrollamos un novedoso gestor de tareas asíncrono que conserva un estado compartido entre ambos modelos, de planificador y de tareas, lo que permite una recuperación de errores fluida sin reiniciar la tarea completa. El sistema es completamente asíncrono: te permite cambiar de aplicación o incluso apagar el ordenador después de comenzar un proyecto de Deep Research, y la próxima vez que abras Gemini, recibirás una notificación cuando la investigación esté lista.
Gestión de contexto
A lo largo de una sesión de investigación, Gemini puede llegar a procesar cientos de páginas de contenido. Para garantizar la continuidad y que se puedan hacer preguntas de seguimiento, utilizamos la ventana de contexto de 1 millón de tokens de Gemini, líder en el sector, sumada a la configuración de RAG. Es lo que permite que el sistema "recuerde" todo lo que ha ido aprendiendo a lo largo de la conversación, con lo que se va volviendo más inteligente cuanto más interactúas con él.
Ahora con la tecnología de 2.0 Flash Thinking (experimental)
Cuando lanzamos Deep Research en diciembre, contaba con la tecnología de Gemini 1.5 Pro Tras la llegada de Gemini 2.0 Flash Thinking (experimental), logramos mejorar drásticamente la calidad y la eficiencia de servicio de este producto. Gracias a los modelos de pensamiento, Gemini dedica más tiempo a planificar su enfoque antes de dar los siguientes pasos. Esta característica innata de autorreflexión y planificación es idónea para llevar a cabo tareas agentes de larga duración. Ahora vemos que Gemini ha mejorado en todas las fases de la investigación y que genera informes más detallados. Por otra parte, la eficiencia computacional del modelo Flash nos permite ampliar el acceso a Deep Research a muchos más usuarios. Es emocionante trabajar en los modelos Flash y Thinking en general, y esperamos que Deep Research siga mejorando día tras día.
¿Y ahora qué?
Hemos desarrollado el sistema con la versatilidad en mente. Así, poco a poco iremos ampliando sus posibilidades dándote a ti más control sobre lo que puede buscar y dándole al sistema acceso a fuentes más allá de la Web abierta.
Estamos deseando ver cómo usan las personas Deep Research: las experiencias reales son las que nos ayudarán a seguir desarrollando y mejorando nuestro trabajo. Al final, nuestro objetivo es ofrecer un asistente de IA completamente agente y útil en todos los sentidos.
Gemini de agentes
El nuevo sistema de IA de agentes de Gemini reúne lo mejor de Gemini, de la Búsqueda de Google y de las tecnologías web para buscar, navegar y analizar continuamente la información en un bucle de razonamiento ininterrumpido para obtener resultados más completos.