EL GEMINI AGENT: La nueva función experimental en la app Gemini puede manejar tareas de varios pasos usando herramientas como Calendar y Gmail. Por ejemplo, puede organizar tu bandeja de entrada o investigar vuelos

Google ha lanzado su más reciente modelo de IA, Gemini 3, con el objetivo de dar vida a «cualquier idea» mediante un aumento significativo en inteligencia, razonamiento multimodal y capacidades de agente. El primer modelo disponible es Gemini 3 Pro, cuyo lanzamiento comienza hoy para la aplicación Gemini y el Modo AI. La compañía también introdujo el concepto revolucionario de Interfaces Generativas, donde la IA puede diseñar la experiencia de usuario completa en respuesta a una solicitud.

Gemini 3 Pro: rendimiento superior y conciencia contextual

Gemini 3 Pro se posiciona como el «modelo más inteligente» de Google. Ha sido diseñado para mejorar la comprensión del contexto y la intención de las peticiones, permitiendo a los usuarios obtener lo que necesitan «con menos indicaciones». Su capacidad de razonamiento es de vanguardia, superando significativamente a su predecesor (Gemini 2.5 Pro) y a la competencia en todas las pruebas principales:

  • Razonamiento a Nivel de Doctorado: Alcanzó una puntuación de 1501 en LMArena y domina en pruebas académicas complejas como GPQA Diamond (91.9%) y Humanity’s Last Examination (37.5% sin herramientas).
  • Matemáticas y Codificación: Establece un nuevo estado del arte en matemáticas con un 23.4% en MathArena Apex y supera ampliamente a otros modelos en codificación con un 76.2% en SWE-bench Verified.
  • Multimodalidad: Redefine el análisis de video e imagen con puntuaciones revolucionarias del 87.6% en Video-MMMU.

Además, Google anunció Gemini 3 Deep Think, una versión aún más avanzada que llegará en las próximas semanas para suscriptores Ultra. Este modelo logra un impresionante 93.8% en GPQA Diamond y un 45.1% en ARC-AGI, demostrando una capacidad inédita para resolver desafíos lógicos novedosos.

Llegan las Interfaces Generativas» (Gen UI)

Una innovación de Gemini 3 es su capacidad para crear Interfaces Generativas. Los Modelos de Lenguaje Grande (LLM) ya no solo generan texto; ahora diseñan y codifican experiencias de usuario completas y personalizadas en tiempo real, adaptándose a la necesidad específica del momento. Esta función se despliega como dos experimentos en la app Gemini:

  • Vista Dinámica: Gemini escribe código al instante para crear herramientas interactivas. Por ejemplo, si necesitas una calculadora hipotecaria, la IA generará una aplicación funcional donde puedes ajustar tasas de interés y pagos iniciales, o creará una simulación de física para aprender un concepto científico.
  • Diseño Visual: Para tareas de planificación, como organizar un viaje o una galería de redes sociales, Gemini crea una «vista inmersiva estilo revista». A diferencia de una lista de texto plano, la IA genera deslizadores, casillas de verificación y filtros para que el usuario pueda modificar el ritmo del viaje o el tipo de actividades visualmente.

Gemini Agent: Automatización de Tareas en el Mundo Real

Google introduce Gemini Agent dentro de su aplicación, una función experimental impulsada por el razonamiento avanzado de Gemini 3 Pro, que permite a la IA gestionar tareas de varios pasos conectándose con herramientas como Gmail, Google Calendar, Deep Research y Canvas. El Agente puede realizar tareas por el usuario como:

  • Gestión de Correo: El agente puede «organizar tu bandeja de entrada», agrupando correos relacionados en una tabla interactiva para archivar o marcar como leídos masivamente.
  • Acciones Complejas: Un ejemplo clave es la capacidad de planificar viajes con un solo comando: «Reserva un SUV de tamaño medio para mi viaje la semana que viene por menos de $80/día usando los datos de mi correo electrónico». El agente localiza los vuelos en tu Gmail, investiga alquileres dentro del presupuesto y prepara la reserva, solicitando siempre confirmación del usuario antes de realizar pagos o enviar correos.

Integración en búsqueda y Disponibilidad

Gemini 3 también llega a Google Search y al Modo AI con una técnica de «dispersión de consultas», que realiza búsquedas adicionales para plantear preguntas más matizadas y mejorar la respuesta final.

  • Disponibilidad: Gemini 3 Pro está disponible para todos los usuarios a partir de hoy en la aplicación Gemini.
  • Suscripciones: Las funciones más avanzadas, como Gemini Agent y el futuro modelo Deep Think, están reservadas inicialmente para los suscriptores del plan Google AI Ultra en Estados Unidos, que tiene un costo de $249.99 dólares al mes.

Visítanos diariamente para que no te pierdas ninguna noticia. Suscríbete al canal de YouTube donde verás El Recuento y reviews de smartphones. Además, no olvides escuchar esta misma sección a través de podcasts por Spotify.

Fuentes: 1, 2

Deja un comentario

Descubre más desde Isa Marcial

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo