Gemini 2.0 añade capacidad de razonamiento avanzado a la era de los Agentes de IA

por Juan Antonio Soto 13/12/2024Actualizado: 24/12/2024 1

La inteligencia artificial sigue evolucionando, los lenguajes que están detrás de todas esas nuevas funciones que podemos ver gracias a la IA también avanzan para ofrecer cada vez más posibilidades. Google ha presentado Gemini 2.0, la evolución de su IA que ahora llega para adaptarse a la era de los agentes de IA. La versión 2.0 de Gemini está disponible para desarrolladores y pronto se integrará con los demás productos de Google.

Google Gemini 2.0 llega con novedades en multimodalidad, ahora es capaz de generar de forma nativa imágenes o audio, además también podrá usar herramientas de forma nativa. Estos avances se acercan a la visión de Google para crear un único asistente universal. Si bien tendremos que esperar para probar Gemini 2.0, una versión experimental Gemini 2.0 Flash estará a disposición de todos los usuarios de Gemini. También pondrán a prueba la nueva función Deep Research, que otorga capacidad avanzada para razonamiento, explorar temas complejos y crear informes incluso con temas extensos.

La búsqueda con IA también avanza, con Gemini 2.0 permitirá añadir a la búsqueda con IA capacidades de razonamiento avanzado que permitirán incluso preguntas en varios pasos, útil para resolver ecuaciones, por ejemplo. Esta nueva función ya se ha comenzado a probar de forma limitada, y espera llegar a más países para el próximo 2025.

Los avances para llegar a Gemini 2.0 han sido gracias a la experiencia durante este tiempo desarrollando Gemini 1.0, junto con un hardware dedicado como sus TPU Trillium de sexta generación. Bajo estas TPU se ha procesado todo el entrenamiento y la inferencia para Gemini 2.0.

Ya puedes probar Gemini 2.0 Flash desde la aplicación Gemini.

Con el lanzamiento de esta nueva versión de IA, el Proyecto Astra de Google también ha mejorado. Ahora podrá ofrecer mejores diálogos con posibilidad de conversar en varios idiomas e incluso mezclarlos, comprendiendo mejor las palabras que contienen acentos y las menos usadas. También puede hacer uso de herramientas como la búsqueda de Google, hacer uso de Google Lens o Maps. Se ha añadido más capacidad para memoria, capaz de recordar 10 minutos de la conversación y más conversaciones pasadas. Todo esto con una latencia reducida similar a la de una conversación entre humanos.

El Proyecto Mariner se ha construido gracias a con Gemini 2.0, que permite investigación temprana y analiza el futuro de las interacciones entre las personas y los agentes. A través del navegador es capaz de comprender los elementos que hay en pantalla como el texto, código o las imágenes y formularios y puede completar las tareas. En fase temprana, el Proyecto Mariner no es siempre preciso, pero están trabajando para aumentar su efectividad y velocidad.

Proyecto Mariner también ha sido construido para ofrecer seguridad, donde pide siempre la autorización del usuario antes de completar tareas como la compra de objetos. Por el momento se está probando en un reducido número de usuarios a través de una extensión experimental en Google Chrome.

Con esta novedad, también se han añadido avances en el mundo de los videojuegos. Gracias a Gemini 2.0 agentes te podrán ayudar a guiarte por mundos virtuales e incluso razonar sobre el juego gracias al reconocimiento de elementos en pantalla, que podrán ofrecer sugerencias para continuar. En colaboración con Supercell Google está probando el funcionamiento de estos agentes, que buscan la respuesta ante reglas y retos en los juegos como Clash of Clans o Hay Day.

Estos agentes también tienen su función en el mundo real gracias a la robótica, que llevan la capacidad de razonamiento a robots.

Unos avances que no dejan atrás la seguridad y la responsabilidad, donde se trabaja a la vez para que todas estas funciones lleguen a los usuarios de forma segura y responsable.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!