Google Gemini: El Gigante de la IA se reinventa con su modelo multimodal
En un audaz paso hacia el futuro de la inteligencia artificial, Google ha presentado su última creación: Gemini. Se trata del modelo de inteligencia artificial más grande y avanzado de la compañía hasta la fecha, prometiendo no solo competir con los modelos de IA existentes en el mercado, sino también superarlos.
Google Gemini, producto del esfuerzo conjunto de diversos equipos, se presenta en tres dimensiones fundamentales: Nano, enfocado en tareas para dispositivos móviles; Pro, diseñado para escalar una amplia gama de tareas; y Ultra, el modelo de mayor capacidad destinado a enfrentar desafíos complejos. Al igual que ChatGPT es la interfaz de GPT-4, Gemini Pro ya se integra en Bard y está disponible en México, así como en otros 170 países.
Este modelo de inteligencia artificial multimodal, según Google, marca una diferencia significativa al ser capaz de «generar y comprender, operar y combinar» una variedad de información, como texto, imágenes, audios, videos e incluso lenguajes de programación. Equivalente a GPT-4 de OpenAI, la flexibilidad de Gemini radica en su capacidad para ejecutarse en cualquier dispositivo, desde celulares hasta centros de datos, convirtiéndolo en el modelo más flexible hasta la fecha.
Gemini Ultra, la joya de la corona de esta nueva era, ha superado las expectativas en las pruebas realizadas por Google. Con un rendimiento excepcional en 30 de las 32 métricas académicas estándar de evaluación de modelos de IA, y un impresionante puntaje del 90.04% en pruebas MMLU (Massive Multitasking Languaje Understanding), Gemini Ultra no solo supera a GPT-4 y ChatGPT, sino que también se convierte en el primer modelo de IA en superar el desempeño de expertos humanos.
La característica distintiva de Gemini es su capacidad multimodal nativa, que le permite manejar simultáneamente diferentes tipos de información. A diferencia de enfoques anteriores, Gemini fue desarrollado desde cero para ser multimodal, otorgándole capacidades de última generación en todos los aspectos, según Google.
Gemini 1.0, la primera versión de esta nueva IA, ya está en despliegue en varios servicios y plataformas de Google. Bard, la herramienta de IA de la compañía, con Gemini Pro, ofrece a los usuarios en México la oportunidad de explorar las capacidades enfocadas en «tareas complejas», marcando la mayor actualización de Bard desde su lanzamiento.
También puedes leer: Cajeros automáticos: diles adiós, esto sabemos del tema – Punto MX
La expansión de Gemini no se detiene ahí. Desde el Pixel 8 Pro hasta servicios populares como el motor de búsqueda y Chrome, Google tiene planes de integrar este nuevo modelo en diversos aspectos de su ecosistema. Gemini Nano, diseñado para dispositivos móviles, debutará en el Pixel 8 Pro, ofreciendo capacidades de redacción inteligente y resúmenes de grabaciones de voz.
Mientras Gemini Ultra se espera para el 2024, Google invita a clientes, desarrolladores, socios y expertos en seguridad a experimentar con el modelo antes de su lanzamiento oficial, marcando el inicio de una nueva era para la compañía, según Sundar Pichai, CEO de Google. Con Bard Advanced también en el horizonte para el próximo año, Google se prepara para redefinir los límites de la inteligencia artificial con su ambicioso proyecto Gemini.
Con información de PuntoMx