Google lanza Gemma 3, una versión avanzada de sus modelos de IA de vanguardia
Google anunció el lanzamiento de Gemma 3, una colección de modelos de inteligencia artificial (IA) abiertos, ligeros y de vanguardia, diseñados para ejecutarse rápidamente en una sola unidad de procesamiento gráfico (GPU) o unidad de procesamiento tensorial (TPU), lo que facilita su implementación en entornos con recursos limitados.
Esta nueva versión representa un avance significativo respecto a su predecesora, Gemma 2, al incorporar mejoras en eficiencia, capacidad y versatilidad.
La compañía también presentó ShieldGemma 2, un potente verificador de seguridad de imágenes basado en la arquitectura de Gemma 3. Todas estas funcionalidades se engloban en lo que Google llama el «Gemmaverso», un ecosistema dinámico de modelos y herramientas basados en Gemma e impulsado por la comunidad de desarrolladores.
A continuación, bajamos a tierra todos estos conceptos de los que te estamos hablando.
Qué es Gemma 3
Gemma 3 es una familia de modelos de lenguaje de inteligencia artificial desarrollada por Google, basada en la misma tecnología que impulsa a Gemini 2.0. Estos modelos ligeros pueden ejecutarse en una amplia gama de dispositivos, desde smartphones hasta estaciones de trabajo.
Particularmente, Gemma 3 se destaca por su arquitectura optimizada que le permite manejar tareas complejas de procesamiento de lenguaje natural. Entre sus principales características destacamos:
Tamaños de modelo variados: disponible en configuraciones de 1, 4, 12 y 27 mil millones de parámetros, lo que permite a los desarrolladores seleccionar el modelo que mejor se adapte a sus necesidades específicas de hardware y rendimiento.
Multimodalidad: puede procesar entradas de texto, imágenes y vídeos cortos, lo que amplía su aplicabilidad en diversas tareas, como análisis de contenido visual y generación de descripciones.
Ampliación del contexto: ofrece una ventana de contexto de 128k tokens para permitir que sus aplicaciones procesen y comprendan grandes cantidades de información.
Soporte multilingüe: compatible con más de 140 idiomas, facilitando su uso en aplicaciones globales y en mercados diversos.
Alto rendimiento con menos requerimientos: presenta versiones cuantificadas oficiales, lo que reduce el tamaño del modelo y los requisitos computacionales al tiempo que mantiene una alta precisión.
ShieldGemma 2: seguridad avanzada para aplicaciones de imágenes
Junto con el lanzamiento de Gemma 3, Google presentó ShieldGemma 2, un potente verificador de seguridad de imágenes basado en la arquitectura de Gemma 3. Este modelo de 4 mil millones de parámetros proporciona una solución lista para usar para la detección de contenido sensible, clasificando imágenes en tres categorías: contenido peligroso, sexualmente explícito y violencia. Además, es altamente personalizable, permitiendo a los desarrolladores ajustar sus configuraciones de seguridad según las necesidades específicas de sus usuarios
Integración sencilla con herramientas populares
Tanto Gemma 3 y ShieldGemma 2 están diseñados para integrarse de manera fluida en entornos de desarrollo existentes, ofreciendo compatibilidad con diversas plataformas y frameworks de IA:
Soporta Hugging Face Transformers, Ollama, JAX, Keras, PyTorch, Google AI Edge, UnSloth, vLLM y Gemma.cpp, brindando la flexibilidad de elegir la mejor opción para cada proyecto.
Están disponibles en Google AI Studio, Kaggle y Hugging Face, lo que permite comenzar a experimentar con ellos en cuestión de segundos.
Personalización avanzada: Gemma 3 cuenta con una base de código optimizada que permite ajustes precisos y eficientes, facilitando el entrenamiento con plataformas como Google Colab, Vertex AI o incluso GPUs convencionales.
Opciones de implementación versátiles: se puede desplegar en entornos locales, Vertex AI, Cloud Run, la API de Google GenAI y otras infraestructuras en la nube.
Optimización para NVIDIA: NVIDIA ha trabajado directamente en la optimización de Gemma 3 para garantizar su máximo rendimiento en GPUs de cualquier tamaño, desde Jetson Nano hasta los últimos chips Blackwell, con disponibilidad directa en el catálogo de API de NVIDIA.
Compatibilidad con diversas arquitecturas de hardware: además de GPUs NVIDIA, Gemma 3 está optimizado para TPUs de Google Cloud y GPUs AMD mediante la pila ROCm™. Para ejecución en CPU, Gemma.cpp ofrece una solución eficiente y accesible.
El “Gemmaverso”: un ecosistema de innovación colaborativa
El Gemmaverso es un ecosistema dinámico de modelos y herramientas basados en Gemma, impulsado por la comunidad de desarrolladores. Algunos ejemplos destacados incluyen:
SEA-LION v3 de AI Singapore, que facilita la comunicación en el Sudeste Asiático, superando barreras lingüísticas.
BgGPT de INSAIT, el primer modelo de IA entrenado en búlgaro, demostrando la capacidad de Gemma para adaptarse a diversos idiomas.
OmniAudio de Nexa AI, que lleva el procesamiento de audio a los dispositivos de uso diario, ampliando el potencial de la IA en hardware accesible.
Apoyo a la investigación académica
Para fomentar el avance en inteligencia artificial, Google ha lanzado el Programa Académico Gemma 3, ofreciendo a investigadores la posibilidad de solicitar créditos en Google Cloud por un valor de $10.000 para proyectos basados en Gemma 3. El formulario de solicitud ya está disponible y permanecerá abierto por cuatro semanas en el sitio web oficial de Google.