Saltar al contenido principal
Noticias

Google con inteligencia artificial en la nube

por 4 de septiembre de 2023#!31Lun, 22 Jul 2024 16:14:43 +0200+02:004331#31Lun, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431 22pm31pm-31Lun, 22 Jul 2024 16:14:43 +0200+02:004Europe/Rome3131Europe/Rome2024312024Lun, 22 Jul 2024 16:14:43 +0200144147pmlunes=3816#!31Lun, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#22 de julio de 2024#!31Lun, 22 Jul 2024 16:14:43 +0200+02:004331#/31Lun, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431#!31Lun, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#No hay comentarios

Google con inteligencia artificial en la nube

Google ha dado un nuevo impulso a su oferta de infraestructura optimizada para la inteligencia artificial en la nube, presentando una nueva TPU (Tensor Processing Unit) denominada v53e y poniendo a disposición las nuevas máquinas virtuales A3, diseñadas para entrenar y ejecutar grandes modelos de IA.

TPU v5e: Eficiencia y escalabilidad

Google ha descrito la TPU v5e como la unidad de computación en la nube más eficiente, versátil y escalable hasta la fecha. Esta TPU está optimizada para el entrenamiento y la inferencia en modelos medianos y grandes, ofreciendo un rendimiento de entrenamiento e inferencia hasta 2,5 veces superior por dólar en comparación con la TPU v4 anterior, a la vez que reduce los costos.

Los pods TPU v5e admiten hasta 256 chips, lo que proporciona más de 400 Tb/s de ancho de banda agregado y 100 petaOps de rendimiento INT8. Además, TPU v5e admite hasta 8 configuraciones de máquinas virtuales diferentes, lo que permite a los clientes de Google Cloud escalar fácilmente su infraestructura según sus necesidades.

Compatibilidad e integración

Las TPU v5e admiten de forma nativa marcos como JAX, PyTorch y TensorFlow, y se integran con herramientas de código abierto como Hugging Face's Transformers and Accelerate, PyTorch Lightning y Ray. Además, Google introdujo la tecnología Multislice, que permite el entrenamiento de modelos a gran escala aprovechando miles de TPU v5e y v4 conectados.

Nuevas máquinas virtuales A3: rendimiento mejorado

Las nuevas máquinas virtuales A3 siguen el éxito de la G2 y están optimizadas para cargas de trabajo de IA. Los A3 están equipados con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, lo que le permite gestionar modelos con billones de parámetros.

La combinación de las capacidades de Google Cloud con las GPU NVIDIA permite un entrenamiento tres veces más rápido y un ancho de banda de red hasta diez veces mayor que la generación anterior de máquinas virtuales. Cada máquina virtual A3 incorpora dos procesadores Intel Xeon de 4.ª generación y 2 TB de memoria host. Además, con la tecnología NVIDIA NVLink, las nuevas máquinas virtuales ofrecen 3,6 TB/s de ancho de banda de GPU biseccional.

Personalización e Innovación

Estos recientes anuncios de Google Cloud representan un avance en el apoyo a empresas e innovadores en el desarrollo e implementación de modelos de IA cada vez más avanzados. Los consumidores pueden beneficiarse de la capacidad de adaptar su infraestructura a sus necesidades, aprovechando el poder de la IA en la nube que ofrece Google.

En resumen, con el nuevo TPU v5e, las máquinas virtuales A3 y tecnologías avanzadas como Multislice, Google está redefiniendo el panorama de la IA en la nube, ofreciendo soluciones cada vez más escalables y de alto rendimiento para entrenar y ejecutar modelos de IA de cualquier tamaño.

Dejar una respuesta