Google con inteligencia artificial en la nube

por Blogger4 de septiembre de 2023#!31Lun, 22 Jul 2024 16:14:43 +0200+02:004331#31Lun, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431 22pm31pm-31Lun, 22 Jul 2024 16:14:43 +0200+02:004Europe/Rome3131Europe/Rome2024312024Lun, 22 Jul 2024 16:14:43 +0200144147pmlunes=3816#!31Lun, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#22 de julio de 2024#!31Lun, 22 Jul 2024 16:14:43 +0200+02:004331#/31Lun, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431#!31Lun, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#No hay comentarios

Google ha dado un nuevo impulso a su oferta de infraestructura optimizada para la inteligencia artificial en la nube, presentando una nueva TPU (Tensor Processing Unit) denominada v53e y poniendo a disposición las nuevas máquinas virtuales A3, diseñadas para entrenar y ejecutar grandes modelos de IA.

TPU v5e: Eficiencia y escalabilidad

Google ha descrito el TPU v5e como el disco en la nube “más eficiente, versátil y escalable” hasta la fecha. Este TPU está optimizado para entrenamiento e inferencia en modelos medianos y grandes, ofreciendo hasta 2 veces y 2,5 veces más rendimiento de entrenamiento e inferencia por dólar que el TPU v4 anterior, lo que reduce los costos.

Los pods con TPU v5e pueden acomodar hasta 256 chips, ofreciendo un ancho de banda agregado de más de 400 Tb/s y un rendimiento INT8 de 100 petaOps. Además, la TPU v5e puede admitir hasta 8 configuraciones diferentes de máquinas virtuales, lo que permite a los clientes de Google Cloud adaptar fácilmente la infraestructura a sus necesidades.

Compatibilidad e integración

Las TPU v5e admiten de forma nativa marcos como JAX, PyTorch y TensorFlow, y se integran con herramientas de código abierto como Hugging Face's Transformers and Accelerate, PyTorch Lightning y Ray. Además, Google introdujo la tecnología Multislice, que permite el entrenamiento de modelos a gran escala aprovechando miles de TPU v5e y v4 conectados.

Nuevas máquinas virtuales A3: rendimiento mejorado

Las nuevas máquinas virtuales A3 siguen el éxito de la G2 y están optimizadas para cargas de trabajo de IA. Los A3 están equipados con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, lo que le permite gestionar modelos con billones de parámetros.

La combinación de las capacidades de la nube de Google con las GPU de NVIDIA permite un entrenamiento 3 veces más rápido y hasta 10 veces más ancho de banda de red que la generación anterior de VM. Cada VM A3 está equipada con dos procesadores Intel Xeon de cuarta generación y 2 TB de memoria de host. Además, con la tecnología NVIDIA NVLink, las nuevas máquinas virtuales ofrecen un ancho de banda biseccional de 3,6 TB/s entre las GPU.

Personalización e Innovación

Estos anuncios recientes de Google Cloud representan un paso adelante para ayudar a las empresas y a los innovadores a desarrollar y utilizar modelos de inteligencia artificial cada vez más avanzados. Los consumidores pueden beneficiarse de la posibilidad de personalizar la infraestructura en función de sus necesidades, aprovechando el potencial de la inteligencia artificial en la nube que ofrece Google.

En resumen, con las nuevas TPU v5e, las máquinas virtuales A3 y tecnologías avanzadas como Multislice, Google está redefiniendo el panorama de la inteligencia artificial en la nube, ofreciendo soluciones cada vez más escalables y de alto rendimiento para entrenar y ejecutar modelos de IA. .