Google con l’inteligencia artificial in cloud
Google ha dato un ulteriore impulso alla sua offerta di infrastruttura ottimizzata per l’inteligencia artificial in cloud, introducendo una nuova TPU (Tensor Processing Unit) denominata v53e e rendendo disponibili le nuove macchine virtuali A3, progettate per l’addestramento e l’esecuzione di modelli di inteligencia artificial di grandi dimensioni.
TPU v5e: Eficiencia y escalabilidad
Google ha descrito el TPU v5e como el disco en la nube “más eficiente, versátil y escalable” hasta la fecha. Este TPU está optimizado para entrenamiento e inferencia en modelos medianos y grandes, ofreciendo hasta 2 veces y 2,5 veces más rendimiento de entrenamiento e inferencia por dólar que el TPU v4 anterior, lo que reduce los costos.
Los pods con TPU v5e pueden acomodar hasta 256 chips, ofreciendo un ancho de banda agregado de más de 400 Tb/s y un rendimiento INT8 de 100 petaOps. Además, la TPU v5e puede admitir hasta 8 configuraciones diferentes de máquinas virtuales, lo que permite a los clientes de Google Cloud adaptar fácilmente la infraestructura a sus necesidades.
Compatibilidad e integración
Las TPU v5e admiten de forma nativa marcos como JAX, PyTorch y TensorFlow, y se integran con herramientas de código abierto como Hugging Face's Transformers and Accelerate, PyTorch Lightning y Ray. Además, Google introdujo la tecnología Multislice, que permite el entrenamiento de modelos a gran escala aprovechando miles de TPU v5e y v4 conectados.
Nuevas máquinas virtuales A3: rendimiento mejorado
Le nuove macchine virtuali A3 seguono il successo delle G2 e sono ottimizzate per i carichi di lavoro di inteligencia artificial. Le A3 sono equipaggiate con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, permettendo di gestire modelli con trilioni di parametri.
La combinación de las capacidades de la nube de Google con las GPU de NVIDIA permite un entrenamiento 3 veces más rápido y hasta 10 veces más ancho de banda de red que la generación anterior de VM. Cada VM A3 está equipada con dos procesadores Intel Xeon de cuarta generación y 2 TB de memoria de host. Además, con la tecnología NVIDIA NVLink, las nuevas máquinas virtuales ofrecen un ancho de banda biseccional de 3,6 TB/s entre las GPU.
Personalización e Innovación
Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di inteligencia artificial sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’inteligencia artificial in cloud offerte da Google.
In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’inteligencia artificial in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.