Google con l’intelligenza artificiale in cloud

Google ha dato un ulteriore impulso alla sua offerta di infrastruttura ottimizzata per l’intelligenza artificiale in cloud, introducendo una nuova TPU (Tensor Processing Unit) denominata v53e e rendendo disponibili le nuove macchine virtuali A3, progettate per l’addestramento e l’esecuzione di modelli di intelligenza artificiale di grandi dimensioni.

TPU v5e: Efficienza e Scalabilità

La TPU v5e è stata descritta da Google come l’unità cloud “più efficiente, versatile e scalabile ad oggi”. Questa TPU è ottimizzata per l’addestramento e l’inferenza su modelli di dimensioni medie e grandi, garantendo prestazioni di addestramento e inferenza fino a 2 e 2,5 volte superiori per dollaro rispetto alla precedente TPU v4, riducendo i costi.

I pod con TPU v5e possono ospitare fino a 256 chip, offrendo una larghezza di banda aggregata di oltre 400 Tb/s e una performance INT8 di 100 petaOps. Inoltre, la TPU v5e può supportare fino a 8 configurazioni diverse di macchine virtuali, consentendo ai clienti di Google Cloud di adattare facilmente l’infrastruttura alle proprie esigenze.

Compatibilità e Integrazione

Le TPU v5e supportano nativamente framework come JAX, PyTorch e TensorFlow, e si integrano con strumenti open-source come Transformers e Accelerate di Hugging Face, PyTorch Lightning e Ray. Inoltre, Google ha introdotto la tecnologia Multislice, che consente il training su larga scala di modelli sfruttando migliaia di TPU v5e e v4 connessi tra loro.

Nuove Macchine Virtuali A3: Prestazioni Potenziate

Le nuove macchine virtuali A3 seguono il successo delle G2 e sono ottimizzate per i carichi di lavoro di intelligenza artificiale. Le A3 sono equipaggiate con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, permettendo di gestire modelli con trilioni di parametri.

L’unione delle capacità del cloud Google con le GPU NVIDIA consente un addestramento 3 volte più veloce e una larghezza di banda di rete fino a 10 volte superiore rispetto alla generazione precedente di VM. Ogni VM A3 è dotata di due processori Intel Xeon di quarta generazione e 2TB di memoria host. Inoltre, grazie alla tecnologia NVIDIA NVLink, le nuove VM offrono una larghezza di banda bisezionale tra le GPU di 3,6 TB/s.

Personalizzazione e Innovazione

Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di intelligenza artificiale sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’intelligenza artificiale in cloud offerte da Google.

In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’intelligenza artificiale in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.