Google con l’intelligenza artificiale in cloud
Google a encore renforcé son offre d'infrastructures optimisées pour l'intelligence artificielle dans le cloud, en introduisant un nouveau TPU (Tensor Processing Unit) appelé v53e et en mettant à disposition les nouvelles machines virtuelles A3, conçues pour entraîner et exécuter de grands modèles d'IA.
TPU v5e: Efficienza e Scalabilità
La TPU v5e è stata descritta da Google come l’unità cloud “più efficiente, versatile e scalabile ad oggi”. Questa TPU è ottimizzata per l’addestramento e l’inferenza su modelli di dimensioni medie e grandi, garantendo prestazioni di addestramento e inferenza fino a 2 e 2,5 volte superiori per dollaro rispetto alla precedente TPU v4, riducendo i costi.
I pod con TPU v5e possono ospitare fino a 256 chip, offrendo una larghezza di banda aggregata di oltre 400 Tb/s e una performance INT8 di 100 petaOps. Inoltre, la TPU v5e può supportare fino a 8 configurazioni diverse di macchine virtuali, consentendo ai clienti di Google Cloud di adattare facilmente l’infrastruttura alle proprie esigenze.
Compatibilità e Integrazione
Les TPU v5e prennent en charge nativement des frameworks tels que JAX, PyTorch et TensorFlow, et s'intègrent à des outils open source tels que Transformers et Accelerate de Hugging Face, PyTorch Lightning et Ray. De plus, Google a introduit la technologie Multislice, qui permet la formation de modèles à grande échelle en exploitant des milliers de TPU v5e et v4 connectés.
Nouvelles machines virtuelles A3 : performances améliorées
Les nouvelles machines virtuelles A3 suivent le succès du G2 et sont optimisées pour les charges de travail d'IA. Les A3 sont équipés de 8 GPU NVIDIA H100 Tensor Core avec Transformer Engine, vous permettant de gérer des modèles avec des milliards de paramètres.
L’unione delle capacità del cloud Google con le GPU NVIDIA consente un addestramento 3 volte più veloce e una larghezza di banda di rete fino a 10 volte superiore rispetto alla generazione precedente di VM. Ogni VM A3 è dotata di due processori Intel Xeon di quarta generazione e 2TB di memoria host. Inoltre, grazie alla tecnologia NVIDIA NVLink, le nuove VM offrono una larghezza di banda bisezionale tra le GPU di 3,6 TB/s.
Personnalisation et innovation
Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di intelligenza artificiale sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’intelligenza artificiale in cloud offerte da Google.
In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’intelligenza artificiale in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.