Google con l’intelligence artificielle in cloud
Google ha dato un ulteriore impulso alla sua offerta di infrastruttura ottimizzata per l’intelligence artificielle in cloud, introducendo una nuova TPU (Tensor Processing Unit) denominata v53e e rendendo disponibili le nuove macchine virtuali A3, progettate per l’addestramento e l’esecuzione di modelli di intelligence artificielle di grandi dimensioni.
TPU v5e : efficacité et évolutivité
Le TPU v5e a été décrit par Google comme le disque cloud « le plus efficace, le plus polyvalent et le plus évolutif » à ce jour. Ce TPU est optimisé pour la formation et l'inférence sur des modèles moyens et grands, offrant jusqu'à 2 fois et 2,5 fois plus de performances de formation et d'inférence par dollar que le précédent TPU v4, réduisant ainsi les coûts.
Les pods avec v5e TPU peuvent accueillir jusqu'à 256 puces, offrant une bande passante globale de plus de 400 Tb/s et des performances INT8 de 100 pétaOps. De plus, le TPU v5e peut prendre en charge jusqu'à 8 configurations de machines virtuelles différentes, permettant aux clients Google Cloud d'adapter facilement l'infrastructure à leurs besoins.
Compatibilité et intégration
Les TPU v5e prennent en charge nativement des frameworks tels que JAX, PyTorch et TensorFlow, et s'intègrent à des outils open source tels que Transformers et Accelerate de Hugging Face, PyTorch Lightning et Ray. De plus, Google a introduit la technologie Multislice, qui permet la formation de modèles à grande échelle en exploitant des milliers de TPU v5e et v4 connectés.
Nouvelles machines virtuelles A3 : performances améliorées
Le nuove macchine virtuali A3 seguono il successo delle G2 e sono ottimizzate per i carichi di lavoro di intelligence artificielle. Le A3 sono equipaggiate con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, permettendo di gestire modelli con trilioni di parametri.
La combinaison des capacités du cloud Google avec les GPU NVIDIA permet une formation 3 fois plus rapide et une bande passante réseau jusqu'à 10 fois supérieure à celle de la génération précédente de VM. Chaque VM A3 est équipée de deux processeurs Intel Xeon de 4e génération et de 2 To de mémoire hôte. De plus, grâce à la technologie NVIDIA NVLink, les nouvelles machines virtuelles offrent une bande passante bissectionnelle de 3,6 To/s entre les GPU.
Personnalisation et innovation
Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di intelligence artificielle sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’intelligence artificielle in cloud offerte da Google.
In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’intelligence artificielle in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.