Google con l’intelligenza artificiale in cloud
Google hat sein Angebot an für künstliche Intelligenz in der Cloud optimierter Infrastruktur weiter ausgebaut, indem es eine neue TPU (Tensor Processing Unit) namens v53e eingeführt und die neuen virtuellen A3-Maschinen zur Verfügung gestellt hat, die für das Training und den Betrieb großer KI-Modelle konzipiert sind.
TPU v5e: Efficienza e Scalabilità
La TPU v5e è stata descritta da Google come l’unità cloud “più efficiente, versatile e scalabile ad oggi”. Questa TPU è ottimizzata per l’addestramento e l’inferenza su modelli di dimensioni medie e grandi, garantendo prestazioni di addestramento e inferenza fino a 2 e 2,5 volte superiori per dollaro rispetto alla precedente TPU v4, riducendo i costi.
I pod con TPU v5e possono ospitare fino a 256 chip, offrendo una larghezza di banda aggregata di oltre 400 Tb/s e una performance INT8 di 100 petaOps. Inoltre, la TPU v5e può supportare fino a 8 configurazioni diverse di macchine virtuali, consentendo ai clienti di Google Cloud di adattare facilmente l’infrastruttura alle proprie esigenze.
Compatibilità e Integrazione
v5e-TPUs unterstützen nativ Frameworks wie JAX, PyTorch und TensorFlow und lassen sich in Open-Source-Tools wie Transformers and Accelerate von Hugging Face, PyTorch Lightning und Ray integrieren. Darüber hinaus hat Google die Multislice-Technologie eingeführt, die ein umfangreiches Modelltraining durch die Nutzung Tausender verbundener v5e- und v4-TPUs ermöglicht.
Neue virtuelle A3-Maschinen: Verbesserte Leistung
Die neuen virtuellen A3-Maschinen folgen dem Erfolg der G2 und sind für KI-Workloads optimiert. Die A3s sind mit 8 NVIDIA H100 Tensor Core GPUs mit Transformer Engine ausgestattet, sodass Sie Modelle mit Billionen Parametern verwalten können.
L’unione delle capacità del cloud Google con le GPU NVIDIA consente un addestramento 3 volte più veloce e una larghezza di banda di rete fino a 10 volte superiore rispetto alla generazione precedente di VM. Ogni VM A3 è dotata di due processori Intel Xeon di quarta generazione e 2TB di memoria host. Inoltre, grazie alla tecnologia NVIDIA NVLink, le nuove VM offrono una larghezza di banda bisezionale tra le GPU di 3,6 TB/s.
Personalisierung und Innovation
Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di intelligenza artificiale sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’intelligenza artificiale in cloud offerte da Google.
In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’intelligenza artificiale in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.