Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyse the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customised advertisements based on the pages you visited previously and to analyse the effectiveness of the ad campaigns.

No cookies to display.

Skip to main content
news

Google with artificial intelligence in the cloud

by 4 September 2023#!31Mon, 22 Jul 2024 16:14:43 +0200+02:004331#31Mon, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431 22pm31pm-31Mon, 22 Jul 2024 16:14:43 +0200+02:004Europe/Rome3131Europe/Rome2024312024Mon, 22 Jul 2024 16:14:43 +0200144147pmMonday=4159#!31Mon, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#July 22nd, 2024#!31Mon, 22 Jul 2024 16:14:43 +0200+02:004331#/31Mon, 22 Jul 2024 16:14:43 +0200+02:00-4Europe/Rome3131Europe/Rome202431#!31Mon, 22 Jul 2024 16:14:43 +0200+02:00Europe/Rome7#No Comments

Google with artificial intelligence in the cloud

Google ha dato un ulteriore impulso alla sua offerta di infrastruttura ottimizzata per l’intelligenza artificiale in cloud, introducendo una nuova TPU (Tensor Processing Unit) denominata v53e e rendendo disponibili le nuove macchine virtuali A3, progettate per l’addestramento e l’esecuzione di modelli di intelligenza artificiale di grandi dimensioni.

TPU v5e: Efficienza e Scalabilità

La TPU v5e è stata descritta da Google come l’unità cloud “più efficiente, versatile e scalabile ad oggi”. Questa TPU è ottimizzata per l’addestramento e l’inferenza su modelli di dimensioni medie e grandi, garantendo prestazioni di addestramento e inferenza fino a 2 e 2,5 volte superiori per dollaro rispetto alla precedente TPU v4, riducendo i costi.

I pod con TPU v5e possono ospitare fino a 256 chip, offrendo una larghezza di banda aggregata di oltre 400 Tb/s e una performance INT8 di 100 petaOps. Inoltre, la TPU v5e può supportare fino a 8 configurazioni diverse di macchine virtuali, consentendo ai clienti di Google Cloud di adattare facilmente l’infrastruttura alle proprie esigenze.

Compatibilità e Integrazione

Le TPU v5e supportano nativamente framework come JAX, PyTorch e TensorFlow, e si integrano con strumenti open-source come Transformers e Accelerate di Hugging Face, PyTorch Lightning e Ray. Inoltre, Google ha introdotto la tecnologia Multislice, che consente il training su larga scala di modelli sfruttando migliaia di TPU v5e e v4 connessi tra loro.

Nuove Macchine Virtuali A3: Prestazioni Potenziate

Le nuove macchine virtuali A3 seguono il successo delle G2 e sono ottimizzate per i carichi di lavoro di intelligenza artificiale. Le A3 sono equipaggiate con 8 GPU NVIDIA H100 Tensor Core con Transformer Engine, permettendo di gestire modelli con trilioni di parametri.

L’unione delle capacità del cloud Google con le GPU NVIDIA consente un addestramento 3 volte più veloce e una larghezza di banda di rete fino a 10 volte superiore rispetto alla generazione precedente di VM. Ogni VM A3 è dotata di due processori Intel Xeon di quarta generazione e 2TB di memoria host. Inoltre, grazie alla tecnologia NVIDIA NVLink, le nuove VM offrono una larghezza di banda bisezionale tra le GPU di 3,6 TB/s.

Personalizzazione e Innovazione

Questi recenti annunci di Google Cloud rappresentano un passo avanti nel supporto alle imprese e agli innovatori nell’ambito dello sviluppo e dell’utilizzo di modelli di intelligenza artificiale sempre più avanzati. I consumatori possono beneficiare della possibilità di personalizzare l’infrastruttura in base alle proprie esigenze, sfruttando le potenzialità dell’intelligenza artificiale in cloud offerte da Google.

In sintesi, con la nuova TPU v5e, le macchine virtuali A3 e le tecnologie avanzate come Multislice, Google sta ridefinendo il panorama dell’intelligenza artificiale in cloud, offrendo soluzioni sempre più performanti e scalabili per l’addestramento e l’esecuzione di modelli di IA di qualsiasi dimensione.

Leave a Reply