Google com inteligência artificial na nuvem

por Blogger4 de setembro de 2023#!31Seg, 22 Jul 2024 16:14:43 +0200+02:004331#31Seg, 22 Jul 2024 16:14:43 +0200+02:00-4Europa/Roma3131Europa/Roma202431 22h31-31Set, 22 Jul 2024 16:14:43 +0200+02:004Europa/Roma3131Europa/Roma2024312024Set, 22 Jul 2024 16:14:43 +0200144147pmSegunda-feira=3831#!31Set, 22 Jul 2024 16:14:43 +0200+02:00Europa/Roma7#22 de julho de 2024#!31Seg, 22 Jul 2024 16:14:43 +0200+02:004331#/31Seg, 22 Jul 2024 16:14:43 +0200+02:00-4Europa/Roma3131Europa/Roma202431#!31Set, 22 Jul 2024 16:14:43 +0200+02:00Europa/Roma7#Sem comentarios

O Google aprimorou ainda mais suas ofertas de infraestrutura otimizada para IA na nuvem, introduzindo uma nova Unidade de Processamento Tensor (TPU) chamada v53e e disponibilizando novas máquinas virtuais A3, projetadas para treinar e executar grandes modelos de IA.

TPU v5e: Eficiência e Escalabilidade

A TPU v5e foi descrita pelo Google como a "unidade de computação em nuvem mais eficiente, versátil e escalável até o momento". Esta TPU é otimizada para treinamento e inferência em modelos de médio e grande porte, oferecendo desempenho de treinamento e inferência até 2x e 2,5x maior por dólar em comparação à TPU v4 anterior, além de reduzir custos.

Os pods TPU v5e podem acomodar até 256 chips, fornecendo mais de 400 Tb/s de largura de banda agregada e 100 petaOps de desempenho INT8. Além disso, o TPU v5e suporta até 8 configurações diferentes de máquinas virtuais, permitindo que os clientes do Google Cloud dimensionem facilmente sua infraestrutura de acordo com suas necessidades.

Compatibilidade e Integração

As TPUs v5e oferecem suporte nativo a frameworks como JAX, PyTorch e TensorFlow e integram-se a ferramentas de código aberto como Transformers e Accelerate by Hugging Face, PyTorch Lightning e Ray. O Google também introduziu a tecnologia Multislice, que permite o treinamento de modelos em larga escala, aproveitando milhares de TPUs v5e e v4 interconectadas.

Novas máquinas virtuais A3: desempenho aprimorado

As novas máquinas virtuais A3 seguem o sucesso do G2 e são otimizadas para cargas de trabalho de IA. As A3s são equipadas com oito GPUs NVIDIA H100 Tensor Core com Transformer Engines, permitindo a execução de modelos com trilhões de parâmetros.

A combinação dos recursos do Google Cloud com GPUs NVIDIA permite treinamento 3x mais rápido e até 10x mais largura de banda de rede do que a geração anterior de VMs. Cada VM A3 possui dois processadores Intel Xeon de 4ª geração e 2 TB de memória host. Além disso, com a tecnologia NVIDIA NVLink, as novas VMs oferecem 3,6 TB/s de largura de banda de GPU bissecional.

Personalização e Inovação

Esses anúncios recentes do Google Cloud representam um avanço no apoio a empresas e inovadores no desenvolvimento e na implantação de modelos de IA cada vez mais avançados. Os consumidores podem se beneficiar da capacidade de personalizar sua infraestrutura de acordo com suas necessidades, aproveitando o poder da IA em nuvem oferecida pelo Google.

Resumindo, com a nova TPU v5e, máquinas virtuais A3 e tecnologias avançadas como o Multislice, o Google está redefinindo o cenário de IA na nuvem, oferecendo soluções cada vez mais escaláveis e de alto desempenho para treinar e executar modelos de IA de qualquer tamanho.