Google com inteligência artificial na nuvem
O Google aprimorou ainda mais suas ofertas de infraestrutura otimizada para IA na nuvem, introduzindo uma nova Unidade de Processamento Tensor (TPU) chamada v53e e disponibilizando novas máquinas virtuais A3, projetadas para treinar e executar grandes modelos de IA.
TPU v5e: Eficiência e Escalabilidade
A TPU v5e foi descrita pelo Google como a "unidade de computação em nuvem mais eficiente, versátil e escalável até o momento". Esta TPU é otimizada para treinamento e inferência em modelos de médio e grande porte, oferecendo desempenho de treinamento e inferência até 2x e 2,5x maior por dólar em comparação à TPU v4 anterior, além de reduzir custos.
Os pods TPU v5e podem acomodar até 256 chips, fornecendo mais de 400 Tb/s de largura de banda agregada e 100 petaOps de desempenho INT8. Além disso, o TPU v5e suporta até 8 configurações diferentes de máquinas virtuais, permitindo que os clientes do Google Cloud dimensionem facilmente sua infraestrutura de acordo com suas necessidades.
Compatibilidade e Integração
As TPUs v5e oferecem suporte nativo a frameworks como JAX, PyTorch e TensorFlow e integram-se a ferramentas de código aberto como Transformers e Accelerate by Hugging Face, PyTorch Lightning e Ray. O Google também introduziu a tecnologia Multislice, que permite o treinamento de modelos em larga escala, aproveitando milhares de TPUs v5e e v4 interconectadas.
Novas máquinas virtuais A3: desempenho aprimorado
As novas máquinas virtuais A3 seguem o sucesso do G2 e são otimizadas para cargas de trabalho de IA. As A3s são equipadas com oito GPUs NVIDIA H100 Tensor Core com Transformer Engines, permitindo a execução de modelos com trilhões de parâmetros.
A combinação dos recursos do Google Cloud com GPUs NVIDIA permite treinamento 3x mais rápido e até 10x mais largura de banda de rede do que a geração anterior de VMs. Cada VM A3 possui dois processadores Intel Xeon de 4ª geração e 2 TB de memória host. Além disso, com a tecnologia NVIDIA NVLink, as novas VMs oferecem 3,6 TB/s de largura de banda de GPU bissecional.
Personalização e Inovação
Esses anúncios recentes do Google Cloud representam um avanço no apoio a empresas e inovadores no desenvolvimento e na implantação de modelos de IA cada vez mais avançados. Os consumidores podem se beneficiar da capacidade de personalizar sua infraestrutura de acordo com suas necessidades, aproveitando o poder da IA em nuvem oferecida pelo Google.
Resumindo, com a nova TPU v5e, máquinas virtuais A3 e tecnologias avançadas como o Multislice, o Google está redefinindo o cenário de IA na nuvem, oferecendo soluções cada vez mais escaláveis e de alto desempenho para treinar e executar modelos de IA de qualquer tamanho.