INFERÊNCIA DE IA E COMPUTAÇÃO ConvENCIONAL PARA TODAS AS EMPRESAS
Eleve o desempenho para diversas cargas de trabalho corporativas com as GPUs NVIDIA A30 Tensor Core. Com a arquitetura Ampere Tensor Cores e a GPU Multi-Instância (MIG), oferece acelerações seguras em várias cargas, incluindo inferência de IA em escala e aplicações de HPC. Ao combinar memória de alta largura de banda com baixo consumo num formato PCIe, adequado para servidores tradicionais, o A30 entrega um data center flexível e o maior valor para as empresas.
DEEP LEARNING
Treinar modelos de IA para desafios avançados, como IA conversacional, exige grande poder de processamento e escalabilidade. Os núcleos Tensor da A30 com TF32 proporcionam até 10x mais desempenho que o T4 sem alterações de código, com ganho adicional de 2x através de precisão mista automática e FP16, resultando numa melhoria total de até 20x na taxa de transferência. Com NVLink, PCIe Gen4, rede NVIDIA e o SDK Magnum IO, é possível escalar para milhares de GPUs. Tensor Cores e MIG permitem usar a A30 em cargas dinâmicas ao longo do dia, suportando inferência de produção em picos de demanda e, durante períodos de menor tráfego, reutilizar parte da GPU para treinar rapidamente os mesmos modelos.