Script = https://s1.trrsf.com/update-1727287672/fe/zaz-ui-t360/_js/transition.min.js
PUBLICIDADE

GTC | NVIDIA lança GPUs Blackwell com 30x mais poderosas

NVIDIA lança novas GPUs Blackwell para IA com 30x mais poder de inferência e 25x mais eficiência energética por GPU em relação a chips H100; confira

18 mar 2024 - 21h00
(atualizado em 19/3/2024 às 12h15)
Compartilhar
Exibir comentários

Nesta segunda-feira (18), a NVIDIA lançou na GTC 2024 (Graphics Technology Conference) as novas GPU B200 para IA, inaugurando a arquitetura Blackwell. As novas GPUs trazem inovações de hardware e de tecnologias embarcadas que entregam, por GPU, 4 vezes mais desempenho em treinamento, 30 vezes mais em inferências e 25 vezes mais eficiência energética em relação aos chips Hopper H100.

Os novos chips Blackwell são fabricados em processo de 4 nm da TSMC 4NP, adaptado para integrar dois dies Blackwell para atuarem como uma única GPU por meio de interconectores chip-para-chip (NVLINK C2C) de 10 TB/s. A grande vantagem do novo design é eliminar eventuais problemas de comportamento de programas em arquitetura desagregada de chiplets.

Novos chips Blackwell integram dois dies para atuarem como uma única GPU (Imagem: NVIDIA / Divulgação)
Novos chips Blackwell integram dois dies para atuarem como uma única GPU (Imagem: NVIDIA / Divulgação)
Foto: Canaltech

Inferência na escala de trilhões de parâmetros

Outra inovação dos chips Blackwell é a introdução da nova geração de Núcleos Tensor e compiladores Tensor combinando modelos TensorRT-LLM e framework NeMo Megatron. Entre outras vantagens, o resultado é uma aceleração de inferência e treinamento em tempo real na escala de 10 trilhões de parâmetros.

Além disso, a NVIDIA lançou a quinta geração de interconectores NVIDIA NVLink com largura de banda bidirecional de 1,8 TB/s, garantindo comunicação de altíssima velocidade entre até 576 GPUs. Com a implementação de um motor de descompressão dedicado, os chips B200 ainda oferecem ganhos significativos de desempenho em atividades de análise de dados.

Novo Superchip GB200 traz dois chips Blackwell B200 atuando como uma única GPU por meio de interconectores NVLink C2C. (Imagem: NVIDIA / Divulgação)
Novo Superchip GB200 traz dois chips Blackwell B200 atuando como uma única GPU por meio de interconectores NVLink C2C. (Imagem: NVIDIA / Divulgação)
Foto: Canaltech

Servidores NVL72 com superchip

Por fim, o maior destaque da nova arquitetura de GPUs da NVIDIA fica para o superchip Grace-Blackwell GB200, evolução dos já impressionantes Grace-Hopper, implementados nos servidores NVL72. A nova geração de racks NVIDIA para IA e HPC combina 36 CPUs Amazing Grace e 72 GPUs Blackwell B200 em comunicação pela quinta geração do NVIDIA NVLink.

O resultado é um servidor com poder computacional de 720 Petaflops (PFLOPs) em treinamento de modelos LLM, 1.440 PFLOPs em inferência e capacidade para modelos de até 27 trilhões de parâmetros. A NVIDIA já conta com um portfólio vasto de empresas que vão adotar as soluções Blackwell ainda em 2024.

Servidores NVL72 trazem 36 CPUs Grace e 72 GPU Blackwell B200 em um único rack, oferecendo 720 e 1440 PetaFLOPs em desempenhos de treinamento LLM e de inferência, respectivamente. (Imagem: NVIDIA / Divulgação)
Servidores NVL72 trazem 36 CPUs Grace e 72 GPU Blackwell B200 em um único rack, oferecendo 720 e 1440 PetaFLOPs em desempenhos de treinamento LLM e de inferência, respectivamente. (Imagem: NVIDIA / Divulgação)
Foto: Canaltech

Entre as principais parcerias estão Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure e Amazon Web Services (AWS) como primeiras a atualizarem suas infraestruturas. Além disso, Cisco, Dell, Lenovo e Supermicro também vão produzir suas próprias soluções de servidores utilizando chips Blackwell e outras tecnologias NVIDIA também para 2024.

Trending no Canaltech:

Canaltech
Compartilhar
Publicidade
Seu Terra












Publicidade