Soluções Nvidia renovam infraestrutura de serviços AWS
Amazon Web Services atualiza infraestrutura de servidores voltados para aplicações corporativas, pesquisa e IA Generativa com diversas soluções Nvidia
Nesta terça-feira (28), a Amazon revelou algumas atualizações de infraestrutura importantes para seus servidores de HPC e IA Generativa. Durante o AWS re:Invent, a empresa apresentou o primeiro supercomputador em nuvem para IA com superchips Grace Hopper, servidores Amazon EC2 com solução Nvidia GH200 e H200 e frameworks avançados para IA.
O AWS re:Invent é uma conferência anual da Amazon para apresentar as implementações mais recentes das plataformas Amazon Web Services de computação em Nuvem. Um dos focos da edição de 2023 foi a expansão das parcerias com a Nvidia para ampliar o desempenho e escalabilidade dos serviços AWS para computação em nuvem, IA e virtualização.
Escalando desempenho de virtualização
Um dos principais serviços do AWS é o Amazon Elastic Compute Cloud (Amazon EC2), voltado para clientes que buscam operar máquinas virtuais de IA Generativa e computação de alto desempenho. Para garantir ainda mais desempenho para seus clientes, a AWS está ampliando a infraestrutura do EC2 com o supercomputador CEIBA.
O projeto utiliza clusters com 32 superchips GH200 integrados via interconectores NVLink de altíssima velocidade, totalizando 65 ExaFLOPS de processamento Tensor. A combinação ainda tem suporte ao sistema AWS Nitro System de virtualização avançada em UltraClusters de hiperescalabilidade.
De chatbots à Pesquisa & Desenvolvimento
A Nvidia também anunciou o microsserviço Nvidia NeMo Retriever, para criar, personalizar e implantar modelos de IA Generativa. O produto é uma expansão do framework NeMo para as organizações aprimorarem suas aplicações de IA Generativa com recursos de geração aumentada (RAG) de recuperação de nível empresarial.
Com sistema mais desenvolvido de recuperação semântica, o NeMo Retriever possibilita que aplicações de IA forneçam respostas mais precisas utilizando LLMs mais robustos. Isto porque ao conectar essas ferramentas aos dados comerciais armazenados em nuvens e data centers, os RAG otimizados conseguem entregar soluções adaptadas ao contexto de uso de cada cliente.
Inicialmente, Cadence, Dropbox, SAP e ServiceNow serão os primeiros serviços a utilizar o NeMo Retriever em seus sistemas de inferência de IA.
Nvidia Clara para P&D em Saúde
Além disso, a empresa apresentou o framework BioNeMo para uso de IA Generativa em Pesquisa e Desenvolvimento de medicamentos. O framework está disponível nos serviços Nvidia Clara por meio dos servidores AWS, e oferece aos pesquisadores da área da saúde a possibilidade de criar ou personalizar modelos de base de biologia digital com dados proprietários.
Isto permite ampliar consideravelmente o escopo de treinamento e implantação desses modelos, acelerando descobertas e desenvolvimento de novos medicamentos. Dessa forma, a pesquisa farmacêutica pode minimizar o tempo de resposta no caso de eventuais novas crises de saúde.
🛒Compre GPUs Nvidia GeForce RTX com sistema DLSS de aceleração via IA pelo melhor preço!
🛒Compre notebooks profissionais com GPUs Nvidia RTX pelo melhor preço!
Trending no Canaltech:
- WhatsApp deve mostrar recado do perfil dentro das conversas
- IA que cria vídeos com memes famosos faz sucesso nas redes
- Conheça os melhores apps e games de 2023 segundo o Google
- 🤑MUITO BARATA | Soundbar Lenovo TS33 por menos de R$ 70
- OnePlus 12 terá tela mais brilhante do mundo com 4.500 nits
- Retrospectiva Spotify Wrapped 2023 está disponível no app e no PC