Script = https://s1.trrsf.com/update-1742411713/fe/zaz-ui-t360/_js/transition.min.js
PUBLICIDADE

O DeepSeek não copiou o raciocínio do OpenAI: ele o reinventou do zero e é isso que é revolucionário

DeepSeek mostrou que é possível criar modelos com habilidades avançadas de raciocínio usando principalmente aprendizado por reforço

22 mar 2025 - 12h47
(atualizado em 24/3/2025 às 10h25)
Compartilhar
Exibir comentários
Foto: Xataka

Com o R1, o DeepSeek conseguiu algo que parecia impossível: treinar um modelo de IA com capacidades de raciocínio comparáveis às do OpenAI... mas sem depender de enormes conjuntos de dados rotulados.

Sua abordagem baseada em aprendizado por reforço abre a porta para muitos outros grupos desenvolverem IAs avançadas.

Porque isso importa

Este avanço muda as regras que assumimos no desenvolvimento de IA. Até agora, criar modelos com capacidade de raciocínio exigia enormes quantidades de dados rotulados e recursos computacionais apenas ao alcance de gigantes como OpenAI, Meta ou Google.

O DeepSeek mostrou que há um caminho alternativo muito mais eficiente.

Nos bastidores

O processo de treinamento do DeepSeek R1 é dividido em duas fases principais:

  1. Primeiro, o R1-Zero aprende a raciocinar exclusivamente por meio de aprendizado por reforço, explorando soluções por tentativa e erro.
  2. O R1 então refina essas capacidades com uma pequena quantidade de dados de "inicialização a frio" para melhorar aspectos como legibilidade.

O modelo usa uma arquitetura Expert Mix (MoE) com 671 bilhões de parâmetros totais, mas ativa apenas 37 bilhões por consulta. É isso que permite que você obtenha desempenho comparável ao o1 do OpenAI com uma fração dos recursos computacionais.

Contraste

Enquanto o OpenAI investe centenas de milhões em dados rotulados e computação, o DeepSeek obteve resultados semelhantes com menos de US$ 6 milhões (investimento declarado, cerca de R$ 34,1 milhões).

...

Veja mais

Matérias relacionadas

Aprenda a instalar o DeepSeek no seu computador e usá-lo localmente no Windows, macOS e GNU/Linux

Em 1980, Bill Gates abriu mão de 8,75% da Microsoft para contratar seu amigo: hoje Steve Ballmer é mais rico que Gates

DeepSeek R1 não é apenas mais um modelo de IA: é a maior ameaça existencial que o Vale do Silício já enfrentou

Cibercriminosos encontraram uma nova maneira de distribuir software ilegal: usando playlists do Spotify

Deep Research não é apenas uma nova função de IA. É o começo do fim do trabalho intelectual como o conhecemos

Xataka
Compartilhar
TAGS
Curtiu? Fique por dentro das principais notícias através do nosso ZAP
Inscreva-se
Publicidade
Seu Terra












Publicidade