O DeepSeek não copiou o raciocínio do OpenAI: ele o reinventou do zero e é isso que é revolucionário

DeepSeek mostrou que é possível criar modelos com habilidades avançadas de raciocínio usando principalmente aprendizado por reforço

Por: PH Mota

22 mar 2025 - 12h47

(atualizado em 24/3/2025 às 10h25)

Exibir comentários

Com o R1, o DeepSeek conseguiu algo que parecia impossível: treinar um modelo de IA com capacidades de raciocínio comparáveis às do OpenAI... mas sem depender de enormes conjuntos de dados rotulados.

Sua abordagem baseada em aprendizado por reforço abre a porta para muitos outros grupos desenvolverem IAs avançadas.

Porque isso importa

Este avanço muda as regras que assumimos no desenvolvimento de IA. Até agora, criar modelos com capacidade de raciocínio exigia enormes quantidades de dados rotulados e recursos computacionais apenas ao alcance de gigantes como OpenAI, Meta ou Google.

O DeepSeek mostrou que há um caminho alternativo muito mais eficiente.

Nos bastidores

O processo de treinamento do DeepSeek R1 é dividido em duas fases principais:

Primeiro, o R1-Zero aprende a raciocinar exclusivamente por meio de aprendizado por reforço, explorando soluções por tentativa e erro.
O R1 então refina essas capacidades com uma pequena quantidade de dados de "inicialização a frio" para melhorar aspectos como legibilidade.

O modelo usa uma arquitetura Expert Mix (MoE) com 671 bilhões de parâmetros totais, mas ativa apenas 37 bilhões por consulta. É isso que permite que você obtenha desempenho comparável ao o1 do OpenAI com uma fração dos recursos computacionais.

Contraste

Enquanto o OpenAI investe centenas de milhões em dados rotulados e computação, o DeepSeek obteve resultados semelhantes com menos de US$ 6 milhões (investimento declarado, cerca de R$ 34,1 milhões).

...

Veja mais

Matérias relacionadas

Aprenda a instalar o DeepSeek no seu computador e usá-lo localmente no Windows, macOS e GNU/Linux

Em 1980, Bill Gates abriu mão de 8,75% da Microsoft para contratar seu amigo: hoje Steve Ballmer é mais rico que Gates

DeepSeek R1 não é apenas mais um modelo de IA: é a maior ameaça existencial que o Vale do Silício já enfrentou

Cibercriminosos encontraram uma nova maneira de distribuir software ilegal: usando playlists do Spotify

Deep Research não é apenas uma nova função de IA. É o começo do fim do trabalho intelectual como o conhecemos

O DeepSeek não copiou o raciocínio do OpenAI: ele o reinventou do zero e é isso que é revolucionário

DeepSeek mostrou que é possível criar modelos com habilidades avançadas de raciocínio usando principalmente aprendizado por reforço

O deserto do Atacama é um dos lugares mais secos do planeta. E lá um bando de "loucos" está tentando tirar água da neblina

Em 1980, Bill Gates abriu mão de 8,75% da Microsoft para contratar seu amigo: hoje Steve Ballmer é mais rico que Gates

Fizeram ele dirigir 500 km de caminhão após um infarto e, ao chegar à Espanha, a empresa o demitiu; o juiz decidiu a seu favor

Porque isso importa

Nos bastidores

Contraste

Confira também:

Mais lidas

Um engenheiro da NASA testou o Autopilot de Elon Musk contra uma parede pintada, igual às das clássicas cenas do Coiote e o Papa-Léguas

Gracyanne Barbosa chora no Mais Você e Ana Maria Braga rebate: 'Quem você é de verdade'

Restaurante em SP atribui dificuldade de contratar funcionários ao 'pessoal do Bolsa Família e da cervejinha'

Quanto custa a diária no resort onde Amado Batista e a mulher curtem a lua de mel na Bahia?

Diogo Nogueira faz revelação sobre casamento aberto com Paolla Oliveira

Louisiana realiza primeira execução com gás nitrogênio; condenado passa 19 minutos se contorcendo

"Só faltava a cor da pele impedir", diz ator Pedro Cardoso sobre livro com escritores pretos

Lázaro Ramos revela que comprou casa em que mãe foi agredida para transformar em ONG

Polícia investiga falsas enfermeiras após homem ficar impotente depois de realizar preenchimento íntimo

Últimas notícias

Recomendado para você