OpenAI usou tudo na internet para treinar sua IA; agora acusa o DeepSeek de roubar seus dados
Funcionários da OpenAI acreditam que a DeepSeek destilou seus modelos Técnica é muito comum no campo da IA, mas a OpenAI a proíbe em seus termos de serviço OpenAI foi acusada de treinar seus modelos em dados sem o consentimento de seus proprietários, incluindo trabalhos protegidos por direitos autorais
Os modelos de IA do DeepSeek são realmente bons. Testes comparativos o colocam em pé de igualdade com ChatGPT, Claude ou Gemini, o que desencadeou elogios, mas também suspeitas. Há pessoas que não acreditam que o treinamento do DeepSeek custou apenas US$ 5,6 milhões, mas a OpenAI está acusando o DeepSeek de outra coisa.
DeepSeek, você está usando nossos dados sem permissão
Os porta-vozes da OpenAI disseram ao Financial Times que descobriram evidências de que técnicas de "destilação" foram usadas nos modelos da OpenAI usados pela DeepSeek.
O que é "destilação" na IA?
Os desenvolvedores do DeepSeek usaram um grande número de técnicas para atingir um modelo eficiente. Entre elas, o aprendizado por reforço se destaca, mas também se sabe que eles usam a destilação de modelos. Nessa técnica, um "modelo de aluno" menor é ensinado a se comportar como um "modelo de professor" maior e mais avançado. Dados do "modelo de professor" são usados para tornar o modelo pequeno mais rápido e eficiente, mas igualmente inteligente em tarefas específicas.
Uso não permitido
A destilação de modelos é uma prática comum na indústria, mas os termos de serviço da OpenAI proíbem que seus modelos sejam usados para essa finalidade. Assim, é especificado que os usuários não podem "copiar" nenhum de seus serviços ou "usar a saída [dos modelos da OpenAI] para desenvolver modelos que competem com os da OpenAI".
OpenAI e Microsoft já fizeram suas pesquisas sobre isso
De acordo com a Bloomberg, ...
Matérias relacionadas