CriticGPT | OpenAI lança ferramenta para corrigir erros do ChatGPT

CriticGPT é uma nova ferramenta de IA da OpenAI para encontrar bugs e erros no ChatGPT; novidade pode ajudar no treinamento do chatbot por humanos

Por: André Lourenti Magalhães

2 jul 2024 - 01h54

(atualizado às 17h48)

Exibir comentários

A OpenAI anunciou um novo modelo de IA chamado CriticGPT, treinado com base no GPT-4 e usado para corrigir possíveis erros em respostas do ChatGPT sobre programação. De acordo com a empresa, pessoas que usam a ferramenta notam melhorias em 60% dos casos.

A ferramenta foi criada para refinar os processos de revisão das respostas do ChatGPT: a OpenAI informa que o chatbot fica mais preciso ao longo do tempo, com erros mais sutis, e isso pode dificultar a vida dos profissionais que analisam imprecisões na plataforma. A solução, então, foi treinar o CriticGPT para escrever críticas que destaquem vulnerabilidades nas respostas, incluindo bugs que passam despercebidos pelos humanos.

A empresa quer integrar modelos similares à novidade nos sistemas de Aprendizado de Reforço por Feedback Humano (RLHF, na sigla em inglês), que usam o treinamento de profissionais para encontrar possíveis erros e comparar respostas do chatbot.

CriticGPT localiza possíveis erros em respostas do ChatGPT e pode ajudar no treinamenot da IA por humanos (Imagem: Reprodução/OpenAI)
Foto: Canaltech

Os resultados colhidos pela empresa revelam que o CriticGPT não acerta em todas as sugestões, mas os treinadores têm desempenho melhor com a ferramenta em comparação com aqueles que não a usam. Os insights oferecidos pela IA ajudam a criar críticas mais compreensíveis e reduzem os riscos de bugs por alucinação da tecnologia (processo quando a IA cria fatos inexistentes ou imprecisos).

Limitações

A ferramenta pode ser útil para detectar bugs, mas a desenvolvedora ainda aponta algumas limitações:

O CriticGPT é treinado apenas em respostas curtas do ChatGPT, então ainda precisa de aprimoramentos para compreender pedidos mais longos;
Os modelos ainda podem causar alucinações e dificultar o trabalho dos treinadores da IA;
A ferramenta pode corrigir um erro individual num código, mas pode deixar passar outros problemas dentro da própria resposta;
O CriticGPT tem dificuldade para ajudar em tarefas muito complexas, até mesmo com a supervisão de experts.

Inicialmente, a ferramenta está disponível apenas para quem trabalha com o treinamento das ferramentas de IA. E por falar em OpenAI, o CEO Sam Altman comentou recentemente que o sucessor do GPT-4, já em desenvolvimento, trará um "salto significativo" em comparação ao modelo atual.

Trending no Canaltech: