Um robô de quatro patas chamou a atenção nas redes sociais ao aprender sozinho a andar como um cachorro e sem ter visto nenhuma simulação de computador.
No primeiro momento, deitado de costas e com as pernas para cima, ele faz movimentos desesperados. Após 10 minutos, consegue rolar para a frente. Meia hora depois, é capaz de dar os primeiros passos e, ao final de uma hora, anda pelo laboratório como um cachorro.
Segundo informações da MIT Technology Review divulgadas nesta segunda-feira (18), a técnica de inteligência artificial usada, nesse caso, por pesquisadores da Universidade da Califórnia chama-se aprendizado por reforço.
Ela treina algoritmos e os recompensa por ações desejadas, fazendo com que seja possível ensinar o robô a andar. O mesmo algoritmo já foi usado em outros três robôs, sendo que um deles era capaz de pegar bolas e levá-las de uma bandeja para outra.
Geralmente, os robôs são treinados com um simulador antes de tentarem repetir algum movimento na realidade.
“O problema é que seu simulador nunca será tão preciso quanto o mundo real. Sempre haverá aspectos do mundo que você está perdendo”, diz Danijar Hafner, que atuou no projeto do cão robô com os pesquisadores Alejandro Escontrela e Philipp Wu.
Dreamer é o nome do algoritmo da equipe, que usa experiências anteriores para criar um modelo do mundo ao redor.
Ele permite que o robô faça cálculos de tentativa e erro em um programa de computador, prevendo possíveis resultados de suas ações e fazendo com que o aprendizado ocorra mais rápido. Depois que o robô conseguiu andar como um cachorro, adaptou-se a outras situações, como levantar novamente após ser derrubado por um bastão.
Para Hafner, retirar o simulador do treinamento apresenta diversas vantagens. Além das habilidades do mundo real, os robôs podem usar o algoritmo para se adaptar a falhas de hardware e andar mesmo com um motor defeituoso, por exemplo.
Esse tipo de abordagem também pode ter potencial para situações mais complicadas como direção autônoma. Algoritmos de aprendizado por reforço poderiam “captar rapidamente no mundo real como o ambiente funciona”, opina Stefano Albrecht, professor assistente de inteligência artificial da Universidade de Edimburgo, na Escócia.
No entanto, a técnica apresenta alguns obstáculos. “Ensinar robôs por tentativa e erro é um problema difícil, ainda mais difícil pelos longos tempos de treinamento que esse ensino exige”, afirmou ao MIT Technology Review Lerrel Pinto, professor assistente especializado em robótica e aprendizado de máquina na Universidade de Nova York (EUA).
Para obter os resultados desejados, os engenheiros precisam especificar, no código do algoritmo, quais comportamentos são positivos e recompensados e quais são indesejáveis.
No caso do cão robô, virar e andar é bom, enquanto não andar é ruim. “Um roboticista precisará fazer isso para cada tarefa ou problema que deseja que o robô resolva”, diz Lerrel.
Danijar Hafner afirma que, no futuro, será interessante ensinar o cão robô a entender comandos falados. Ele ainda revela que a equipe deseja conectar câmeras para dar visão a ele – o que iria prepará-lo para tarefas mais complexas, como caminhar mais longe e até mesmo brincar de buscar objetos.