Por que a mão dos seres humanos é especial — e o maior desafio para robôs 'perfeitos'
Nossas mãos realizam milhares de tarefas complexas todos os dias — será que a inteligência artificial pode ajudar os robôs a se equiparar a elas?
A mão humana é uma das partes do corpo mais surpreendentemente sofisticadas e fisiologicamente intrincadas. Ela tem mais de 30 músculos, 27 articulações e uma rede de ligamentos e tendões que proporcionam 27 eixos de movimento. Há mais de 17 mil receptores de toque e terminações nervosas somente na palma da mão. Esses recursos permitem que nossas mãos executem uma variedade impressionante de tarefas altamente complexas por meio de uma ampla gama de movimentos diferentes.
Mas não é preciso dizer nada disso a Sarah de Lagarde.
Em agosto de 2022, ela estava no topo do mundo. Tinha acabado de escalar o Monte Kilimanjaro com o marido, e estava em excelente forma. Mas apenas um mês depois, ela se viu deitada em um leito de hospital, com ferimentos terríveis.
Ao voltar para casa depois do trabalho, De Lagarde escorregou e caiu entre um vagão do metrô e a plataforma na estação High Barnet, em Londres. Esmagada pelo trem que partia e por outro que entrava na estação, ela perdeu o braço direito abaixo do ombro, e parte da perna direita.
Após o longo processo de recuperação, o NHS, serviço público de saúde britânico, ofereceu a ela uma prótese de braço, mas ela proporcionava pouco em termos de movimento normal da mão. Em vez disso, parecia priorizar a forma, em detrimento da funcionalidade.
"Não se parece com um braço de verdade", diz ela.
"Meus filhos acharam assustador."
A prótese apresentava apenas uma única articulação no cotovelo, enquanto a mão em si era uma massa estática na extremidade. Durante nove meses, ela lutou para realizar as tarefas diárias, até que foi oferecido a ela algo transformador: um braço biônico movido a bateria que utiliza inteligência artificial (IA) para prever os movimentos que ela deseja, detectando minúsculos sinais elétricos de seus músculos.
"Toda vez que faço um movimento, ela aprende", explica De Lagarde.
"A máquina aprende a reconhecer os padrões e, por fim, transforma em inteligência artificial generativa, quando começa a prever qual será meu próximo movimento."
Até mesmo pegar algo tão simples como uma caneta, e movê-la por nossos dedos até adotar uma posição para escrever envolve uma integração perfeita entre o corpo e o cérebro. As tarefas manuais que realizamos sem pensar exigem uma combinação refinada de controle motor e feedback sensorial — desde abrir uma porta até tocar piano.
Com esse nível de complexidade, não é de se admirar que as tentativas de igualar a versatilidade e a destreza das mãos humanas tenham sido evitadas por profissionais médicos e engenheiros durante séculos. Desde a rudimentar mão de ferro com mola de um cavaleiro alemão do século 16 até a primeira mão robótica do mundo com feedback sensorial criada na Iugoslávia na década de 1960, nada chegou perto de se equiparar às habilidades naturais da mão humana. Até agora.
Os avanços na inteligência artificial estão dando início a uma geração de máquinas que estão chegando perto de corresponder à destreza humana. Próteses inteligentes, como a que De Lagarde recebeu, podem antecipar e refinar os movimentos.
Os robôs de colheita de frutas macias são capazes de colher um morango em um campo e colocá-lo delicadamente em uma caixinha com outras frutas sem amassá-las. Os robôs guiados por visão conseguem até mesmo extrair cuidadosamente resíduos nucleares de reatores. Mas será que eles podem realmente competir com as incríveis capacidades da mão humana?
Inteligência artificial integrada
Recentemente, dei à luz minha primeira filha. Poucos instantes após chegar ao mundo, sua pequena mão envolveu suavemente o dedo indicador do meu companheiro. Incapaz de focar o olhar em algo que esteja a mais do que alguns centímetros à sua frente, seus movimentos de mão e braço são limitados, em geral, a reflexos involuntários que permitem que ela segure um objeto quando ele é colocado na sua palma da mão. Essa é uma ilustração adorável da sensibilidade da nossa destreza, mesmo em nossos primeiros momentos de vida — e sugere o quanto ela melhora à medida que crescemos.
Nos próximos meses, a visão da minha filha vai avançar o suficiente para dar a ela percepção de profundidade, enquanto o córtex motor de seu cérebro vai se desenvolver, oferecendo maior controle sobre seus membros. Suas pegadas involuntárias vão dar lugar a ações de agarrar mais deliberadas, com suas mãos enviando sinais de volta ao cérebro, permitindo que ela faça ajustes finos no movimento à medida que sente e explora o mundo ao seu redor. Serão necessários vários anos de esforço determinado, tentativas, erros e brincadeiras para que minha filha atinja o nível de destreza manual que os adultos possuem.
E, assim como um bebê que aprende a usar as mãos, os robôs habilidosos que utilizam inteligência artificial integrada seguem um roteiro semelhante. Esses robôs devem coexistir com seres humanos em um ambiente e aprender a realizar tarefas físicas com base na experiência anterior. Eles reagem ao ambiente e ajustam seus movimentos em resposta a essas interações. A tentativa e o erro desempenham um papel importante nesse processo.
"A IA tradicional lida com informações, enquanto a IA integrada percebe, entende e reage ao mundo físico", diz Eric Jing Du, professor de engenharia civil da Universidade da Flórida, nos EUA.
"Essencialmente, ela oferece aos robôs a capacidade de 'ver' e 'sentir' o ambiente ao seu redor, permitindo que eles realizem ações de maneira semelhante à humana."
Mas essa tecnologia ainda está engatinhando. Os sistemas sensoriais humanos são tão complexos, e nossas habilidades perceptivas tão hábeis, que reproduzir a destreza no mesmo nível da mão humana continua sendo um grande desafio.
"Os sistemas sensoriais humanos podem detectar pequenas mudanças e se adaptar rapidamente às mudanças nas tarefas e nos ambientes", acrescenta Du.
"Eles integram vários inputs sensoriais, como visão, tato e temperatura. Atualmente, os robôs não têm esse nível de percepção sensorial integrada."
Mas o nível de sofisticação está aumentando rapidamente. Veja o robô DEX-EE. Desenvolvido pela Shadow Robot Company em colaboração com o Google DeepMind, é uma mão robótica com três dedos que usa drivers do tipo tendão para obter 12 eixos de movimento. A equipe por trás do DEX-EE, projetado para "pesquisa de manipulação hábil", espera demonstrar como as interações físicas contribuem para o aprendizado e o desenvolvimento da inteligência generalizada.
Cada um de seus três dedos contém sensores na ponta do dedo, que fornecem dados tridimensionais em tempo real sobre o ambiente, além de informações sobre sua posição, força e inércia. O dispositivo pode manusear e manipular objetos delicados, incluindo ovos e balões inflados, sem danificá-los. Ele aprendeu até mesmo a apertar as mãos — algo que exige que reaja à interferência de forças externas e situações imprevisíveis. No momento, o DEX-EE é apenas uma ferramenta de pesquisa, e não para ser usado em situações reais de trabalho em que poderia interagir com seres humanos.
Mas entender como realizar essas funções vai ser essencial à medida que os robôs se tornarem cada vez mais presentes ao lado das pessoas, tanto no trabalho quanto em casa. Com que força, por exemplo, um robô deve segurar um paciente idoso ao colocá-lo em uma cama?
Um projeto de pesquisa do Instituto Fraunhofer IFF em Magdeburg, na Alemanha, configurou um robô simples para "socar" repetidamente voluntários humanos no braço, num total de 19 mil vezes, para ajudar seus algoritmos a aprender a diferença entre uma força potencialmente dolorosa e uma confortável. Mas alguns robôs habilidosos já estão começando a aparecer no mundo real.
A ascensão dos robôs
Há muito tempo, os roboticistas sonham com autômatos com destreza antropomórfica suficientemente boa para realizar tarefas indesejáveis, perigosas ou repetitivas.
Rustam Stolkin, professor de robótica da Universidade de Birmingham, no Reino Unido, lidera um projeto para desenvolver robôs controlados por inteligência artificial altamente hábeis, capazes de lidar com resíduos nucleares do setor de energia, por exemplo. Embora esse trabalho normalmente use robôs controlados remotamente, Stolkin está desenvolvendo robôs autônomos guiados por visão que podem ir a locais onde é muito perigoso para os seres humanos se aventurarem.
Talvez o exemplo mais conhecido de um androide do mundo real seja o robô humanoide Atlas, da Boston Dynamics, que cativou o mundo em 2013 com suas capacidades atléticas. A versão mais recente do Atlas foi revelada no fim de 2024, e combina visão computacional com uma forma de inteligência artificial conhecida como aprendizado por reforço, na qual o feedback ajuda os sistemas de IA a se tornarem melhores no que fazem. De acordo com a Boston Dynamics, isso permite que o robô execute tarefas complexas, como empacotar ou organizar objetos nas prateleiras.
Mas as habilidades necessárias para realizar muitas das tarefas em setores liderados por seres humanos, nos quais robôs como o Atlas poderiam se destacar, como manufatura, construção e saúde, representam um desafio especial, de acordo com Du.
"Isso acontece porque a maioria das ações motoras manuais nesses setores exige não apenas movimentos precisos, mas também respostas adaptativas a variáveis imprevisíveis, como formas irregulares de objetos, texturas variadas e condições ambientais dinâmicas", diz ele.
Du e seus colegas estão trabalhando em robôs de construção altamente habilidosos que usam inteligência artificial integrada para aprender habilidades motoras por meio da interação com o mundo real.
Atualmente, a maioria dos robôs é treinada para tarefas específicas, uma de cada vez, o que significa que eles têm dificuldade para se adaptar a situações novas ou imprevisíveis. Isso limita suas aplicações. Mas Du argumenta que isso está mudando.
"Avanços recentes sugerem que os robôs podem, em algum momento, aprender habilidades versáteis e adaptáveis que permitam a eles lidar com uma variedade de tarefas sem treinamento específico prévio", ele afirma.
A Tesla também deu ao seu próprio robô humanoide Optimus uma nova mão no fim de 2024. A empresa divulgou um vídeo do robô pegando uma bola de tênis em pleno ar. Mas ele foi teleoperado por controle remoto manual — em vez de ser autônomo, de acordo com os engenheiros por trás dele. A mão tem 25 eixos de movimento, segundo eles.
Mas enquanto alguns inovadores tentaram recriar mãos e braços humanos em forma de máquina, outros optaram por abordagens muito diferentes em relação à destreza. A empresa de robótica Dogtooth Technologies, com base em Cambridge, criou robôs de colheita de frutas macias, com braços altamente hábeis e pinças de precisão capazes de colher e embalar frutas delicadas, como morangos e framboesas, na mesma velocidade que os trabalhadores humanos.
O cofundador e CEO da Dogtooth Technologies, Duncan Robertson, teve a ideia dos robôs colhedores de frutas enquanto estava deitado em uma praia no Marrocos. Com experiência em aprendizado de máquina (machine learning) e visão computacional, Robertson queria aplicar suas habilidades para ajudar a limpar o lixo na praia, criando um robô de baixo custo que pudesse identificar, classificar e remover detritos. Quando voltou para casa, ele aplicou a mesma lógica ao cultivo de frutas macias.
Os robôs que ele desenvolveu junto à equipe da Dogtooth usam modelos de aprendizado de máquina para implementar algumas das habilidades que nós, seres humanos, possuímos instintivamente. Cada um dos dois braços do robô possui duas câmeras coloridas, muito parecidas com olhos, que permitem identificar o grau de amadurecimento das frutas e determinar a profundidade de cada uma das frutas-alvo a partir de seu "efetor" final, ou dispositivo de preensão.
Os robôs mapeiam a dispersão e a disposição das frutas maduras no pé e transformam isso em uma sequência de ações, com um planejamento preciso da rota necessária para guiar o braço do colhedor até o caule da fruta para fazer um corte.
Cada um dos braços do robô da Dogtooth tem sete eixos de movimento, o mesmo que o braço humano, o que significa que esses apêndices podem manobrar bem o suficiente para encontrar o ângulo ideal para alcançar cada fruta sem danificar as outras que ainda estão no pé. O dispositivo de preensão agarra, então, suavemente a fruta pelo caule, passando-a para uma câmara de inspeção antes de colocá-la cuidadosamente em uma caixinha para distribuição. Outro sistema de colheita de morangos, criado pela Octinion, usa garras flexíveis para agarrar a fruta enquanto a transfere do pé para a cesta.
Embora muitos de nós saibamos instintivamente quanta força é necessária para manusear um morango sem esmagá-lo, foram necessárias décadas de pesquisa e desenvolvimento para que os robôs alcançassem a mesma destreza. Robertson faz questão de enfatizar que os robôs da sua empresa não substituem os trabalhadores humanos, mas que podem ajudar a solucionar a escassez de mão de obra enfrentada em muitas áreas do setor agrícola, permitindo que pessoas e máquinas façam a colheita juntas.
Robôs capazes de lidar com algumas das tarefas mais delicadas atualmente executadas por seres humanos poderiam proporcionar um importante impulso a vários setores industriais, observa Pulkit Agrawal, professor do departamento de Engenharia Elétrica e Ciência da Computação do Instituto de Tecnologia de Massachusetts (MIT), nos EUA.
"Somente no setor de manufatura dos EUA, algumas estimativas preveem [uma] escassez de mais de 2 milhões de trabalhadores", diz Agrawal, que está desenvolvendo máquinas capazes de manipular objetos.
"Seja em aplicações industriais, busca e salvamento, exploração espacial ou para ajudar a população idosa, o impacto da robótica alimentada por inteligência artificial vai ser transformador — muito mais do que o ChatGPT, na minha opinião."
No entanto, ao longo de um dia, as mãos humanas realizam milhares de tarefas diferentes, se adaptando para lidar com uma variedade de formas, tamanhos e materiais diferentes. E a robótica ainda tem um longo caminho pela frente para competir com isso. Um teste recente de uma mão robótica usando componentes de código aberto que custam menos de US$ 5 mil descobriu que ela poderia ser treinada para reorientar objetos no ar. Porém, quando confrontado com um objeto desafiador — um pato de borracha de brinquedo — o robô se atrapalhou, e deixou o pato de borracha cair em cerca de 56% das vezes.
Próteses que preveem
Mas, talvez, a aplicação definitiva da destreza robótica seja nas próteses —substituindo uma mão humana perdida em decorrência de um acidente ou doença, por exemplo. As pioneiras próteses mioelétricas de mão e braço que Sarah de Lagarde recebeu dão algumas dicas do que pode ser possível no futuro.
Uma colaboração entre várias empresas de software e hardware, seu braço usa reconhecimento de padrão mioelétrico, ou decodificação de intenção neurológica, que é uma forma de aprendizado de máquina que permite que sua mão aprenda seus movimentos e faça previsões com base em comportamentos anteriores. Isso significa que De Lagarde é capaz de mover a mão de forma mais instintiva.
"Uma peça de hardware integrada na prótese do braço de Sarah registra os sinais musculares na superfície de sua pele quando ela visualiza um movimento específico", diz Blair Lock, CEO da Coapt, desenvolvedora do algoritmo de inteligência artificial que impulsiona os movimentos do braço de De Lagarde. Esse hardware decodifica esses sinais musculares para adivinhar que ação De Lagarde pretende fazer com a mão.
"O modelo de reconhecimento de padrões pode detectar a intensidade de determinada ação, a velocidade e a intensidade. Ele é capaz de executar os comandos em menos de 25 milissegundos", acrescenta Lock.
De Lagarde compara o processo ao uso de um controle de videogame, no qual você pressiona uma sequência de botões para solicitar uma resposta específica do seu avatar na tela. No início, ela achava difícil realizar multitarefas, pois todos os seus pensamentos se concentravam em contrair a sequência certa de fibras musculares no ombro. Mas, por fim, os algoritmos de inteligência artificial se tornaram hábeis em prever suas intenções, o que significa que agora ela pode realizar multitarefas com muito mais facilidade.
"Posso instruí-la a ter um toque muito leve para que eu possa pegar um ovo sem esmagá-lo", diz De Lagarde.
"Mas, ao mesmo tempo, posso intensificar a pegada e torná-la muito mais forte para que eu possa realmente esmagar uma lata de coca-cola."
A inteligência artificial também está integrada ao aplicativo acoplado ao braço, que faz sugestões sobre como usar o braço de forma mais otimizada, com base no uso anterior. Embora seja uma grande melhoria, a prótese nunca será tão boa quanto o braço original de De Lagarde, diz ela. Ela é pesada, fica suada nos meses de verão e precisa ser carregada uma vez por dia. Além disso, ainda tem alguns obstáculos a superar em termos de funcionalidade.
Os mecanismos de feedback háptico da prótese ainda são bastante rudimentares, e De Lagarde depende principalmente da visão para manusear objetos. Periodicamente, ela se esquece de que está segurando algo e solta a pegada, deixando cair no chão.
As mãos humanas, em comparação, usam as redes de receptores de toque em nossos dedos e palmas para sentir onde algo está, determinar a força com que precisamos agarrar para pegar um objeto, e perceber se o atrito começa a mudar.
A inteligência artificial integrada está claramente levando a robôs e próteses cada vez mais hábeis. Por enquanto, no entanto, está claro que a tecnologia ainda tem um caminho a percorrer antes de se equiparar ou superar completamente o incrível design do corpo humano. De acordo com Agrawal, os desafios permanecem no hardware robótico físico e no software.
"Embora tenhamos feito avanços significativos nos últimos anos, e a destreza semelhante à humana pareça viável, estamos a pelo menos cinco anos de distância, se não mais", diz ele.
Mesmo com o aprimoramento da destreza, há outros aspectos a serem considerados, observa Du.
"A segurança é fundamental", diz ele.
"Isso abrange tanto a segurança física, garantindo que os sistemas robóticos possam operar sem causar danos aos colegas de trabalho humanos, quanto a segurança do sistema, envolvendo proteções robustas contra falhas e redundâncias nos algoritmos de inteligência artificial para evitar mau funcionamento ou ações não intencionais."
Du também cita considerações éticas, como o impacto sobre os empregos.
Para De Lagarde, as melhorias na destreza das mãos robóticas trouxeram de volta habilidades que ela achava ter perdido — tarefas simples, como servir um copo de água e dar um abraço nos filhos com os dois braços.
Quando pergunto a De Lagarde onde ela gostaria de ver a tecnologia no futuro, ela imagina um futuro em que a ampliação robótica do corpo não se limite apenas àqueles com diferenças nos membros ou deficiência, mas possa ajudar idosos a permanecerem ativos em seus últimos anos de vida, por exemplo.
Embora ela não tenha escolhido ser uma embaixadora da inteligência artificial integrada, a disposição de De Lagarde em adotar a tecnologia também oferece um vislumbre do que pode ser possível.
Leia a íntegra desta reportagem (em inglês) no site BBC Future.