Como Alexa, Siri e o Google Assistente ficaram para trás na corrida da inteligência artificial
ChatGPT tornou quase obsoletos os assistentes de voz das gigantes da tecnologia
THE NEW YORK TIMES - O mundo da tecnologia agora está entusiasmado com chatbots. Esses sistemas alimentados por inteligência artificial (IA), como o ChatGPT, podem improvisar com desembaraço respostas a perguntas digitadas em uma janela de bate-papo. As pessoas têm usado o ChatGPT para lidar com tarefas complexas, como programar softwares, elaborar propostas de negócios e escrever ficção.
A empolgação com esses sistemas mostra como a Siri, a Alexa e outros assistentes de voz desperdiçaram sua vantagem na corrida da IA. Antes alvos de promessas de um futuro emocionante, a tecnologia desses sistemas permaneceu praticamente estagnada na última década.
Durante o período, os serviços se depararam com obstáculos. A Siri enfrentou dificuldades tecnológicas, incluindo um código constrangedor que levou semanas para ser atualizado com recursos básicos, diz John Burkey, ex-engenheiro da Apple que trabalhou no desenvolvimento da assistente.
Já Amazon e o Google não calcularam bem como seus assistentes de voz seriam usados, levando-os a investir em áreas com a tecnologia que raras vezes valeram a pena, disseram ex-funcionários. Quando esses experimentos fracassaram, o entusiasmo pela tecnologia diminuiu nas empresas, afirmaram as fontes.
As assistentes de voz são "burras como uma porta", disse Satya Nadella, CEO da Microsoft, em uma entrevista este mês para o Financial Times, declarando que uma IA mais recente assumiria a liderança. A Microsoft tem trabalhado em parceria com a OpenAI, dona do ChatGPT, investindo US$ 13 bilhões na startup e incorporando sua tecnologia em seu motor de busca, o Bing.
A Apple não quis se pronunciar a respeito da Siri. O Google disse que está empenhado em oferecer uma assistente virtual excelente para ajudar as pessoas com seus telefones e dentro de suas casas e carros - a empresa está testando separadamente um chatbot chamado Bard. A Amazon disse ter notado um aumento de 30% no engajamento global dos consumidores com a Alexa no ano passado e estar otimista com sua missão de desenvolver uma das melhores IAs do mundo.
Tecnologias diferentes
Os assistentes e os chatbots são baseados em tipos diferentes de IA. Os chatbots funcionam com o que é conhecido como modelo de linguagem ampla, que são sistemas treinados para reconhecer e gerar texto com base em conjuntos de dados enormes extraídos da web. Eles podem sugerir palavras para completar uma frase.
Por outro lado, a Siri, a Alexa e o Assistente do Google são basicamente o que conhecemos como sistemas de comando e controle. Eles são capazes de entender uma lista finita de perguntas e pedidos como "Qual é o clima na cidade de Nova York?" ou "Ligar as luzes do quarto". Se um usuário pede ao assistente virtual para fazer algo que não está em seu código, o bot simplesmente diz que não pode ajudar.
A Siri também tinha um projeto confuso que exigia bastante tempo para receber novos recursos, disse Burkey, que recebeu a tarefa de aprimorar a assistente em 2014. O banco de dados da Siri contém uma lista gigantesca de palavras, incluindo nomes de artistas musicais e locais como restaurantes, em aproximadamente 24 idiomas.
Isso a tornou "uma grande bola de neve", disse ele. Segundo Burkey, se alguém queria adicionar uma palavra à base de dados da Siri, "isso se transformava numa tarefa gigantesca".
Portanto, atualizações aparentemente simples, como acrescentar algumas novas frases ao conjunto de dados, exigiam a recriação do banco de dados inteiro, o que podia levar até seis semanas, disse Burkey. Adicionar recursos mais complexos, como novas ferramentas de pesquisa, podia demorar quase um ano. Isso significava que não havia jeito de a Siri se tornar uma assistente criativa como o ChatGPT, afirmou.
A Alexa e o Assistente do Google dependiam de uma tecnologia semelhante à da Siri, mas as empresas tinham dificuldades para gerar uma receita significativa com os assistentes, disseram ex-gestores da Amazon e do Google. (Em contrapartida, a Apple usou com sucesso a Siri para atrair compradores para o iPhone.)
Depois que a Amazon lançou o Echo, um alto-falante inteligente equipado com a Alexa, em 2014, a empresa esperava que o produto a ajudasse a aumentar as vendas em sua loja online ao permitir que os consumidores conversassem com a Alexa para fazer pedidos, disse um ex-líder da Amazon. No entanto, embora as pessoas se divertissem com as habilidades da Alexa para responder perguntas sobre as condições meteorológicas e definir alarmes, poucos pediam para a assistente comprar algo, de acordo com a fonte.
A Amazon talvez tenha investido demais na fabricação de novos tipos de hardware, como despertadores e micro-ondas, hoje já fora do mercado, que funcionavam com a Alexa e eram vendidos a um preço igual ou inferior aos convencionais, disse o ex-executivo.
A empresa também investiu pouco na criação de um ecossistema para as pessoas expandirem com facilidade as capacidades da Alexa, como a Apple fez com sua App Store, que ajudou a despertar o interesse pelo iPhone, disse a fonte. Embora a Amazon oferecesse uma loja de "skills" para fazer com que a Alexa controlasse acessórios de terceiros, como interruptores de luz, não era fácil para as pessoas encontrar e configurar as habilidades para os alto-falantes - ao contrário da experiência simples de baixar apps para dispositivos móveis nas lojas de aplicativos.
"Nunca tivemos aquela fase da loja de apps para as assistentes", disse Carolina Milanesi, analista de tecnologia de consumo da empresa de pesquisa Creative Strategies, que trabalhou como consultora para a Amazon.
Cortes
No final do ano passado, o departamento da Amazon encarregado pela Alexa foi um dos principais alvos das 18 mil demissões da empresa, e muitos dos principais executivos da assistente já não trabalham mais na multinacional.
Kinley Pearsall, porta-voz da Amazon, disse que a Alexa era muito mais do que uma assistente de voz e "estamos mais otimistas do que nunca em relação a essa missão".
Os equívocos da Amazon com a Alexa podem ter induzido o Google ao erro, disse um ex-gestor que trabalhou com o Assistente do Google. Os engenheiros do Google passaram anos experimentando seu assistente para imitar o que a Alexa podia fazer, incluindo a criação de alto-falantes inteligentes e telas de tablets controladas por voz para controlar acessórios domésticos, como termostatos e interruptores de luz. Posteriormente, a empresa incorporou anúncios naqueles produtos domésticos, que não se tornaram uma grande fonte de receita.
Com o tempo, o Google percebeu que a maioria das pessoas usava o assistente de voz apenas para um número limitado de tarefas simples, como iniciar temporizadores e tocar música, disse o ex-gestor. Em 2020, quando Prabhakar Raghavan, um executivo do Google, assumiu o comando do Assistente do Google, sua equipe mudou o foco da companheira virtual para ser um recurso chamativo para smartphones Android.
Em janeiro, quando a empresa controladora do Google demitiu 12 mil funcionários, a equipe que trabalhava em sistemas operacionais para dispositivos domésticos perdeu 16% de seus engenheiros.
Respostas ao ChatGPT
Muitas das gigantes da tecnologia agora estão correndo para criar respostas ao ChatGPT. No mês passado, a Apple realizou na sede da empresa sua conferência anual de IA, um evento interno para funcionários aprenderem sobre seu modelo de linguagem ampla e outras ferramentas de IA, segundo duas fontes informadas a respeito do programa. Muitos engenheiros, incluindo integrantes da equipe de desenvolvedores da Siri, têm testado conceitos de geração de linguagem todas as semanas, segundo as fontes.
Já Google disse que também lançaria em breve ferramentas com IA generativa para auxiliar empresas, governos e desenvolvedores de software a criar aplicativos com chatbots integrados, além de incorporar a tecnologia subjacente em seus sistemas.
No futuro, as tecnologias de chatbots e assistentes de voz vão convergir, disseram especialistas em IA. Isso significa que as pessoas serão capazes de controlar os chatbots com a fala, e aqueles usando produtos da Apple, da Amazon e do Google poderão pedir aos assistentes virtuais que os ajudem em seus trabalhos e não apenas com tarefas como verificar as condições meteorológicas.
"Esses produtos nunca funcionaram no passado porque jamais tivemos essa capacidade de diálogo num nível próximo ao humano", disse Aravind Srinivas, fundador da Perplexity, startup de IA que oferece um motor de busca equipado com um chatbot. "Agora nós temos."