Mostre um riff de guitarra ao Gemini e ele fará todo o resto do arranjo, colocando instrumentos e mixando a música até sua versão final.
Compartilhe com ele o primeiro capítulo do seu TCC, e ele te ajudará com as 300 páginas seguintes.
Suba um mapa, e e ele fará o roteamento de centenas de caminhões de entrega.
Mostre ao Gemini a foto de um terreno, e ele te dará em segundos a planta de uma casa com todos os cálculos estruturais e planta elétrica.
O que faz o Gemini ser tão impressionante ? Ele é o primeiro modelo multimodal puro do mundo.
Enquanto todos os outros modelos de Inteligência Artificial do mundo foram essencialmente treinados com textos OU imagens ( casos respectivos de ChatGPT e DALL-E ), o Gemini foi treinado, desde o princípio, com imagens, vídeos, sons, palavras, códigos de computador.
Como uma pessoa.
Portanto, ele consegue entender naturalmente qualquer desses elementos, processá-los, refletir sobre eles e criar conexões sofisticadas entre cada uma dessas perspectivas diferentes do mundo. Além de saber matemática melhor que 99% dos humanos.
Isso faz do Gemini, em sua versão 1, tão poderoso para praticamente qualquer tarefa cognitiva quanto um humano, versão 10 mil gerações. Isso me assusta. E deve te assustar também.
De onde aterrissa esse poder alienígena?
Do Google, líder em pesquisa aplicada em processamento de linguagem há 20 anos.
Quase todos os maiores especialistas em IA do mundo passaram mais ou menos tempo conectados ao Google. Tem o melhor time científico, centenas de patentes e criou a tecnologia que sustenta o ChatGPT e todos os seus vários concorrentes hoje, chamada de Transformers.
A empresa estava tão confortável em sua liderança que não deu muita bola para uma startup interessante mas pouco relevante, chamada OpenAI. Nem para seu projeto pouco ambicioso e experimental, chamado de ChatGPT.
O Google já tinha a mesma tecnologia. Não tinha se dado ao trabalho de lançá-la por uma série de razões, todas válidas:
IA generativa é incontrolável e alucina com frequência
Não havia um modelo de negócios claro para a tecnologia
Ela é mais cara de rodar que os algoritmos tradicionais de busca da empresa, que detém 90% do mercado mundial deste mercado
Existiam riscos reputacionais claros para uma empresa do tamanho do Google (ainda que eles sejam muito diferentes para alguém com nada a perder como a OpenAI )
Então o Google foi pego no contrapé pelo sucesso barulhento do ChatGPT. Ainda mais pelo apoio maciço da Microsoft, que acelerou a posição da startup e fez de ambas as grandes vencedoras do round 1, ano 1, da corrida tecnológica mais relevante de nossas vidas.
Mas inevitavelmente novos rounds viriam. E se você é o Google, está sentado em meio trilhão de dólares e tem em seus quadros algumas das melhores cabeças do mundo, havia como se preparar para o resto da jornada, e é o que o Google fez.
Para isso chamou o melhor dos melhores como general. Demis Hassabis, o mais relevante cientista de IA do mundo, unificou as duas grandes unidades de pesquisa da empresa, DeepMind e Google Brain, e começou a trabalhar em algo realmente revolucionário.
Centenas de milhões de dólares, milhares de horas de trabalho e doze meses depois, Gemini é mostrado ao mundo pela primeira vez, CINCO DIAS depois do aniversário de um ano do ChatGPT.
Já se sabe que este vídeo contém alguns exageros. Foi em parte editado e dublado. Mas não importa. Se 30% do que mostra é verdadeiro, esse número subirá para 60% na versão 2 da plataforma e será totalmente real em dois anos.
E então Gemini será capaz de fazer quase qualquer coisa.
É um processo que vai se acelerar conforme assistimos à parada frenética e infindável de novos modelos. Logo teremos um GPT5, um Claude 3, um novo LLama e o já anunciado Gemini Ultra.
Inteligências como humanos jamais encontraram. Um novo estágio de IA, que vai transformar tanto tanto o mundo, que talvez você possa chamar isso de… domínio. O Gemini é o primeiro desta nova espécie.
Pra que exatamente serviremos nós? Claro, seres humanos ainda serão responsáveis por cuidar uns dos outros. Massagistas, cabelereiros e enfermeiros estão seguros.
Consigo pensar em centenas de profissões, mais acima ou abaixo na pirâmide social, que não farão mais sentido. Não em décadas, mas em poucos anos.
Enquanto isso, nossos políticos discutem ideologia como se estivéssemos numa taverna do século 19. Estamos acelerando sem roteiro para a maior mudança social de nossas vidas, possivelmente em muitas gerações, e mal nos damos conta disso.
Gemini é como uma nave extraterrestre gigante, misteriosa flutuando sobre a Casa Branca. Ou chamamos Tom Cruise e Will Smith, ou as consequências serão absolutamente imprevisíveis.
E não necessariamente positivas.
(*) Alex Winetzki é CEO da Woopi e diretor de P&D do Grupo Stefanini, de soluções digitais.