O que significa identidade na era dos algoritmos?
Você já deve ter ouvido que eles nos conhecem melhor do que nós mesmos. Mas o que os algoritmos realmente sabem sobre nós?
Você já deve ter ouvido que os algoritmos de redes sociais nos conhecem melhor do que nós mesmos. De fato, eles são alimentados com um volume de dados ininterrupto sobre nossas ações, que são capazes de revelar diferentes aspectos sobre quem somos, o que fazemos, com quem nos relacionamos e pelo que nos interessamos. Mas o que os algoritmos realmente sabem sobre nós e como eles nos veem?
Quando levantamos questionamentos sobre o que seriam as nossas identidades algorítmicas, estamos, a rigor, nos perguntando sobre o modo como eles produzem conhecimento sobre nós. Na linguagem técnica, estamos nos questionando sobre como os algoritmos criam perfis dos usuários em um processo chamado de profiling em inglês, que pode ser traduzido como perfilização.
A primeira coisa importante a ser dita é que um perfil algorítmico nunca está finalizado. Ou seja, ele é continuamente alimentado com mais e mais informações, que acrescentam novas dimensões à identidade de um determinado usuário. Outro aspecto importante é que o processo de profiling acontece em pelo menos duas etapas que, na prática, acontecem paralelamente: a primeira é a coleta dos dados, e a segunda é a análise desses dados para formar os perfis na escala do big data.
Em síntese, os processos do big data envolvem um volume, uma variedade e um fluxo de dados em grande escala e em alta velocidade a partir de mecanismos automatizados de processamento para extrair valor e inteligência dessas informações.
Não basta ter um volume enorme de dados sem ser capaz de identificar informações relevantes e analisá-las para produzir conhecimento estratégico. E hoje sabemos que qualquer rápido acesso aos dispositivos, plataformas e aplicativos digitais geram muitos dados, que podem ser eventualmente compartilhados entre as empresas que controlam esses serviços e seus parceiros.
Nas redes sociais, temos três principais camadas de informações coletadas e analisadas por esses algoritmos. A primeira é aquela que os usuários têm o maior controle, ou seja, são os dados que eles compartilham voluntariamente: fotos, endereço de e-mail, postagens, curtidas, buscas, mensagens, detalhes do perfil, entre outras.
A segunda camada é composta pelos metadados, que são "os dados sobre o dado", permitindo contextualizar suas ações ou escolhas: por exemplo, onde você estava quando postou uma foto, de qual aparelho e sistema operacional fez isso, que horas você compartilhou o conteúdo e quanto durou seu acesso e assim por diante.
Já a terceira camada reúne a interpretação sobre as duas camadas anteriores e combinada com a correlação entre as informações coletadas e analisadas de diversos outros perfis.
Esta interpretação, contudo, é baseada na probabilidade de ocorrência de certos traços e comportamento. Nesse sentido, a sua identidade algorítmica é menos uma representação fiel de quem você é e mais uma inferência do que você provavelmente é ou parece ser naquele momento. Por isso que, para o algoritmo, podemos ser 92% do sexo feminino hoje e amanhã, após uma dúzia de cliques, sermos 88% do sexo feminino, como exemplificou o autor John Cheney-Lippold em seu livro We Are Data: Algorithms and the Making of Our Digital Selves.
Por fim, um último ponto central a respeito dos perfis algorítmicos é que eles estão menos preocupados em produzir um conhecimento profundo sobre um único indivíduo do que em serem capazes de fazer generalizações a partir da identificação de padrões e correlações entre perfis diversos.
Nesse sentido, como argumentam alguns especialistas, a perfilização envolve um processo perpétuo e recursivo de categorização de "tipos" e "classes" de usuários que são ao mesmo tempo um indivíduo identificável, mas são também vários tipos de categorias de usuários.
Por exemplo, podemos ser identificados individualmente, com nome e CPF, mas também como um tipo de"pessoa que consome conteúdo relacionado à exercício físico e saúde". Um perfil, portanto, não diz respeito a um indivíduo, mas reúne diversos "pedaços" sobre esse indivíduo que são identificáveis em um conjunto de relações mais amplas entre indivíduos.
Como se sabe, um dos aspectos centrais do marketing baseado em algoritmos é a sua promessa de personalizar as ofertas de produtos e conteúdo. Porém, se trata de uma personalização baseada tanto no indivíduo quanto em seus tipos de similares. É na correlação de padrões comportamentais não apenas individuais, mas populacionais, que é possível recomendar produtos e conteúdos "ultrapersonalizados".
Assim, o discurso de que os algoritmos "conhecem você melhor do que você mesmo" é, no mínimo, um belo slogan publicitário. Claro que eles são capazes de analisar padrões de comportamento individuais e populacionais em escala. Talvez você não tenha noção do quanto você repete um determinado comportamento online, mas quando te encaixam em um tipo de perfil e se baseiam nisso para definir o que você vai ver ou não, isso, por si só, favorece certos interesses e comportamentos. Em outras palavras, eles nos fazem ser e agir de acordo com aquilo que definem que somos e quais são nossos interesses.
Baseados nos nossos perfis, os algoritmos vão nos mostrar não apenas aquilo que inferem ser o que queremos ver, mas também aquilo que querem que a gente veja. Isso não significa que estejam necessariamente revelando aspectos ocultos sobre os nossos desejos e as nossas personalidades. Eles estão também nos empurrando lentamente na direção de novos interesses.
Assim, os algoritmos não só revelam aspectos da realidade, mas produzem realidade, criam desejos e estimulam comportamentos. Definindo a probabilidade da minha identidade ser assim ou assada, ele se modula para tornar mais ou menos provável certas escolhas e comportamentos. É por isso que às vezes nem importa tanto o que ele sabe sobre mim, mas como ele é capaz de usar esse conhecimento para me direcionar a fazer, de modo imperceptível, aquilo que ele me direciona a querer fazer.
* Anna Bentes é professora da FGV ECMI, fellow da Derechos Digitales e colunista do Terra Byte.