Você pertence a um algoritmo

Isenção de responsabilidade: tenho, na melhor das hipóteses, conhecimento do que é discutido neste post. Se houver erros, indique-os e eu corrigirei de acordo.

Eu sempre amei ouvir rádio. É uma ótima maneira de descobrir novas músicas e requer muito pouco poder cerebral: você não precisa pensar no que será reproduzido em seguida. Mas há também algo especial que o rádio faz uma vez na lua azul: toca essa música. Você sabe, sua música favorita. Quando essa música começa, você se sente validado, como se alguém por aí tivesse bom gosto musical para pegá- lo, como se talvez eles tivessem seguido o mesmo caminho que você, como se entendessem . Mas em uma época em que todos podemos andar com quase todas as músicas já produzidas em nossos bolsos, pode ser realmente difícil encontrar esse sentimento. Com tantas músicas e muito conteúdo, se todos ouvimos subconjuntos de músicas completamente diferentes, como alguém pode capturar esse sentimento especial de pertencer?

A resposta, como você deve ter adivinhado, são algoritmos. Geralmente, é impossível para os seres humanos catalogar, organizar e muito menos consumir todos os dados e conteúdos produzidos hoje em dia. A cada minuto, centenas de horas de conteúdo estão sendo carregadas apenas no YouTube. Para gerenciar tudo isso, a solução tradicional de engenharia foi encontrar uma maneira de automatizar esses processos. No que diz respeito aos computadores (e em geral, embora normalmente não seja tão explicitamente), usamos algoritmos para fazer isso.

Atualmente, o “algoritmo” é uma espécie de chavão, mas, na realidade, um algoritmo é apenas um conjunto discreto de etapas para fazer algo . Receitas para cozinhar são algoritmos: você prepara todos os seus ingredientes (entradas), combina-os em uma ordem específica usando técnicas específicas (o algoritmo) e, no final, termina com algum tipo de prato preparado (a saída). Quando abstraímos o processo real para fazer algo , podemos aprender muito sobre como fazê-lo com mais eficiência ou eficácia, qualquer que seja. Existem técnicas muito sofisticadas para estudar e escrever algoritmos que estão muito além do nosso escopo aqui, mas se você já se perguntou o que alguns de nós, cientistas da computação, fazem com o nosso tempo, o raciocínio sobre algoritmos está no topo da lista.

Algoritmos estão chegando rapidamente para governar a maior parte de nossas vidas diárias. Se você recebeu algum testemunho de Mark Zuckerberg na frente do Congresso no mês passado, provavelmente ouviu o termo algoritmo bastante. Em um mundo com tanto conteúdo, as empresas perceberam que não apenas os algoritmos são essenciais para viabilizar seus serviços, como também podem ser usados ​​para tornar seus negócios lucrativos. Aqui está o nosso problema: as empresas estão tentando maximizar seus lucros usando algoritmos para otimizar a experiência que os usuários têm ao usar seus produtos e serviços.

Como vimos recentemente em histórias como Equifax e Cambridge Analytica, as empresas estão dispostas a coletar o máximo possível de seus dados, se acharem que isso lhes renderá dinheiro, seja vendendo-os ou usando-os para convencê-lo a usar seus dados. serviço mais. Para empresas como o Facebook e o Twitter, você é o produto e, quanto mais você usa o serviço deles, melhor eles são. Como tal, empresas como esta estão sempre procurando uma maneira de chamar sua atenção. Cada vez mais, sintonizar um sentimento de pertencimento é como eles fazem isso.

Em resumo, seus feeds do Twitter e do Facebook foram projetados para fazer você se sentir como se pertencesse, para continuar usando o serviço. Essa fabricação de um sentimento de pertença geralmente é feita usando uma grande quantidade de dados sobre você, seus amigos e os tópicos mais populares. Pode ser muito difícil separar todos os fatores que afetam o uso de serviços que possuem seus dados, como esses serviços os usam e o que pode dar errado como resultado.

Neste post, meu objetivo é explicar como você é representado como um fac-símile digital de si mesmo, como as empresas adquirem seus dados e fac-símile e como as usam para se beneficiar, geralmente colocando-o em grande risco. Com esse conhecimento, espero que você possa entender melhor o cenário atual da sociedade digital, seu papel e o que pode fazer para se proteger melhor.

Divulgação completa, se você ainda não descobriu, tenho uma perspectiva sombria sobre tudo isso. É importante lembrar que muitos dos serviços discutidos abaixo fornecem muito valor a muitas pessoas, inclusive a mim. Meu objetivo não é estritamente tentar derrubar essas empresas; meu objetivo é promover uma melhor compreensão de como seus dados são usados ​​e o que você pode fazer sobre isso. Com isso dito, vamos falar sobre o que são “seus dados” e por que eles são importantes.

Até agora, tenho certeza de que você já ouviu o clichê digital, “são apenas 1s e 0s”. Esse é um fato central sobre como os computadores operam, mas, em um sentido muito maior, também é um fato central sobre o mundo . Tudo é quantificável. Tudo pode ser atribuído a um número, incluindo você e tudo sobre você. Quando as pessoas falam sobre “seus dados”, normalmente o que elas querem dizer é a amálgama de números que representam você como pessoa. Não apenas o número da sua carteira de motorista ou o seu SSN – é muito mais profundo do que isso. As empresas constroem uma personalidade digital sua, uma impressão digital que corresponde apenas a você e contém tudo o que elas poderiam querer saber sobre você.

Tudo sobre você pode ser representado como um número. Altura ou idade? Bem, esses são truques. Cor dos olhos? 1, 2 ou 3. Se azul, verde e marrom não descrevem seus olhos o suficiente, podemos atribuir números entre 1, 2 ou 3 ou usar uma representação diferente por completo. Nome? O meu é 77 ​​97 116 116. Localização? É para isso que servem as coordenadas. Preferência política? Já imaginou para que servem?

O que é mais assustador do que apenas as propriedades intrínsecas codificadas em números é que coisas menos óbvias também podem ser representadas dessa maneira. A maneira como você move o mouse do computador, as redes Wi-Fi específicas às quais o seu celular tenta se conectar, até a maneira como você anda identificam coisas exclusivamente únicas sobre você e coisas que podem ser facilmente coletadas do dispositivo no seu bolso. Esses números podem ser usados ​​para representar e identificar você, assim como quaisquer outros atributos. Além disso, eles são freqüentemente usados ​​para estudar seu comportamento e agrupá-lo com outras pessoas como você, como veremos mais adiante.

Descobrir quais números são importantes e cujos números pertencem a quem é um grande negócio. Tanto é assim que a maioria dos sites que você visita, incluindo este, faz o possível para coletar e associar o máximo de dados possível sobre você. Obviamente, você diz a sites como o Facebook muitas informações sobre você. Mas o Facebook também sabe muito sobre você que você não disse a eles conscientemente. Como eles fizeram isso?

Até certo ponto, apenas visitar um site pode revelar muito sobre você. O tipo de navegador da web que você usa, o sistema operacional que você está usando, que tipo de computador você tem, mesmo em algum lugar do mundo em que você está em algum grau, são tudo o que você quase precisa dizer a qualquer site para que ele trabalhos. O site precisa saber qual conteúdo você é capaz de exibir (você sabe, esses avisos desagradáveis ​​do Flash Player e similares), e essas informações são muito úteis para fazer essa determinação. É claro que existem maneiras de contornar isso, mas para as pessoas comuns, uma boa quantidade de seus dados vaza toda vez que você clica em um link ou acessa uma nova página da web.

Infelizmente, essas informações não são particularmente úteis para, por exemplo, a Amazon, se eles estão tentando descobrir o que vender. É aqui que muitos dos rastreamentos muito mais invasivos entram em jogo. O principal veículo usado pelos sites para rastreamento são os cookies, que são essencialmente pequenos dados que os sites armazenam no seu navegador. Os cookies são úteis para muitas coisas: evitam que você precise fazer o login toda vez para visitar uma nova página em um site, acompanham os itens que você colocou no carrinho de compras, permitem autorizar um site a acessar sua conta em outro site (todos os botões “Entrar com o Facebook” que você vê) e muito mais.

Porém, como os cookies são armazenados no navegador através de interações com muitos sites diferentes, eles também permitem que os sites o rastreiem. Como os sites geralmente carregam conteúdo de outros lugares, como anúncios, não é incomum que cookies de terceiros sejam configurados no navegador para permitir que muitos sites diferentes saibam quem você é. Com essas informações, eles podem exibir anúncios nos quais você tem uma alta probabilidade de clicar (é por isso que, quando você procura material de cozinha na Amazon, vê anúncios de material de cozinha no Facebook). Isso tem o efeito colateral de informar aos anunciantes todos os sites que você visitou, o que lhes permite criar um perfil seu.

No entanto, nem tudo são apenas cookies. Existem muitas outras maneiras pelas quais os sites podem rastrear você. Os pixels de rastreamento são uma opção popular: uma imagem minúscula praticamente invisível que pode indicar que você abriu um email ou rolou para uma parte específica de uma página da web. Os sites podem até rastrear você em vários dispositivos, e os aplicativos frequentemente rastreiam sua localização física. Recentemente, foi descoberto que o Facebook raspa dados de chamadas e mensagens em telefones Android. Por uma questão de brevidade, não vou me aprofundar muito nisso, mas Eu e Minha Sombra são um bom recurso para outras leituras. Para descobrir quanto o seu navegador permite que você seja rastreado, visite o Panopticlick do EFF. Existem muitas defesas contra o rastreamento, como Ghostery, uBlock e Brave, mas, novamente, essa discussão é um tópico pouco interessante para nossos propósitos.

O longo e curto disso é que as empresas têm a capacidade de coletar muitos dos seus dados, dados que você fornece a eles de maneira consciente ou não. Qualquer empresa pode criar um perfil refinado para você, e é frequentemente do interesse deles fazê-lo.

Então, tudo sobre você é um número, e muitas empresas têm todos os seus números. E daí? Eles também têm os números de todos os outros, certo? Como mencionei na minha abertura, são muitos dados. Nós, como civilização, mal sabemos como processar todos esses dados e estamos apenas começando a entender como isso pode ser útil.

O principal driver da Internet atualmente é a publicidade, portanto, não é surpresa que empresas como o Facebook e o Google estejam tentando converter seus dados em receita publicitária, e os varejistas estejam tentando descobrir o que vender antes que você saiba que deseja comprar algo. em absoluto. Eles criam perfis e depois usam técnicas estatísticas para encontrar correlações interessantes entre os perfis. Por exemplo, o Walmart sabe estocar Pop-Tarts antes dos furacões. O alvo pode saber que você está grávida antes de fazer. As empresas podem fazer tudo isso apenas porque coletaram dados suficientes de seus clientes para criar modelos poderosos de comportamento humano.

É aqui que muitas das palavras-chave que você ouviu normalmente entram em cena. As maneiras pelas quais as empresas processam dados geralmente envolvem, em um nível muito alto, algum grau de inteligência artificial e aprendizado de máquina. O processamento de todos esses dados em perfis úteis do usuário exige muito trabalho e, em geral, depende de técnicas do aprendizado de máquina. Depois de ter vários perfis de usuários compostos por vários números correspondentes a muitos atributos, você treina algoritmos para fazer previsões inteligentes sobre como os usuários com um perfil específico se comportarão (esta é a parte da inteligência artificial).

Por exemplo, digamos que a Amazon queira descobrir como prever quem vai comprar churrasqueiras de George Foreman. Eles podem analisar os perfis de usuário de todas as pessoas que compraram churrasqueiras no passado e descobrir quais atributos específicos essas pessoas têm em comum. Eles também podem ver outras compras que essas pessoas fizeram para encontrar mais semelhanças. Depois de fazer isso, eles podem criar um “perfil proto”, ou seja, o perfil de um usuário falso que compraria uma churrasqueira George Foreman 100% do tempo.

Depois de terem esse perfil, eles poderão comparar com todos os outros usuários que ainda não compraram a churrasqueira. Se alguns desses usuários tiverem uma semelhança muito alta com o perfil proto, isso indica que eles poderão comprar uma churrasqueira em breve e que provavelmente poderão ser persuadidos a comprar uma churrasqueira. Como a Amazon quer ganhar o máximo de dinheiro possível, eles podem enviar anúncios a essas pessoas para o churrasco para chamar sua atenção. Eles também podem olhar para quem comprou recentemente uma churrasqueira e sugerir produtos relacionados que muitos outros usuários também compraram, novamente com base na comparação com esse perfil protótipo. Por exemplo, talvez muitas pessoas que compram o grill também comprem plástico bolha, para que a Amazon possa direcionar os usuários que compram o grill com anúncios e recomendações para plástico bolha também.

Isso está cortando muitos detalhes e simplificando demais, mas espero que você possa ver como o uso de seus dados é extremamente lucrativo. As empresas são orientadas a maximizar seus lucros e naturalmente percebem que quanto mais dados coletam, mais previsões precisas podem ser feitas e, portanto, mais vendas podem ser realizadas. Isso os incentiva a coletar o máximo de dados possível, independentemente de quão útil possa parecer no momento.

O Cambridge Analytica é talvez o exemplo mais infame de como essa coleta e análise de dados com fins lucrativos podem apresentar sérios riscos à segurança para você e para mim. Não é do interesse do Facebook proteger nossos dados; nossos dados fazem todo o dinheiro deles. É importante ressaltar que o Cambridge Analytica não fez nada que violasse estritamente os termos de serviço do Facebook. Na realidade, eles estavam apenas usando o Facebook como pretendido.

Para lidar com a perda de confiança do usuário nas conseqüências da história da Cambridge Analytica, Mark Zuckerberg foi ao Congresso e prometeu que o Facebook está trabalhando duro para proteger seus usuários contra a exfiltração de dados futuros. Mas não se engane, vender seus dados é o que o Facebook faz, por isso estou muito cético de que veremos grandes reformas nesse domínio se o Facebook for deixado por conta própria.

No entanto, para manter os usuários felizes e aumentar a probabilidade de o Facebook continuar a fornecer serviços de marketing lucrativos, Zuckerberg também indicou que há outra questão importante em jogo: Fake News. Durante o ciclo eleitoral de 2016 nos Estados Unidos, vimos uma proliferação maciça de notícias falsas em sites como o Facebook. Isso questionou como o Facebook decide mostrar qual conteúdo a quais usuários, a resposta à qual geralmente é algo como “algoritmos”.

Como o negócio do Facebook é fazer os usuários felizes, para que eles comprem os produtos anunciados no site, os algoritmos que eles usam otimizam para manter os usuários felizes. Portanto, quando uma história falsa sobre como o presidente Obama ordenou que o Exército dos EUA ocupasse o estado do Texas e instale a lei marcial recebe muita atenção de usuários com certos atributos semelhantes em seus perfis, o algoritmo do Facebook propaga a história amplamente, entre outros pessoas com os mesmos atributos em seus perfis.

Mas não é apenas a proliferação de notícias: o Facebook recomenda amigos e páginas para você com base no perfil de você também. As pessoas ficam mais felizes quando estão cercadas por amigos e familiares que compartilham pontos de vista semelhantes a elas e usuários felizes clicam em anúncios. Portanto, o Facebook é otimizado para criar bolhas de filtro em grande parte. O Facebook também não é o único culpado; Apple, Google, Twitter, Microsoft, Medium e muitos outros otimizam para mostrar o que eles acham que você deseja ver.

Isso tem o efeito aparente de causar polarização. O mundo parece mais roxo para as pessoas que gostam de roxo e mais verde para as pessoas que gostam de verde porque os algoritmos, processando os dados para que seus usuários obtenham lucro, percebem que colocar pessoas roxas com outras pessoas roxas e pessoas verdes com outras pessoas verdes faz a empresa mais dinheiro.

Mas acho que vai além da polarização. A tecnologia, e especificamente a Internet e as mídias sociais, capacitaram muito mais pessoas do que nunca para desenvolver e expressar opiniões complexas. Cada um de nós tem sua própria plataforma para expressar suas opiniões e ouvimos muito mais opiniões de outras pessoas ao mesmo tempo do que nos anos anteriores. Como essas plataformas são incentivadas a nos fazer felizes, geralmente ouvimos vozes que se alinham principalmente às nossas.

Enquanto antes, as opiniões periféricas quase nunca eram representadas e raramente ouvidas, as plataformas de mídia social podem criar a ilusão de que são crenças comuns. Pior, as entidades podem manipular essas plataformas para fazer parecer que essas crenças adicionais são mais comuns do que são, semeando discórdia entre os grupos-alvo. Como as empresas estão tão dispostas a coletar nossos dados e usá-los de maneira a obter lucro, todos corremos o risco de ser manipulados de acordo com as maneiras que pensamos.

Certamente, este é um sintoma do problema, não o problema em si. A Internet não é construída para impedir as empresas de coletar todos os nossos dados e vendê-los e, em vez disso, os incentiva a fazer o possível para nos fazer querer abrir mão de nossos dados. Corrigir esse problema exigiria uma mudança fundamental no modelo de negócios da Internet, uma mudança que dificilmente ocorrerá somente das empresas e outras entidades que fazem da Internet o que é. As novas leis de privacidade da Europa estão prestes a entrar em vigor e certamente oferecem um grande incentivo para forçar as empresas a repensar suas práticas. No entanto, até que outros grandes players, como os EUA, intensifiquem e façam o mesmo, é improvável que vejamos muitas mudanças na maneira como os negócios são feitos.

Cada um de nós pode fazer o possível para proteger a si mesmo e a nossos dados, mas no final do dia, Facebook, Twitter e Google são úteis . As empresas de tecnologia continuarão explorando nossos dados e criando um falso senso de pertencimento para incentivá-lo a abrir mão de mais dados. Isso torna realmente importante lembrar: o que quer que as pessoas ou grupos apareçam nele não são pessoas ou grupos de pessoas reais, apenas projeções de pessoas no mundo digital. Pertencer a um desses grupos não é realmente pertencer. Na Internet, você não pertence a um grupo de pessoas complexas e razoáveis. Na Internet, você pertence a um algoritmo.


Agradecemos a Ian e Letty por ajudarem a editar esta postagem.