NIC.br

Ir para o conteúdo
29 FEV 2024

O futuro no presente


Insper - 28/2/2024 - [gif]


Autor: Mauricio Bouskela
Assunto: Análise preditiva

Em “Análise Preditiva”, Eric Siegel explica como o uso de dados pode prever comportamentos e ajudar na tomada de decisões — algo em que o setor público deve prestar mais atenção

Toda manhã, logo ao acordar, pego meu celular e leio as mensagens do WhatsApp, vejo outras mídias sociais, abro e-mails, atualizo-me com as últimas notícias, eventualmente ouço um podcast. A cada interação, parte dos meus dados é coletada, armazenada e analisada. Coletivamente, geramos 2.5 quintilhões de bytes de dados (2,5 com 18 zeros!) por dia. Empresas como Meta, Google e Amazon vêm utilizando nossos dados para nos conhecer melhor e nos oferecer variados produtos. Do mesmo modo, quando aciono o Waze para ir de casa até o Insper, ele me indica o melhor percurso, considerando o conhecimento aprendido sobre as rotas possíveis e a situação do trânsito em tempo real para aquele meu destino. O Instagram, por sua vez, se abastece com os “likes” que dou — e cada vez mais exibe conteúdos que me manterão um tempo maior conectado nele, acumulando evidentes ganhos para a plataforma.

Com um texto fluente, repleto de insights, e seguindo um percurso ascendente de aprendizado, o livro Análise Preditiva, de Eric Siegel, ex-professor da Columbia University, nos introduz de maneira extraordinária no tema que dá título à obra — o qual se refere ao processo de uso de dados, como os que são coletados o tempo inteiro a partir de nossas pegadas digitais, com o objetivo de “prever” comportamentos futuros. Didático e valendo-se de mais de 180 exemplos práticos, o autor discorre sobre o conceito de análise preditiva (AP) em si, inteligência artificial (IA), aprendizado de máquina (contemplando, por exemplo, o método “ensemble”, que combina resultados de múltiplos modelos, e o “uplift”, voltado ao comportamento de um indivíduo), entre outros tópicos. Atento às implicações desse complexo e admirável mundo novo, destaca a importância da ética, da privacidade e da proteção dos dados. Trata-se de uma obra introdutória, não técnica, que, apesar de ter sido escrita em 2012 (e atualizada em 2017), mantém-se em sintonia com os dias de hoje, constituindo uma leitura valiosa para estudantes e profissionais da área ou qualquer pessoa interessada nesse tema fascinante que é o uso dos dados — os quais, quando analisados, planejados e convertidos em ações, podem proporcionar uma melhor qualidade de vida.

A fim de situar o leitor na forma como o livro de Siegel opera, apresento a seguir alguns exemplos de AP presentes na obra que considerei impactantes:

  1. Preocupada com a alta taxa de rotatividade de seus funcionários e os custos de retreinamento, a multinacional HP analisou dados históricos de todos os seus empregados e criou uma aplicação de AP para calcular a probabilidade de determinados integrantes da equipe “pedirem as contas”. Com essa análise, implementou ações individualizadas para a retenção de quadros, economizando cerca de 300 milhões de dólares com possíveis perdas de produtividade na substituição de funcionários;
  2. A operadora norueguesa de telefonia Telenor montou um modelo preditivo que identificava entre os clientes propensos a mudar para a concorrência (churn) apenas aqueles que permaneceriam fiéis quando contatados e persuadidos para renovar seus contratos. Assim conseguiu reduzir a rotatividade de clientes em 36%, a um custo de marketing 40% inferior;
  3. De olho na reeleição de Barack Obama ao cargo de presidente dos Estados Unidos os responsáveis por sua campanha implantaram uma AP focada em persuadir eleitores indecisos e potencialmente influenciáveis por meio de contatos diretos, como ligações telefônicas e abordagens por meio de mídias digitais. Tal estratégia, apoiada em dados precisos e modelagem de persuasão eleitoral, não deixou dúvida quanto à eficácia, demonstrada justamente pelo sucesso dos democratas, com a conquista de um novo mandato para o seu candidato;
  4. Um caso polêmico de AP ocorreu com a loja de departamentos americana Target, que, ao analisar a base de suas clientes cadastradas combinada com a de clientes de varejo, desenvolveu uma aplicação de predição de gravidez, que identificou mulheres ainda nos primeiros meses de gestação e, com isso, criou campanhas específicas de marketing de produtos de apelo para as futuras mães, gerando rentáveis oportunidades de negócios;
  5. Reconhecendo que 70% dos filmes vistos por seus assinantes são fruto de suas recomendações personalizadas, a Netflix lançou uma competição de 1 milhão de dólares visando aprimorar essas sugestões em 10%. Para isso, disponibilizou 100 milhões de avaliações anônimas de 480 mil clientes. A equipe vencedora — que alcançou um aperfeiçoamento de 10,06% — foi a que uniu esforços com grupos rivais, integrando os distintos modelos preditivos em um único sistema “ensemble”, combinando os pontos fortes e os aprendizados dos modelos das outras equipes. Siegel também menciona o uso de crowdsourcing por companhias como o Facebook, que detêm grandes quantidades de dados e desafios específicos, porém muitas vezes não conseguem analisá-los — e os terceirizam para que profissionais externos possam cooperar na sua solução;
  6. Por quatro anos, um grupo de 25 cientistas doutores da IBM dedicou-se ao desenvolvimento do Watson, um supercomputador que alcançou notoriedade ao competir no programa de TV Jeopardy!, desafiando humanos em um jogo de perguntas abertas. A complexidade do projeto residiu principalmente no treinamento do Watson em processamento de linguagem natural e na implementação de modelos “ensemble”, que testaram os limites da análise semântica e do entendimento analítico em comparação com o raciocínio humano. Sob o peso da reputação da IBM, a equipe lidou com desafios substanciais para treinar o Watson com milhões de exemplos para que, ao ser inquirido, ele pudesse avaliar as possíveis respostas e selecionar aquela com a maior probabilidade de acerto. A vitória do Watson no Jeopardy! em 2011 não só estabeleceu um marco significativo para o avanço da inteligência artificial como também impulsionou o progresso de aplicações em campos críticos como a saúde e o setor financeiro.

Todos esses episódios dão um ilustrativo panorama de como tem sido a coleta e a análise preditiva de dados combinada a ações específicas pelo setor privado. Lamentavelmente, o setor público não vem acompanhando satisfatoriamente tal tendência. Um estudo do Cetic.br[1] apontou que, embora coletem e armazenem muitos de nossos dados, apenas 25% das instituições públicas estaduais e federais brasileiras fazem a análise deles. Entre os principais motivos apontados pelos órgãos públicos para tão modesta atuação estavam a escassez de pessoas capacitadas para aquelas tarefas (41%), a falta de interesse ou necessidade (30%), a dificuldade de obter dados de qualidade (28%) e os altos custos (24%).

Os casos da HPTelenor e da campanha de Barack Obama nos inspiram a criar soluções preditivas aplicáveis no cotidiano — como, por exemplo, para diminuir a evasão escolar. Análises podem prever quais alunos têm maior risco de abandonar os cursos e devem vir acompanhadas de ações direcionadas para retê-los e engajá-los nos estudos.

Assim como a Target utilizou a análise preditiva para identificar grávidas e direcionar a elas campanhas publicitárias, as administrações públicas poderiam adotar técnicas semelhantes para prever regiões com altas taxas de gravidez e, proativamente, oferecer serviços de saúde materna e programas educacionais, otimizando a distribuição de recursos e melhorando os cuidados preventivos. De modo semelhante ao que fazem a Netflix e as redes sociais, que usam análise preditiva para personalizar conteúdo, nossos municípios poderiam usar maciçamente as análises de dados para prever necessidades dos cidadãos e oferecer serviços públicos mais personalizados e eficientes, enriquecendo a experiência urbana e fortalecendo a conexão com a comunidade.

Embora às vezes encontremos respostas imprecisas em sistemas de IA generativos — o ChatGPT, por exemplo —, compreender as complexidades envolvidas no treinamento de máquinas, como no caso do Watson, nos ajuda a ser mais compreensivos e a cultivar uma interação de maior “empatia” com a inteligência artificial, cujo potencial de uso está crescendo exponencialmente e com certeza terá um papel cada vez mais determinante no nosso cotidiano.

Ainda que indiretamente, o livro de Siegel funciona como um chamamento, uma “convocação” para que a sociedade de maneira geral, e o setor público em particular, se empenhem no uso de dados com o propósito de empregá-los no desenho de políticas capazes de transformar a vida da população — sobretudo daquela mais vulnerável.