Algoritmos falham ao tentar prever trajetória de vida de indivíduos

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda

© Shutterstock

Tech CIÊNCIA-PESQUISA 28/09/20 POR Folhapress

SÃO PAULO, SP (FOLHAPRESS) - Algoritmos de computador ditam cada vez mais as recomendações de filmes, séries e livros que as pessoas recebem na internet, mas ainda estão muito distantes da capacidade de predizer a trajetória de vida de indivíduos, mesmo quando abastecidos com grande quantidade de dados. No maior estudo já feito sobre o tema, modelos de inteligência artificial foram só um pouco melhores do que uma simples média ao tentar "prever o futuro".

PUB

"É possível que, com mais dados ou tipos diferentes de dados, as previsões poderiam ser mais precisas. Mas acho que ninguém sabe se isso é verdade neste momento", diz o coordenador do estudo, Matthew Salganik, do Departamento de Sociologia da Universidade de Princeton (EUA).

"Meu palpite é que, quando se tenta fazer predições de longo prazo sobre situações importantes da vida, sempre haverá alguns limites para a previsibilidade."

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda. Esse levantamento acompanhou 4.242 famílias que tiveram filhos por volta do ano 2000, recolhendo informações sobre essas crianças e seu entorno em seis momentos, que vão do nascimento aos 15 anos de idade.

Para cada uma dessas famílias, entrevistas feitas com mães, pais, professores e a própria criança permitiram que se formasse um banco de dados com mais de 12 mil variáveis. A proposta do grupo de Salganik era tentar usar essa massa de informações para prever o que aconteceria com as crianças conforme elas passassem dos nove para os 15 anos de idade (a última fase da pesquisa).

Com esse objetivo, o pesquisador reuniu 160 equipes diferentes de especialistas, que podiam usar diferentes metodologias de inteligência artificial para "prever o futuro". A ideia era avaliar o potencial do chamado aprendizado de máquina, no qual, em vez de testar ideias sobre como um fenômeno acontece, o programa de computador simplesmente recebe o máximo possível de informações disponíveis sobre aquele fenômeno e tenta encontrar, nessa massa de dados, os padrões que explicam seu funcionamento.

Por exemplo, o criador do algoritmo pode rotular uma grande quantidade de textos como sendo escritos em português e espanhol e determinar que o computador identifique padrões que separem os textos escritos numa língua dos escritos em outra. Com base nisso, o algoritmo "treinado" poderia determinar em que língua foi escrito um novo texto que ele receber.

Os diferentes modelos de aprendizado de máquina tinham que tentar "adivinhar" o que aconteceria com um pequeno conjunto de variáveis, no qual estavam incluídos coisas como a média de notas de cada criança na escola, a situação profissional de seus pais ou cuidadores e a queda ou aumento da renda em cada família.

Para atingir esse objetivo, os sistemas receberam mais uma colher de chá: foram "treinados" com metade da amostra de famílias. Ou seja, no começo do estudo, eles já "sabiam" como 50% das crianças estudadas tinha se saído dos nove aos 15 anos. O desafio era usar essas informações, bem como o resto dos dados, para prever como as demais crianças evoluiriam, em nível individual.

Não deu muito certo. Numa escala usada pelos pesquisadores, que vai de 0 (previsões que equivalem à média dos dados usados para "treinar" o sistema) e 1 (previsões totalmente precisas), os algoritmos com maior sucesso tiraram "notas" entre 0,2 e 0,05. Foi um resultado apenas ligeiramente melhor que o obtido por um modelo matemático simples, feito "no braço" e usando apenas quatro variáveis, entre as mais de 12 mil disponíveis na pesquisa original.

"Ainda bem que não deu certo", brinca Fernando Osório, professor do ICMC-USP (Instituto de Ciências Matemáticas e de Computação da USP) e pesquisador da área de inteligência artificial. "A gente vê algoritmos fazendo coisas muito legais, diagnosticando câncer ou Covid-19 dando um show no ser humano, e esquece que são coisas muito pontuais. Talvez máquinas conseguissem fazer previsões a curto e médio prazo em sistemas dinâmicos, porém estáveis. Mas, quando estamos falando de seis anos da vida de uma pessoa, temos sistemas muito instáveis e sujeitos a muitas variáveis externas e eventos imprevistos."

É possível comparar a natureza desse tipo de trajetória individual com a previsão do tempo, por exemplo. Ambas as coisas têm em comum a dificuldade de chegar a determinada "granularidade" dos dados, diz ele. "Ou seja, você consegue dizer 'amanhã vai chover em São Carlos', mas aí a chuva cai num bairro e não cai no outro. Imagine como é prever não só o bairro, mas a casa exata onde a chuva vai cair", compara.

Para o pesquisador, é preciso levar em conta ainda as implicações sociais de tentar alcançar esse nível de determinismo em análises do desenvolvimento humano.

"É algo que deveria fazer com que os responsáveis por políticas públicas pensem com cuidado sobre o uso de previsões, mesmo as baseadas em muitos dado e aprendizado de máquina complicado, para tomar decisões que envolvam pessoas", diz Salganik. "Além disso, como cientistas, um de nossos objetivos pode ser a compreensão das fontes dessa complexidade."

PARTILHE ESTA NOTÍCIA

RECOMENDADOS

justica Santos Há 3 Horas

Homem é flagrado abusando sexualmente de moradora em situação de rua

fama MADONNA-RIO Há 23 Horas

Show Madonna no Rio será com playback, assim como outros da turnê; entenda

mundo Miami Há 7 Horas

Saco com é cobras encontrado nas calças de passageiro em aeroporto

politica CHUVA-RS Há 5 Horas

Mortes pelas chuvas chegam a 66 e governador fala em 'Plano Marshall'

brasil enchentes no Rio Grande do Sul Há 22 Horas

Sobe para 57 o número de mortos em temporais do RS

fama MADONNA-RIO Há 6 Horas

Madonna fez da praia de Copacabana a maior pista de dança do mundo

fama PAULO-GUSTAVO Há 2 Horas

Thales Bretas relembra morte de Paulo Gustavo: 'Horas boas, horas bem amargas'

fama Bruce Willis Há 7 Horas

Após diagnóstico de demência, como está Bruce Willis?

esporte Fórmula 1 Há 22 Horas

Verstappen vence no GP de Miami a 9ª corrida sprint de Fórmula 1; Ricciardo é o 4º

tech Espaço Há 17 Horas

Missão europeia revela imagens mais detalhadas da superfície do Sol