O papel da Sociologia na era do Big Data

por Harlon Romariz

  Com o crescente processo de digitalização da vida e da conectividade tornou-se possível o registro de uma altíssima quantidade de dados que, com a redução e simplificação da sua dimensionalidade, criou um momento informacional novo sobre a realidade humana e natural. O Big Data é fruto da digitalização massiva, da larga e crescente disponibilidade tecnológica em modo online (ROBERTSON; TRAVAGLIA, 2019).

  Estamos a todo tempo interagindo com computadores, smartphones, tabletes; carros e eletrodomésticos conectados; sensores; tecnologias de monitoramento, georreferenciamento, entre muitos outros. Toda essa interação é passível de registro, gerando dados massivos sobre quase todas as áreas da atividade humana. Isso inclui comentários na rede social, uso do cartão de crédito, pesquisas na internet, conversas, padrões de cheiros comprados na farmácia, gosto musical, o trajeto da caminhada vespertina, batimentos cardíacos e muito mais. Quanto maior a variedade de equipamentos com o qual interagimos e quanto maior a conexão, mais dados são gerados. Além disso, graças a mecanismo de inteligência artificial foi possível estruturar e disponibilizar uma inumerável quantidade de textos e imagens produzidos antes da era digital.

Um novo tipo de dado, uma nova forma de análise

  Essa disponibilidade de dados exige uma forma específica de análise, que não se iguala às clássicas formas de pesquisa amostral. São dados que exigem uma expertise específica e que, sob mecanismos de aprendizagem de máquina geram uma capacidade de informação e previsão de acontecimentos de uma maneira singular na história humana. Essa situação permite aos setores privados e públicos uma capacidade informacional, de previsão e de intervenções que não se tinha antes. “Está surgindo um campo que alavanca a capacidade de coletar e analisar dados em uma escala que pode revelar padrões de comportamento individual e de grupo” (LAZER, 2009, p. 721, tradução livre).

  Esse emergente paradigma informacional afetou todas as áreas profissionais, pois o big data e a inteligência artificial permitem um alto nível de monitoramento da realidade, o que garante tomadas de decisões mais complexas e acertadas. No setor público, essas tecnologias foram primeiramente empregadas para a área militar e de segurança, hoje, em diversos setores das políticas públicas utiliza-se crescentemente esses recursos.

  A estatística e as técnicas de amostragem foram e ainda são um recurso amplamente utilizados para conhecimento do mundo, inferências, explicações e meio para tomadas de decisões. Como apontam McFarland, Lewis e Goldberg (2016) isso foi e é amplamente utilizado por várias áreas do conhecimento, inclusive pela sociologia. De forma mais ou menos intensa entre os países, os(as) sociólogos(as) passaram a incorporar e a desenvolver metodologias quantitativas em suas pesquisas. Esses autores, entretanto, apontam para um novo momento, que vai tensionar o paradigma da amostra. O pequeno dado, geralmente de caráter amostral possui diversas vantagens, mas também limitações, como custo, operação e alcance. Esse modo relaciona-se com o ciclo clássico de pesquisa, que envolve hipóteses baseadas na teoria e em observações qualitativas, amostragem, coleta controlada de dados, testes e generalizações. Esse esquema não é totalmente aplicável para o tipo de informação do big data.

Big data representa o surgimento de uma nova classe de dados recolhidos de registros digitais de uma gama estonteante de fenômenos sociais. Os dados não são apenas grandes, mas ricos (dinâmicos e massivamente multivariados), e muitas vezes dizem respeito à forma e ao conteúdo das comunicações (links e textos). Antigas técnicas analíticas são frequentemente inaplicáveis. Como resultado, há demanda por novos métodos que reduzam e simplifiquem a dimensionalidade dos dados, identifiquem novos padrões e relações (etnografia computacional, linguística computacional, ciência de rede), que prevejam resultados (aprendizado de máquina) e implementem experimentos in situ que revelem como podemos alterar a ação nas direções desejadas. (MCFARLAND; LEWIS; GOLDBERG, 2016, p. 31, tradução livre).

  Este novo tipo de dado e as tecnologias de inteligência artificial implicadas nas análises, em especial de machine learning, estão promovendo um momento divisor de águas para as ciências sociais. Primeiro, porque demanda dos cientistas sociais uma busca por conhecer essa nova realidade e os mecanismos concernentes do processo. Segundo, porque disputará narrativas e espaço legitimado no debate público, nas tomadas de decisões e sobre as interpretações da realidade social.

  As áreas científicas especializadas e a ciência computacional e/ou área de Tecnologia da Informação possuem culturas profissionais e científicas diferentes de pesquisar/questionar. Podem até possuir dados similares e questionamentos finais similares (Ex.: O que explica esse comportamento social?), mas adotam caminhos e perspectivas diferentes. No entanto, essas diferenças não impedem uma convergência de áreas, mas exige desses profissionais uma mútua abertura e compreensão da especificidade dessas culturas. Com o fim de tornar essa massiva quantidade de dados em algo inteligível e socialmente produtivo.

Quadro 01 – Comparação de distintas culturas de pesquisa

Fonte: MCFARLAND; LEWIS; GOLDBERG, 2016, p. 25, tradução livre.

  Para alguns pesquisadores da área (MCFARLAND; LEWIS; GOLDBERG, 2016; LUO, 2019), a convergência e a união do trabalho pode evitar uma demasiada influência das áreas computacionais sobre o fazer sociológico. Isso deve forçar os sociólogos a desenvolverem novas habilidades e a se conectar com as novas tecnologias e metodologias. Igualmente importante, essa aproximação pode evitar uma diminuição do papel da teoria a uma situação secundária, contornando análises fragmentadas e desunificadas da realidade social.

  Desafia-se o pensar e compreender da realidade social a partir da diversidade de expertises, conhecimentos, habilidades, campos de atuação. Dessa forma, a sociologia e as ciências sociais como um todo podem desempenhar importante papel nessas redes institucionais de pesquisa, contribuindo sobretudo com seu olhar mais teórico e explicativo.

A importância da teoria

  Apesar da grande potencialidade do big data e das aplicações de inteligência artificial, há uma clara necessidade de bases explicativas para os resultados de data mining e machine learning (LUO, 2019). Trata-se em sua maioria de dados desestruturados, obtidos sem um desenho de pesquisa prévio ou amostragem tradicional, isso não seria um problema em si, mas um condicionante. Coloca-se então a necessidade de um diálogo triádico entre análise de big datas, teoria e modelo preditivos (LUO, 2019) isso porque

Em outras palavras, big data e data mining não podem independentemente gerar inferências dos seus resultados, podem apenas fazer predições pragmáticas de um tempo e espaço limitados. É a dedução teórica que ajuda-nos fazer mais amplas inferências e estender a direção da análise de big data em repetidas vezes dentro do diálogo triádico […] e assim melhorar continuamente teorias das ciências sociais, obter melhores modelos preditivos, e inferir novos fenômenos em um largo campo de possibilidades. (LOU, 2019, p. 03, tradução livre).

  A geração de hipóteses, baseada na teoria e em observações empíricas (sobretudo qualitativas) poderá ser cada vez mais orientada, também, por uma análise prévia dos dados e por padrões encontrados por inteligência artificial. No paradigma do big data previsibilidade e utilidade são os parâmetros. Entendimento e explicações são superficiais. Não se trata de negar a importância da utilidade do machine learning em diversas aplicações no mundo privado e público. No entanto, não se pode encerrar nisso, sobretudo para a compreensão de questões sociais e de políticas públicas.

  Há hoje tentativas de desenvolvimento de algoritmos que sejam capazes não apenas de prever, mas de explicar a previsão, evitando o que se conhece por black boxes. Mesmo que isso seja alcançado um dia, não se elimina o papel da reflexividade, da criticidade em relação aos dados e principalmente, de como relacionar esses resultados com uma compreensão maior e teórica da realidade.

  Além disso, como considerou Judea Pearl (2019) os resultados em inteligência artificial, principalmente em machine learning, carecem de melhores conexões causais e alerta que a ciência de dados é uma atividade para interpretação da realidade à luz dos dados, os dados em si não são espelhos da realidade. Assim, os resultados alcançados por essas técnicas podem ser vistos como ‘explicações potenciais’. Essa postura torna ainda atual as clássicas reflexões de Bourdieu (2009) sobre a necessidade de criticidade e reflexividade sobre todo o processo de pesquisa e explicação da realidade social, desde as concepções, meios, até suas conclusões.

  É importante reconhecer que dados massivos possuem alto viés na seleção de indivíduos. Quão representativos são de fato esses dados? Como um olhar científico e questionador pode contribuir no destrinchar desses dados e na real compreensão de suas potencialidades explicativas da vida social? Por conseguinte, quais as concepções e perspectivas, muitas vezes não descortinadas, que permeiam o olhar analítico das diversas culturas de pesquisa? Para McFarland, Lewis e Goldberg (2016) os engenheiros, em geral, aproximam-se de problemas sem mais preocupações teóricas e tacitamente aplicam mecanismos de aprendizagem de máquina. Uma convergência de áreas e uma troca produtiva de culturas de pesquisa pode ser uma solução eficiente e amplificadora da capacidade do big data e das ferramentas de inteligência artificial.

Em suma, os dados e métodos adotados na análise de big data nos fornecem algum caminho para uma zona de comércio através de procedimentos não-teóricos, aplicados e indutivos, por um lado, e procedimentos dedutivos de teste de hipóteses, orientados pela teoria e focados na explicação, por outro. A ciência social forense tece essas abordagens – nem oferecendo uma perspectiva puramente indutiva nem puramente dedutiva. Talvez o influxo da computação e do big data pressione as ciências sociais nessa direção, trazendo de volta um nível de aplicação prática e acelerando os ciclos de teste e exploração de hipóteses. (MCFARLAND; LEWIS; GOLDBERG, 2016, p. 31, tradução livre).

  Todas essas demandas implicam em um reposicionamento das ciências sociais frente aos citados desafios. Isso inclui pensar num ajuste do papel da sociologia no mundo científico e no debate público, o que impõe novas demandas, formações e reestruturações em um período já tão desafiador para as ciências sociais.

Duplo papel da sociologia

  Papel da sociologia é duplo: (I) propor reflexões sobre a dinâmica do Big Data, as implicações dessa nova era de informações na vida social, refletir sobre as consequências sociais e políticas do acúmulo de dados, uso de inteligência artificial para induzir comportamentos, entre inúmeros debates correlacionados, como sérias questões éticas e de privacidade[1]. (II) A segunda tarefa é passar a propor problemas de pesquisas a partir dessa enorme e escalável quantidade de dados. Isso implica em aprender e manejar ferramentas computacionais de inteligência artificial para gerar informações, – muitas impossíveis no modo analógico e/ou amostral – para desbravar os dados, encontrar padrões, para então, gerar hipóteses e explicações da lógica social. “Este ‘admirável mundo novo’ exige uma nova imaginação sociológica igualmente corajosa se quiser acompanhar o paradigma de big data em sua expansão e suas consequências inevitáveis.” (ROBERTSON; TRAVAGLIA, 2019, tradução livre). Não significa excluir do fazer sociológico a pesquisa qualitativa e quantitativa tradicional, mas de articular modos, culturas epistêmicas e perspectivas.

Considerações finais

  A era do Big Data e das metodologias computacionais deve ser encarada de forma propositiva e incorporada no fazer sociológico, em âmbito acadêmico e profissional. A potencialidade teórica das ciências sociais pode encontrar no big data e na inteligência artificial/computacional uma alavanca para ampliar suas conclusões e explicações da realidade social. Muitas teorias sociais não puderam ser melhor evidenciadas graças a ausência ou dificuldade de obtenção de dados. Teorias macro e de largo alcance possuem esse desafio. Essa massiva e quase universal quantidade de dados e inovadores métodos de análises pode significar uma oportunidade de crescimento teórico no médio prazo. Isso implica, simultaneamente, no avanço do fazer teórico e no desenvolvimento e apropriação desses recursos computacionais aplicáveis a grandes quantidade de dados.

[…] a introdução do big data pode ampliar as fronteiras das teorias científicas sociais […] no sentido de entender como comportamentos individuais estão integrados aos comportamentos coletivos, transformando campos de forças para o nível macro, e especialmente em como fenômenos emergentes são produzidos em um complexo sistema social e finamente abordar transformações não lineares do sistema. (LOU, 2019, p. 19, tradução livre).

  Trata-se de ricas possibilidades, mas que simultaneamente implicam em desafios ainda de difícil mapeamento, que demandarão esforço, construção e adaptação tanto dos cientistas sociais quanto daqueles que hoje estruturam e manejam esse universo de dados.


Notas

[1] cf. TUNES, Suzel. A parcialidade dos algoritmos. Nexo Jornal. 24 nov. 2019. Disponível em: https://www.nexojornal.com.br/externo/2019/11/24/A-parcialidade-dos-algoritmos. Acesso em: 27 nov. 2020.


Referências

BOURDIEU, Pierre. O poder simbólico. 12. ed. Rio de Janeiro: Bertrand Brasil, 2009. Capítulo II: Introdução a uma sociologia reflexiva.

LAZER, David. et al. Computational Social Science. Science, v. 323. 2009. DOI: 10.1126/science.1167742.

LUO, Jar-Der. et al. Big data research guided by sociological theory: a triadic dialogue among big data analysis, theory, and predictive models. The Journal of Chinese Sociology, v. 6, n. 11, p. 1-19. 2019. DOI: 10.1186/s40711-019-0102-4.

McFARLAND, Daniel; LEWIS, Kevin; GOLDBERG, Amir. Sociology in the Era of Big Data: the ascent of Forensic Social Science. The American Sociologist, n. 47, p. 12-35. 2016. DOI: 10.1007/s12108-015-9291-8.

PEARL, Judea. The seven tools of causal inference, with reflections on machine learning. Communications of the ACM, v. 62, n. 3, p. 54-60. 2019. DOI: 10.1145/3241036.

ROBERTSON, Hamish; TRAVAGLIA, Joanne. Big Data Sociology: preparing for the brave new world. [S.l]: The Sociological Review Blog, 2019. Disponível em: https://www.thesociologicalreview.com/big-data-sociology-preparing-for-the-brave-new-world/. Acesso em: 20 set. 2020.


Como citar este texto:

SANTOS, Harlon Romariz Rabelo. O papel da Sociologia na era do Big Data. Blog Observare: 2020. Disponível em: https://observare.slg.br/papel-da-sociologia-na-era-do-big-data/. Acesso em: dia mês abreviado. ano.

1 thought on “O papel da Sociologia na era do Big Data”

Faça um comentário