Realizar pesquisa quantitativa requer, entre outros, uma compreensão básica sobre a natureza dos dados, sobre o tipo de relação projetado e sobre as características e pressupostos das diversas técnicas de análise estatística. No campo da pesquisa social, tem-se uma demanda geral por técnicas multivariadas e que aceitem variáveis métricas e não-métricas. Isso ocorre pela complexidade dos objetos nesse campo de pesquisa e pelas circunstâncias da coleta, sobretudo via surveys, questionários e entrevistas.
Tipo de variáveis
Sobre a natureza dos dados é conveniente separar duas categorias: dados qualitativos, em escala de medida não-métrica; e os dados quantitativos, em escala de medida métrica. Os dados qualitativos indicam a presença de um atributo, característica ou propriedade, mas não a quantidade desses. Por sua vez, os dados quantitativos indicam não apenas a presença de um atributo, característica ou propriedade, mas a quantidade ou grau desses.
Os dados não-métricos podem estar na forma de uma variável nominal ou ordinal. Variáveis nominais constituem-se como não mensuráveis e sem ordenação (Ex.: Nome dos bairros, nome das escolas); as ordinais, também são não mensuráveis, mas expressam alguma ordenação (Ex.: Patente militar, série escolar). Os dados métricos podem estar na forma de uma variável discreta ou contínua/intervalar. As variáveis discretas expressam um conjunto de valores finitos e inteiros, referindo-se a contagem de algo (Ex.: Idade em anos, número de prédios em um bairro); as contínuas, expressam números reais, portanto, permitem decimais e são infinitas a priori (Ex.: Renda em reais, temperatura).
Tipo de relações
Os fenômenos da realidade, seja ela social ou não, estão inter-relacionados. No mundo físico e social as explicações e mecanismos de funcionamento (dinâmicos, complexos ou não) assumem, em grande medida, a noção de causalidade. As técnicas de dependência buscam analisar as relações de causalidade, ou o impacto de determinadas variáveis da realidade sobre outras, portanto, as relações de causalidade entre os fenômenos.
Adota-se a nomenclatura de variável dependente, variável desfecho ou variável predita aquelas variáveis que são resultadas, que são causadas ou impactadas por outras variáveis, essas chamadas de variável independente, variável causadora ou variável preditora. Essas relações podem ser diretas (A -> B), ou mediadas por outras variáveis, chamadas de variáveis mediadoras (A -> B -> C). Também podem ser relações unidirecionais (A + B ->) ou multidirecionais (A -> B; B -> A; A*B -> C). Além disso, podem ser do tipo linear, probabilístico, polinomial, entre outros. Quanto maior a complexidade da relação na realidade, do referencial teórico e do modelo de análise proposto, maior a necessidade de uma técnica multivariada que satisfaça minimamente essas características.
Há também as técnicas de interdependência. São técnicas que objetivam, por meio de análises simultâneas, verificar ou encontrar propriedades comuns, estruturas subjacentes a todo um conjunto de variáveis ou indivíduos (A e B ≈ C e D ≠ Z e W). Essas técnicas pressupõe que existem relações, causas ou condicionantes que provocam o compartilhar ou não de algumas características. Por exemplo, um grupo compartilha características com outro grupo porque ambos estão sob a atuação de uma determinada política pública, e, eventualmente, são diferentes de um terceiro grupo que não participou de tal iniciativa.
Sobre as técnicas
Na busca ou pesquisa sobre determinadas técnicas, mesmo as bivariadas, é importante atentar para os seus pressupostos e/ou suposições. As técnicas possuem limitações e exigem que sejam cumpridos determinados requisitos para que os resultados sejam válidos, generalizáveis ou com menos imprecisão. Além disso, a decisão sobre qual técnica utilizar passa pelo tipo de variável disponível e pela relação ou explicação teórica projetada. Os manuais e livros sobre estatísticas e técnicas de análise dispõe, em diferentes medidas e contextos, sobre essas características, pressupostos e suposições.
Abaixo segue um quadro (acessível aqui em PDF) que orienta na escolha de uma eventual técnica multivariada. Esse quadro ajuda a identificar alguns tipos de técnicas multivariadas mais comuns, direcionando eventuais interessados ao estudo da técnica apropriada ao interesse e objeto de pesquisa. Vale pontuar que a coleta de dados e o pré-processamento de dados também possuem requisitos, como os de consistência interna, validade e qualidade, que importam seriamente para um resultado satisfatório; além das estratégias de amostragem.
Se aproximar de técnicas quantitativas em pesquisa social inclui o conhecimento de alguma ferramenta/software, que permita opções flexíveis e potenciais. A linguagem e R e o ambiente R Studio são uma das ferramentas mais utilizadas no campo acadêmico e em diversas áreas científicas.
Referências
AGRESTI, Alan; FINLAY, Barbara. Métodos estatísticos para as ciências sociais. 4. ed. Porto Alegre: Penso, 2012.
AGRESTI, Alan. An introduction to categorical data analysis. 3. ed. Hoboken: John Wiley & Sons, 2019.
HAIR, Joseph. et al. Análise multivariada de dados. 6. ed. Porto Alegre: Bookman, 2009.
MERTLER, Craig; REINHART, Rachel Vannatta. Advanced and multivariate statistical methods: practical application and interpretation. 6. ed. New York: Routledge, 2017.
Como citar este texto:
SANTOS, Harlon Romariz Rabelo. Sobre a escolha de uma técnica multivariada. Blog Observare, 2021. Disponível em: https://observare.slg.br/sobre-a-escolha-de-uma-tecnica-multivariada/ . Acesso em: dia mês abreviado. ano.
1 thought on “Sobre a escolha de uma técnica multivariada”