1. INTRODUÇÃO À ANÁLISE
MULTIVARIADA DE DADOS:
ENFOQUE INFORMÁTICO COM O
SPSSWIN
Jorge Castellá Sarriera
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
2. PARTE I
APRESENTAÇÃO DO PROGRAMA
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
3. Objetivos:
- Capacitar os alunos para que saibam
manejar o pacote estatístico SPPSS, nas
seleção e aplicação de algumas técnicas
de análise multivariada;
- Conhecer e interpretar corretamente os
dados estatísticos da aplicação de
técnicas de análise multivariada.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
4. Conteúdo:
1. Conceitos Básicos
Conceito de Análise Multivariada.
Classificação dos métodos multivariáveis.
Pré-requisitos para o estudo dos métodos de AM.
Conceito de matriz: dados, correlações, variancia-
covariância;
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
5. 2. Análise de agrupação e redução de dados
Análise Fatorial: fases da análise, métodos de
extração de fatores, análise de componentes
principais, eigenvalues e comunalidades,
rotações fatoriais (ortogonal, varimax, obliqua),
análise fatorial exploratório e confirmatório.
Análise ‘Cluster” : Tabela de aglomeração,
dendograma, cluster analyse de casos, métodos
hierárquicos e não hierárquicos.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
6. 3. Análise exploratório e confirmatório:
Análise de Regressão Multipla: Construção do modelo,
matriz de correlações, o método stepwise e seus
estatísticos, Equação de predição.
Análise de Regressão Logística: Prevalências, Odds
Ratio,
Análise discriminante: Correlações intragrupo,
coeficientes estandarizadasm correlações entre
função e variáveis, representações gráficas:
histogramas, diagramas e mapas territoriais.
Análise multivariável da variancia (MANOVA). Lamda
de Wilks, relação entre anova e manova., medidas
repetidas, análise exploratório e das configurações.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
7. Metodologia:
Breve introdução teórica para cada tipo de análise,
seguida de prática em laboratório e
posteriormente será trabalhado pelos alunos cada
tipo de análise através da leitura de um artigo
científica que o utilize, evidenciando o
conhecimento aprendido..
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
8. Referências:
Bisquerra-Alzina, R,; Sarriera, J. C. e Martinez, F. (2004)
Introdução à Estatística. Enfoque informático com o
pacote estatístico SPSS. Porto Alegre: Artmed.
Dancey, Christine & Reidy, John (2006). Estatística sem
matemática para Psicologia: Usando SPSS para Windows.
Porto Alegre: Artmed-Bookman (3 ed.).
Hair, J.; Anderson, R.;Tatham, R. & Black, W. (2005). Análise
Multivariada de Dados. Porto Alegre: Artmed-Bookman (5
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
9. Referências:
López-Valcarcel, Beatriz González (1991). Análisis
Multivariante – Aplicación al ámbito sanitario. Barcelona:
SG Editores.
Pardo, A. & Ruiz, M.A. (2003) Guia para el análisis de dados
em el SPSS. Masdrid: McGraw-Hill.
Sarriera, Jorge Castellá (1996). Introdução à análise
multivariada em psicologia. Curso UFES.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO
SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM
PSICOLOGIA
10. UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE PSICOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM PSICOLOGIA
PARTE II
INTRODUÇÃO A ANÁLISEINTRODUÇÃO A ANÁLISE
MULTIVARIADAMULTIVARIADA
11. INTRODUÇÃO A ANÁLISE MULTIVARIADAINTRODUÇÃO A ANÁLISE MULTIVARIADA
A análise estatística multivariada oferece um
conjunto de métodos apropriados para poder
responder às nossas indagações num contexto
de complexidade.
Análise multivariada: análise de múltiplas
variáveis em um único relacionamento ou
conjunto de relações (Hair e cols. 2005).
12. INTRODUÇÃO A ANÁLISE MULTIVARIADAINTRODUÇÃO A ANÁLISE MULTIVARIADA
¨Os métodos de análise multivariada
predominarão no futuro e resultarão em drásticas
mudanças na maneira como profissionais da
pesquisa pensam em problema e planejam sua
pesquisa. Esses métodos tornam possível levantar
questõesa espe4cíficas e precisas de considerável
complexidade em cenários naturais¨ (Hardyck e
Petrinovich, 2000 )
13. INTRODUÇÃO A ANÁLISE MULTIVARIADAINTRODUÇÃO A ANÁLISE MULTIVARIADA
Conceitos básicos de Análise Multivariasda:
- Variável Estatística: combinação linear de
variáveis com pesos estatísticamente
determinados;
- Escalas de medida: dados não-métricos
(qualitativos) e métricos (quantitativos).
- Erro de medida: o grau que os valores observados
não são representativos dos valores ´verdadeiros´.
14. INTRODUÇÃO A ANÁLISE MULTIVARIADAINTRODUÇÃO A ANÁLISE MULTIVARIADA
Conceitos básicos de Análise Multivariasda:
- Medida multivariada: uso de escala múltipla, unir
diversas variáveis em uma medida composta para
representar melhor um conceito.
- Significância estatística versus poder estatístico:
ao planejar uma pesquisa deve-se estimar o
tamanho do efeito e então selecionar o tamanho
da amostra e alfa para atingir o nivel de poder
desejado
15. CLASSIFICAÇÃO DE TÉCNICAS ESTATÍSTICAS
Técnicas Univariadas
Técnicas estatísticas apropriadas para a análise
de dados quando há uma medida única de cada
elemento da amostra, ou, no caso de haver
várias medidas de cada elemento, cada variável
é analisada isoladamente
16. CLASSIFICAÇÃO DE TÉCNICAS ESTATÍSTICAS
Técnicas Bivariadas e Multivariadas
Técnicas estatísticas apropriadas para a análise
de dados quando há duas ou mais medidas para
cada elemento e as variáveis são analisadas
simultaneamente. As técnicas multivariadas se
referem a relações simultâneas entre dois ou
mais fenômenos
17. CLASSIFICAÇÃO DE TÉCNICAS ESTATÍSTICAS
Técnicas Bivariadas
Dados Métricos Dados Não-métricos
Uma Amostra Duas ou Mais
Amostras
Independentes Relacionadas RelacionadasIndependentes
•Teste t
(dois grupos)
•Teste z
•ANOVA
(de um fator)
•Teste t
(emparelhados)
•Qui-Quadrado
•Mann-Whitney
•Mediana
•K-S
•Dos sinais
•Wilcoxon
•McNemar
•Qui-Quadrado
Uma Amostra Duas ou Mais
Amostras•Frequência
•Qui-Quadrado
•K-S
•Repetição
•Binomial
•Teste z
•Teste t
18. ANÁLISES MULTIVARIADAS PARA O EXAME
DE RELAÇÕES DE
DEPENDÊNCIA
Número de
variáveis
previstas
Tipo de escala de
medida da VD
Tipo de escala de
medida da VD
Modelagem de
equações
estruturais
Tipo de escala de
medida da VP
Análise de
correlação
canônica com
variáveis
dicotômicas
Regressão
múltipla
Análise
conjunta
Análise
discriminante
múltipla
Modelos
lineares de
probabilidade
Análise de
correlação
canônica
Análise
multivariada de
variância
Múltiplas relações de VDs e VIs
DiversasVDs em uma única
relação
Uma VD em uma única relação
Métrico Não-métricoMétrico
Métrico Não-métrico
Não-métrico
Hair, J. F., Anderson, R. E., Tatham, R. L.
& Black, W. C. (2005). Porto Alegre:
Bookman (p. 36).
19. ANÁLISES MULTIVARIADAS PARA O EXAME
DE RELAÇÕES DE INTERDEPENDÊNCIA
A estrutura das
relações ocorre
entre
Análise
fatorial
Análise de
correspondência
Hair, J. F., Anderson, R. E., Tatham, R. L. & Black, W. C. (2005). Porto Alegre: Bookman (p.37).
Análise de
agrupamentos
Forma de
medição dos
atributos
Escalonamento
multidimensional
Variáveis Casos/Respondentes Objeto
Métrico Não-
métricoNão-
métrico
20. TÉCNICAS DE ANÁLISE MULTIVARIADAS
MÉTODOS DE DEPENDÊNCIA
Tipos de
Análises
Regressão
Logística
Regressão
Linear Múltipla
Análise
Discriminante
Nº de Variáveis
Dependentes
Uma Uma Uma
Nº de Variáveis
Independentes
Múltiplas Múltiplas Múltiplas
Natureza da
Variável
Dependente
Categórica/
Dicotômica
Métrica Categórica
Natureza da
Variável
Independente
Categórica/
Métrica
Métrica Métrica
21. TÉCNICAS DE ANÁLISES MULTIVARIADAS
MÉTODOS DE DEPENDÊNCIA
Correlação
Canônica
MANOVA/
MANCOVA
Nº de Variáveis
Dependentes
Múltipla Múltipla
Nº de Variáveis
Independentes
Múltipla Múltipla
Natureza da
Variável
Dependente
Métrica Métrica
Natureza da
Variável
Independente
Métrica Categórica
22. TÉCNICAS DE ANÁLISES MULTIVARIADAS
MÉTODOS DE INTERDEPENDÊNCIA
(DESCRITIVOS)
Análise
Fatorial
Análise Cluster Análise de
Correspondência
Tipo de descrição Sincrônica Sincrônica Sincrônica
Níveis das
Variáveis
Métricas Métricas Categóricas
Séries
Temporais
Análise de
Sobrevida
Modelos Causais
Tipo de descrição Diacrônica Diacrônica Sincrônica
Níveis das
Variáveis
Métrica Métrica/
Categórica
Métrica
23. TÉCNICAS DE ANÁLISE MULTIVARIADAS
Análise de Correlação
Técnica estatística que resume a intensidade de associação
entre duas variáveis métricas. O coeficiente de correlação
indica o grau em que a variação de uma variável X está
relacionada com a variação de outra variável Y.
Análise de Regressão
Processo estatístico para analisar relações associativas
entre uma variável dependente métrica e uma ou mais
variáveis independentes. O objetivo da análise de
regressão é a natureza e o grau de associação entre as
variáveis; não implica nem supõe qualquer causalidade.
24. TÉCNICAS DE ANÁLISE MULTIVARIADAS
Análise Fatorial
Um nome genérico que denota uma classe de processos
utilizados essencialmente para a redução e sumarização dos
dados. Estudam-se as relações entre conjuntos de muitas
variáveis inter-relacionadas representando-as em termos de
alguns fatores fundamentais. Um fator é uma dimensão
subjacente que explica as correlações entre um conjunto de
variáveis.
Inclui a AF a análise de componentes principais e a análise de
fatores comuns. O primeiro obtêm fatores baseado na
variância total, sendo toda a variância comum ou
compartilhada. Nos fatores comuns a base é uma matriz de
correlação reduzida, trabalhando apenas com a variância
comum, excluindo as específicas e de erro.
25. TÉCNICAS DE ANÁLISE MULTIVARIADAS
Análise de Variância (ANOVA)
Técnica estatística para estudar as diferenças entre médias de
duas ou mais populações. Costumam ter uma variável
dependente métrica e uma ou mais variáveis independentes
categóricas (fatores). Em ANOVA, uma combinação particular
de níveis de fator ou categorias é chamada de tratamento.
Análise de Covariância (ANCOVA)
Processo avançado de análise de variância, em que os efeitos de
uma ou mais variáveis estranhas escalonadas metricamente são
removidas da variável dependente antes de se fazer a ANOVA.
A variável independente métrica utilizada é chamada de
covariável.
Análise de Variância Multivariada (MANOVA)
26. TÉCNICAS DE ANÁLISE MULTIVARIADAS
Análise Discriminante
Técnica de análise de dados de pesquisa quando a variável
dependente é categórica e as variáveis prognosticadoras ou
independentes têm natureza intervalar. A combinação linear de
variáveis independentes que melhor discrimine entre as
categorias da variável dependente é chamada de função
discriminante.
Correlação Canônica
Processo estatístico que mede o alcance da associação entre os
escores discriminantes e as categorias da variável dependente.
É uma medida de associação entre a função discriminante e o
conjunto de variáveis mudas (dummies) que definem a
integração do grupo.
27. TÉCNICAS DE ANÁLISE MULTIVARIADAS
ANOVA Regressão Análise
Discriminante
Nº de Variáveis
Dependentes
Uma Uma Uma
Nº de Variáveis
Independentes
Múltipla Múltipla Múltipla
Natureza da
Variável
Dependente
Métrica Métrica Categórica
Natureza da
Variável
Independente
Categórica Métrica Métrica
Semelhanças e Diferenças: ANOVA, Regressão e Análise Discriminante
28. TÉCNICAS DE ANÁLISE MULTIVARIADAS
Análise de Conglomerados
Técnica usada para classificar objetos ou casos em grupos
relativamente homogêneos chamados Conglomerados. Os
objetos em cada conglomerado tendem a ser semelhantes entre
si, mas diferentes de objetos em outros conglomerados.
Distância Euclidiana
Como o objetivo do conglomerado é agrupar objetos
semelhantes, torna-se necessário alguma medida para avaliar
quão semelhantes, ou quão diferentes são os objetos. A medida
de semelhança mais comumente utilizada é a distância
euclidiana.
29. FASES NA APLICAÇÃO DAS TÉCNICAS
MULTIVARIADAS
Fase 1. Definir o problema de
investigação
Análise dos objetivos e hipóteses
Desenvolvimento do modelo
Seleção de variáveis e sua medida
Escolha da(s) técnica(s)
Fase 2. Desenvolvimento do plano
de análises e delineamento
Implementação do modelo na técnica selecionada
Tipo de métrica das variáveis
Tamanho amostral
Instrumentos de coleta de dados
Fase 3. Supostos da técnica
selecionada
Supostos conceituais
Supostos estatísticos
Fase 4. Estimação do modelo e
avaliação do ajuste
Escolha entre procedimentos de estimação
Avaliação do ajuste e utilidade do modelo
Presença de casos isolados
Fase 5. Interpretação das
variáveis (combinações lineares)
ou outros resultados
Analisar a natureza das combinações lineares ou
novas variáveis resultantes
Re-especificação do modelo
30. QUESTÕES DE REVISÃO
1) Defina, com suas próprias palavras, análise
multivariada;
2) Justifique a relevância e a crescente
utilização dessas medidas;
3) Liste e descreva as técnicas de análise
multivariada citadas na aula de hoje. Cite
exemplos de sua utilidade
4) Por quê o conhecimento de escalas de
medida é relevante para entender a AM?
31. PRÓXIMA AULA:
PREPARAÇÃO PARA UMA ANÁLISE MULTIVARIADA
EXAMINE SEUS DADOS:
- Analisar suas variáveis com métodos
gráficos;
- Verificar e avaliar impacto de dados
perdidos;
- Determinar melhor método de
transformação de dados;
- Incorporar variáveis não-métricas como
métricas.