SlideShare ist ein Scribd-Unternehmen logo
1 von 61
ANÁLISES DE
AGRUPAMENTO E
DISSIMILARIDADE

                    Mestrando: Cristiano Lemes
                             Prof: Giovani Benin




  Teoria da Seleção - 2012
ANÁLISES QUE SERÃO
ABORDADAS

   Métodos de Agrupamento:
     Variáveis Canônicas
     Componentes Principais
     Transformar matriz de similaridade em dissimilaridade


   Dissimilaridade:
      Distância Euclidiana (baseada no arquivo de médias)
      Distância Mahalabonis (considera as repetições)
      Correlação cofenética e Ponto de corte

   Bootstrap e ponto de corte em dendogramas


   Dissimilaridade através de marcadores:
      morfológicos
      Moleculares
TÉCNICAS DE AGRUPAMENTO

   Os métodos de agrupamento têm por finalidade separar um
    grupo original de observações em vários subgrupos, de forma a
    obter homogeneidade dentro e heterogeneidade entre os
    subgrupos.

   Dentre estes métodos, os hierárquicos e os de otimização são
    empregados em grande escala pelos melhoristas de plantas.
Principais análises

1 - Estimativa de uma medida de distância


        Distancia Euclidiana
        Distancia generalizada de Mahalanobis


 2 - Adoção de uma técnica de agrupamento

        Variáveis canônicas                       Dispersão gráfica
        Componentes principais
        Agrupamento de Tocher
        Agrupamento (Vizinho mais próximo, mais distante e distância
        média)
FINALIDADE:

    Reunir os genitores em grupos


             Segundo critérios de similaridade ou dissimilaridade

                   OBJETIV
                                        Homogeneidade dentro de grupos
                   OS:
                                        Heterogeneidade entre grupos

Etapas:
              1 – Estimativa das distâncias
              2 – Adoção de uma técnica de agrupamento

  Identificação do par de genitores mais similares
  Avalia a possibilidade de inclusão de novos genitores
VARIÁVEIS CANÔNICAS
-   Técnica de Dispersão Gráfica
-   exige experimento com delineamento experimental (repetições)
-    Para serem representativos as 2 primeiras variáveis devem
    explicar pelo menos 80% da variação original dos dados;
-   Abrir arquivo de médias
-   Em “Dispersão” completar com o “cre”
-   Declarar o número de variáveis
-   Nomear variáveis
Nesse caso as 2
    primeiras
    variáveis
    explicam
mais de 80% da
variação original
   dos dados
COMPONENTES PRINCIPAIS
-   Técnica de Dispersão Gráfica
-   Permitem a identificação da divergência genética
-   Não exige experimentos com delineamento experimental (usa-se apenas
    o arquivo de médias)
-   Para ser representativo os 2 primeiros componentes devem explicar
    pelo menos 80% da variação original dos dados.
Nesse caso os 2
    primeiros
 componentes
    explicam
mais de 80% da
variação original
   dos dados
C. PRINCIPAIS VS V. CANÔNICAS

   SEMELHANÇAS:
       Permitem a identificação da divergência genética;

        Possibilidade de resumir o conjunto de variáveis
        originais em poucos componentes, o que significará ter
        uma boa aproximação do comportamento dos indivíduos
        de um espaço dimensional em um espaço bi ou tri
        dimensional;

     Para   serem representativos os 2 primeiros componentes
        devem explicar pelo menos 80% da variação original dos
        dados;

       Os componentes são independentes entre si;

       Ambas utilizam dados padronizados.
TOCHER
-   Método de Agrupamento
-   A média das medidas de distância dentro de cada grupo deve ser
    menor do que as distâncias médias entre quaisquer grupo
-   Não permite comparar acessos dentro do mesmo do mesmo grupo
DISSIMILARIDADE - DISTÂNCIA DE
 EUCLIDIANA
Observações individuais


   Experimentos que não contemplam delineamento
                                                            Deve ser
   Experimentos com delineamento - Médias das repetições
                                                            evitado
   Menor precisão em relação a distancia generalizada de Mahalanobis
-   Saída do Dendograma

-   Desvantagem do Genes:

    -   Pouca possibilidade para editar e formatar as figuras
Dissimilaridade - Distância de Mahalanobis
- Leva em conta as variâncias e covariâncias e correlações residuais
entre os caracteres aferidos.
-Considera as repetições experimentais
-é possível destacar a distância generalizada de Mahalanobis D 2
- Leva em consideração a existência de correlações entre os caracteres
analisados,
 Necessita de ensaios experimentais com repetições
-Nomear as Variáveis
- Gerar Matriz
-Processar Agrupamento

-Bootstrap
    -Testa a consistência das bifurcações em porcentagem a partir de um
    número determinado de simulações
CONTRIBUIÇÃO RELATIVA DOS CARACTERES
– SINGH 1981

  Identificação dos caracteres que mais contribuíram para
   a dissimilaridade genética entre os genótipos avaliados
Dendograma gerado a partir da matriz de distância de
 Mahalanobis
CORRELAÇÃO COFENÉTICA (CCC)
Mede a correlação (ajuste) entre a matriz de distância original e as distâncias
apresentadas no dendrograma.
Muito importante quando são realizadas inferências com base no
dendrograma
Valores de CCC acima de 0,70 indicam uma representação confiável entre a
matriz de distância original e as distâncias gráficas
Abrir a “matriz de distância genética” que se deseja analisar
CONSTRUINDO DENDOGRAMAS
    NO NTSYS




- Abrir a “matriz de
   distância genética” no
   Genes

-   Exportá-lo para o Excel

-   Formatá-lo conforme o
    modelo ao lado
- NoNTSYS, em clustering, clicar
em SAHN, e no Imput file abrir a
 matriz de dissimilaridade (Excel)
                -
No output tree file, digitar
                                               um nome de saída
                                                 (exemplo DE =
                                                 dendrograma)




Em Clustering methods deixar UPGMA; aí
pedir para rodar (Compute), Com isso vai
abrir uma janela de escritas que pode ser
  fechada, e após deves buscar no canto
  inferior esquerdo da janela uma figura
   pequena em forma de dendrograma:
Clicando nela aparece a FIGURA que pode
ser formatada conforme interesse, sendo
          salva formato metafile.
Conforme exposto acima, o programa Ntsys possui vários
mecanismos que podem ser ajustados para formatar os
    dendogramas da mais adequada a cada situação
Dendograma feito no Ntsys
MATRIZ MAHALANOBIS - NTSYS

                   Idem passos anteriores para
                construção do dendograma a partir
                 da matriz de Distância Euclidiana
CCC NO NTSYS



                Lembrar do arquivo
               de saída que foi salvo
                   anteriormente
- Antes de começar o cálculo do CCC refazer analise de dissimilaridade no Ntsys,
      substituindo o nome dos genótipos por letras.

- Calcular a matriz cofenética a partir do dentrograma que foi salvo (DE). Isto é
      feito no mesmo local clustering, clicar em Cophenetic values, e em
      Imput tree file abrir o DE e na Output Coph file, colocar um nome de
      saída (CCC).

      - Após isso clicar em “Compute”.
-Depois, clicar em Graphics, em seguida em Matrix comprison plot, e no
Input file 1 (X) abrir a matriz de dissimilaridade do Excel, aquela do inicio, e
no Input file 2 (X), abrir a matriz cofenética de nome salvo (CCC).

- No Input file 3 (X) não vai nada. No Number of permutations, digitar
1000. (feito isso pedir para rodar). Vai abrir um gráfico que quando fechado
aparece uma janela de escritas, e em uma delas aparece o valor da correlação
entre as matrizes e que é o valor cofenético.
CÁLCULO DE SIMILARIDADE GENÉTICA A
PARTIR DE MARCADORES MOLECULARES




 - Juntar todos os marcadores polimórficos em única planilha do
    Excel

 - Colocar nome dos genótipos e números de códigos (exemplo
    1=cálculo da similaridade; 10=número de genótipos;
    182=número de marcadores utilizados)
- No NTSYS: entrar em Similarity, depois em quantitative date
e no Input file one buscar a planilha de dados do Excel com os
códigos, genótipos e marcadores.
- Deixar clicado X em By rows, Coefficient clicar em DICE, e
em Output file escrever qualquer nome de saída do arquivo de
similaridade (só escrever o nome que ele salva no mesmo lugar que
foi buscada a planilha de dados anterior.
- Rodar a análise (compute) e depois editar o dendograma
Transformá-la em
                                        dissimilaridade
                                     genética (1 menos os
                                           valores de
                                       similaridade que
                                            abrirem


       Após, sem números em
formato de fórmula, inserir uma
coluna e duas linhas, colocando
o nome dos genótipos em forma
de matriz, porém, nas primeiras
  três células da linha digitar os
   códigos: 2=indica cálculo de
     dissimilaridade, 10 e 10=
 indicam a dimensão da matriz.
OBRIGADO



   cristianolemes.utfpr@gmail.com

Weitere ähnliche Inhalte

Was ist angesagt?

Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...
Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...
Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...ICRISAT
 
Amostragem populacional
Amostragem populacionalAmostragem populacional
Amostragem populacionalunesp
 
Tipos de variações
Tipos de variaçõesTipos de variações
Tipos de variaçõesUERGS
 
Estufas controle climático
Estufas   controle climáticoEstufas   controle climático
Estufas controle climáticoArmindo Rosa
 
Apresentação Colheita de Soja
Apresentação Colheita de SojaApresentação Colheita de Soja
Apresentação Colheita de SojaGeagra UFG
 
Cartilha cenoura passo a passo projeto novo
Cartilha cenoura passo a passo projeto novoCartilha cenoura passo a passo projeto novo
Cartilha cenoura passo a passo projeto novoBruno No Stress
 
Mapping and association mapping
Mapping and association mappingMapping and association mapping
Mapping and association mappingFAO
 
Horta com garrafas PET
Horta com garrafas PETHorta com garrafas PET
Horta com garrafas PETFura Bolha
 
Cálculos para adubação e
Cálculos para adubação eCálculos para adubação e
Cálculos para adubação efaccamp
 
jogos matematicos
jogos matematicosjogos matematicos
jogos matematicoshome
 
Melhoramento genético do cefeeiro
Melhoramento genético do cefeeiroMelhoramento genético do cefeeiro
Melhoramento genético do cefeeiroKaique Dadalto
 
Genome to pangenome : A doorway into crops genome exploration
Genome to pangenome : A doorway into crops genome explorationGenome to pangenome : A doorway into crops genome exploration
Genome to pangenome : A doorway into crops genome explorationKiranKm11
 
Propriedades físico-químicas de agrotóxicos
Propriedades físico-químicas de agrotóxicosPropriedades físico-químicas de agrotóxicos
Propriedades físico-químicas de agrotóxicosGeagra UFG
 

Was ist angesagt? (20)

Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)Análise de Agrupamentos (Clusters)
Análise de Agrupamentos (Clusters)
 
Produção de sementes hibridas de milho
Produção de sementes hibridas de milhoProdução de sementes hibridas de milho
Produção de sementes hibridas de milho
 
Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...
Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...
Genotype x Environment (GxE) interaction studies in hybrids and elite cultiva...
 
Amostragem populacional
Amostragem populacionalAmostragem populacional
Amostragem populacional
 
Tipos de variações
Tipos de variaçõesTipos de variações
Tipos de variações
 
Estufas controle climático
Estufas   controle climáticoEstufas   controle climático
Estufas controle climático
 
Apresentação Colheita de Soja
Apresentação Colheita de SojaApresentação Colheita de Soja
Apresentação Colheita de Soja
 
Cartilha cenoura passo a passo projeto novo
Cartilha cenoura passo a passo projeto novoCartilha cenoura passo a passo projeto novo
Cartilha cenoura passo a passo projeto novo
 
Mapping and association mapping
Mapping and association mappingMapping and association mapping
Mapping and association mapping
 
Horta com garrafas PET
Horta com garrafas PETHorta com garrafas PET
Horta com garrafas PET
 
Cálculos para adubação e
Cálculos para adubação eCálculos para adubação e
Cálculos para adubação e
 
jogos matematicos
jogos matematicosjogos matematicos
jogos matematicos
 
Efeito Allee
Efeito AlleeEfeito Allee
Efeito Allee
 
Melhoramento genético do cefeeiro
Melhoramento genético do cefeeiroMelhoramento genético do cefeeiro
Melhoramento genético do cefeeiro
 
Como calcular a dosagem de vinhaça
Como  calcular  a dosagem  de  vinhaçaComo  calcular  a dosagem  de  vinhaça
Como calcular a dosagem de vinhaça
 
Estatistica resumo
Estatistica   resumoEstatistica   resumo
Estatistica resumo
 
Estatistica Basica para Saude Aula 1
Estatistica Basica para Saude Aula 1Estatistica Basica para Saude Aula 1
Estatistica Basica para Saude Aula 1
 
Genome to pangenome : A doorway into crops genome exploration
Genome to pangenome : A doorway into crops genome explorationGenome to pangenome : A doorway into crops genome exploration
Genome to pangenome : A doorway into crops genome exploration
 
Propriedades físico-químicas de agrotóxicos
Propriedades físico-químicas de agrotóxicosPropriedades físico-químicas de agrotóxicos
Propriedades físico-químicas de agrotóxicos
 
Analise de clusters
Analise de clustersAnalise de clusters
Analise de clusters
 

Andere mochten auch

Delineamento Analises Multivariadas
Delineamento  Analises MultivariadasDelineamento  Analises Multivariadas
Delineamento Analises Multivariadasbuenobio
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uemfalmeida856
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Leriaagro
 
Genética e Biologia Molecular
Genética e Biologia MolecularGenética e Biologia Molecular
Genética e Biologia MolecularEvelyn Golin
 
Calcogênios blog
Calcogênios blogCalcogênios blog
Calcogênios blogmazinha4
 
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Ivaristo Americo
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1UERGS
 
Eja metodologia políticas públicas de eja
Eja   metodologia políticas públicas de ejaEja   metodologia políticas públicas de eja
Eja metodologia políticas públicas de ejaPaulo Sérgio
 
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...Joselaine
 
Análise da escrita alfabética
Análise da escrita alfabéticaAnálise da escrita alfabética
Análise da escrita alfabéticaAnanda Lima
 
Slide linguagem Avaliação
Slide linguagem AvaliaçãoSlide linguagem Avaliação
Slide linguagem AvaliaçãoNaysa Taboada
 
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...Naysa Taboada
 
Métodos de alfabetização
Métodos de alfabetizaçãoMétodos de alfabetização
Métodos de alfabetizaçãoDayane Hofmann
 

Andere mochten auch (20)

Aula programa Genes
Aula programa GenesAula programa Genes
Aula programa Genes
 
Delineamento Analises Multivariadas
Delineamento  Analises MultivariadasDelineamento  Analises Multivariadas
Delineamento Analises Multivariadas
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uem
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02Aulamarcadoresgenticos 140828064451-phpapp02
Aulamarcadoresgenticos 140828064451-phpapp02
 
Genética e Biologia Molecular
Genética e Biologia MolecularGenética e Biologia Molecular
Genética e Biologia Molecular
 
Calcogênios blog
Calcogênios blogCalcogênios blog
Calcogênios blog
 
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
Correlação entre caracteres genotipicas, fenotipicas e ambiente segundo dr Iv...
 
Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1Genética quantitativa 2010 2v1
Genética quantitativa 2010 2v1
 
Calcogênios família 6 a - química
Calcogênios   família 6 a - químicaCalcogênios   família 6 a - química
Calcogênios família 6 a - química
 
Eja metodologia políticas públicas de eja
Eja   metodologia políticas públicas de ejaEja   metodologia políticas públicas de eja
Eja metodologia políticas públicas de eja
 
Hipoteses de escrita
Hipoteses de escritaHipoteses de escrita
Hipoteses de escrita
 
Aula 30 testes de hipóteses
Aula 30   testes de hipótesesAula 30   testes de hipóteses
Aula 30 testes de hipóteses
 
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
ALFABETIZAÇÃO DE JOVENS E ADULTOS: INSTRUMENTO DE TRANSFORMAÇÃO SOCIAL OU DE ...
 
Análise da escrita alfabética
Análise da escrita alfabéticaAnálise da escrita alfabética
Análise da escrita alfabética
 
Slide linguagem Avaliação
Slide linguagem AvaliaçãoSlide linguagem Avaliação
Slide linguagem Avaliação
 
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...Unidade 3  1º encontro   direitos de língua portuguesa e concepções de escrit...
Unidade 3 1º encontro direitos de língua portuguesa e concepções de escrit...
 
Níveis de escrita (1)pnaic
Níveis de escrita (1)pnaicNíveis de escrita (1)pnaic
Níveis de escrita (1)pnaic
 
Métodos de alfabetização
Métodos de alfabetizaçãoMétodos de alfabetização
Métodos de alfabetização
 

Ähnlich wie Análises agrupamento e dissimilaridade no Genes

Sessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesSessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesJoaquimOliveiraBapti1
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive BayesAhirton Lopes
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAdilmar Dantas
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Elaine Cecília Gatto
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasdean dundas
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasdean dundas
 
Análise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoAnálise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoVitor Vieira Vasconcelos
 
Análise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaAnálise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaVitor Vieira Vasconcelos
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesElaine Cecília Gatto
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaCarlos Moura
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automáticabutest
 
Algoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesAlgoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesXequeMateShannon
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopJoão Gabriel Lima
 

Ähnlich wie Análises agrupamento e dissimilaridade no Genes (20)

Sessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessõesSessao 6.pdf para aproveitametno em sessões
Sessao 6.pdf para aproveitametno em sessões
 
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
 
Apresentar dados
Apresentar dadosApresentar dados
Apresentar dados
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequências
 
Apresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequênciasApresentar dados na forma de distribuição de frequências
Apresentar dados na forma de distribuição de frequências
 
Análise de Agrupamentos e Regionalização
Análise de Agrupamentos e RegionalizaçãoAnálise de Agrupamentos e Regionalização
Análise de Agrupamentos e Regionalização
 
Análise de agrupamentos
Análise de agrupamentosAnálise de agrupamentos
Análise de agrupamentos
 
Análise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no GeodaAnálise de agrupamentos e regionalização - Prática no Geoda
Análise de agrupamentos e regionalização - Prática no Geoda
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de Correlações
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
Histograma
HistogramaHistograma
Histograma
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Algoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicaçõesAlgoritmos genéticos: princípios e aplicações
Algoritmos genéticos: princípios e aplicações
 
Algoritmo genético
Algoritmo genéticoAlgoritmo genético
Algoritmo genético
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
 
Estatística - Aula 2
Estatística - Aula 2Estatística - Aula 2
Estatística - Aula 2
 
Scaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with HadoopScaling bayesian network parameter learning with Hadoop
Scaling bayesian network parameter learning with Hadoop
 
Artigo tecnico RNA Iris
Artigo tecnico RNA IrisArtigo tecnico RNA Iris
Artigo tecnico RNA Iris
 

Kürzlich hochgeladen

QUIZ ensino fundamental 8º ano revisão geral
QUIZ ensino fundamental 8º ano revisão geralQUIZ ensino fundamental 8º ano revisão geral
QUIZ ensino fundamental 8º ano revisão geralAntonioVieira539017
 
Camadas da terra -Litosfera conteúdo 6º ano
Camadas da terra -Litosfera  conteúdo 6º anoCamadas da terra -Litosfera  conteúdo 6º ano
Camadas da terra -Litosfera conteúdo 6º anoRachel Facundo
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxFlviaGomes64
 
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...azulassessoria9
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfcomercial400681
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticash5kpmr7w7
 
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...MariaCristinaSouzaLe1
 
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de Led
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de LedAula 67 e 68 Robótica 8º ano Experimentando variações da matriz de Led
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de LedJaquelineBertagliaCe
 
aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptssuser2b53fe
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVlenapinto
 
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...marcelafinkler
 
classe gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxclasse gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxLuciana Luciana
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*Viviane Moreiras
 
19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdfmarlene54545
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...andreiavys
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfTutor de matemática Ícaro
 
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdf
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdfAula prática JOGO-Regencia-Verbal-e-Nominal.pdf
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdfKarinaSouzaCorreiaAl
 
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Centro Jacques Delors
 
3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptxMarlene Cunhada
 
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...azulassessoria9
 

Kürzlich hochgeladen (20)

QUIZ ensino fundamental 8º ano revisão geral
QUIZ ensino fundamental 8º ano revisão geralQUIZ ensino fundamental 8º ano revisão geral
QUIZ ensino fundamental 8º ano revisão geral
 
Camadas da terra -Litosfera conteúdo 6º ano
Camadas da terra -Litosfera  conteúdo 6º anoCamadas da terra -Litosfera  conteúdo 6º ano
Camadas da terra -Litosfera conteúdo 6º ano
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
 
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
Aula 25 - A america espanhola - colonização, exploraçãp e trabalho (mita e en...
 
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de Led
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de LedAula 67 e 68 Robótica 8º ano Experimentando variações da matriz de Led
Aula 67 e 68 Robótica 8º ano Experimentando variações da matriz de Led
 
aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XV
 
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
 
classe gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxclasse gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptx
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*
 
19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdf
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdfAula prática JOGO-Regencia-Verbal-e-Nominal.pdf
Aula prática JOGO-Regencia-Verbal-e-Nominal.pdf
 
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
 
3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx
 
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
 

Análises agrupamento e dissimilaridade no Genes

  • 1. ANÁLISES DE AGRUPAMENTO E DISSIMILARIDADE Mestrando: Cristiano Lemes Prof: Giovani Benin Teoria da Seleção - 2012
  • 2. ANÁLISES QUE SERÃO ABORDADAS  Métodos de Agrupamento:  Variáveis Canônicas  Componentes Principais  Transformar matriz de similaridade em dissimilaridade  Dissimilaridade:  Distância Euclidiana (baseada no arquivo de médias)  Distância Mahalabonis (considera as repetições)  Correlação cofenética e Ponto de corte  Bootstrap e ponto de corte em dendogramas  Dissimilaridade através de marcadores:  morfológicos  Moleculares
  • 3. TÉCNICAS DE AGRUPAMENTO  Os métodos de agrupamento têm por finalidade separar um grupo original de observações em vários subgrupos, de forma a obter homogeneidade dentro e heterogeneidade entre os subgrupos.  Dentre estes métodos, os hierárquicos e os de otimização são empregados em grande escala pelos melhoristas de plantas.
  • 4. Principais análises 1 - Estimativa de uma medida de distância Distancia Euclidiana Distancia generalizada de Mahalanobis 2 - Adoção de uma técnica de agrupamento Variáveis canônicas Dispersão gráfica Componentes principais Agrupamento de Tocher Agrupamento (Vizinho mais próximo, mais distante e distância média)
  • 5. FINALIDADE: Reunir os genitores em grupos Segundo critérios de similaridade ou dissimilaridade OBJETIV Homogeneidade dentro de grupos OS: Heterogeneidade entre grupos Etapas: 1 – Estimativa das distâncias 2 – Adoção de uma técnica de agrupamento Identificação do par de genitores mais similares Avalia a possibilidade de inclusão de novos genitores
  • 6. VARIÁVEIS CANÔNICAS - Técnica de Dispersão Gráfica - exige experimento com delineamento experimental (repetições) - Para serem representativos as 2 primeiras variáveis devem explicar pelo menos 80% da variação original dos dados;
  • 7. - Abrir arquivo de médias - Em “Dispersão” completar com o “cre” - Declarar o número de variáveis - Nomear variáveis
  • 8. Nesse caso as 2 primeiras variáveis explicam mais de 80% da variação original dos dados
  • 9.
  • 10. COMPONENTES PRINCIPAIS - Técnica de Dispersão Gráfica - Permitem a identificação da divergência genética - Não exige experimentos com delineamento experimental (usa-se apenas o arquivo de médias) - Para ser representativo os 2 primeiros componentes devem explicar pelo menos 80% da variação original dos dados.
  • 11.
  • 12.
  • 13. Nesse caso os 2 primeiros componentes explicam mais de 80% da variação original dos dados
  • 14.
  • 15. C. PRINCIPAIS VS V. CANÔNICAS  SEMELHANÇAS:  Permitem a identificação da divergência genética;  Possibilidade de resumir o conjunto de variáveis originais em poucos componentes, o que significará ter uma boa aproximação do comportamento dos indivíduos de um espaço dimensional em um espaço bi ou tri dimensional;   Para serem representativos os 2 primeiros componentes devem explicar pelo menos 80% da variação original dos dados;  Os componentes são independentes entre si;  Ambas utilizam dados padronizados.
  • 16. TOCHER - Método de Agrupamento - A média das medidas de distância dentro de cada grupo deve ser menor do que as distâncias médias entre quaisquer grupo - Não permite comparar acessos dentro do mesmo do mesmo grupo
  • 17.
  • 18.
  • 19.
  • 20. DISSIMILARIDADE - DISTÂNCIA DE EUCLIDIANA Observações individuais Experimentos que não contemplam delineamento Deve ser Experimentos com delineamento - Médias das repetições evitado Menor precisão em relação a distancia generalizada de Mahalanobis
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26. - Saída do Dendograma - Desvantagem do Genes: - Pouca possibilidade para editar e formatar as figuras
  • 27.
  • 28. Dissimilaridade - Distância de Mahalanobis - Leva em conta as variâncias e covariâncias e correlações residuais entre os caracteres aferidos. -Considera as repetições experimentais -é possível destacar a distância generalizada de Mahalanobis D 2 - Leva em consideração a existência de correlações entre os caracteres analisados, Necessita de ensaios experimentais com repetições
  • 29.
  • 30. -Nomear as Variáveis - Gerar Matriz -Processar Agrupamento -Bootstrap -Testa a consistência das bifurcações em porcentagem a partir de um número determinado de simulações
  • 31.
  • 32. CONTRIBUIÇÃO RELATIVA DOS CARACTERES – SINGH 1981 Identificação dos caracteres que mais contribuíram para a dissimilaridade genética entre os genótipos avaliados
  • 33.
  • 34. Dendograma gerado a partir da matriz de distância de Mahalanobis
  • 35.
  • 36. CORRELAÇÃO COFENÉTICA (CCC) Mede a correlação (ajuste) entre a matriz de distância original e as distâncias apresentadas no dendrograma. Muito importante quando são realizadas inferências com base no dendrograma Valores de CCC acima de 0,70 indicam uma representação confiável entre a matriz de distância original e as distâncias gráficas
  • 37.
  • 38. Abrir a “matriz de distância genética” que se deseja analisar
  • 39.
  • 40. CONSTRUINDO DENDOGRAMAS NO NTSYS - Abrir a “matriz de distância genética” no Genes - Exportá-lo para o Excel - Formatá-lo conforme o modelo ao lado
  • 41. - NoNTSYS, em clustering, clicar em SAHN, e no Imput file abrir a matriz de dissimilaridade (Excel) -
  • 42. No output tree file, digitar um nome de saída (exemplo DE = dendrograma) Em Clustering methods deixar UPGMA; aí pedir para rodar (Compute), Com isso vai abrir uma janela de escritas que pode ser fechada, e após deves buscar no canto inferior esquerdo da janela uma figura pequena em forma de dendrograma: Clicando nela aparece a FIGURA que pode ser formatada conforme interesse, sendo salva formato metafile.
  • 43.
  • 44. Conforme exposto acima, o programa Ntsys possui vários mecanismos que podem ser ajustados para formatar os dendogramas da mais adequada a cada situação
  • 46. MATRIZ MAHALANOBIS - NTSYS Idem passos anteriores para construção do dendograma a partir da matriz de Distância Euclidiana
  • 47.
  • 48.
  • 49.
  • 50.
  • 51. CCC NO NTSYS Lembrar do arquivo de saída que foi salvo anteriormente
  • 52. - Antes de começar o cálculo do CCC refazer analise de dissimilaridade no Ntsys, substituindo o nome dos genótipos por letras. - Calcular a matriz cofenética a partir do dentrograma que foi salvo (DE). Isto é feito no mesmo local clustering, clicar em Cophenetic values, e em Imput tree file abrir o DE e na Output Coph file, colocar um nome de saída (CCC). - Após isso clicar em “Compute”.
  • 53. -Depois, clicar em Graphics, em seguida em Matrix comprison plot, e no Input file 1 (X) abrir a matriz de dissimilaridade do Excel, aquela do inicio, e no Input file 2 (X), abrir a matriz cofenética de nome salvo (CCC). - No Input file 3 (X) não vai nada. No Number of permutations, digitar 1000. (feito isso pedir para rodar). Vai abrir um gráfico que quando fechado aparece uma janela de escritas, e em uma delas aparece o valor da correlação entre as matrizes e que é o valor cofenético.
  • 54.
  • 55.
  • 56. CÁLCULO DE SIMILARIDADE GENÉTICA A PARTIR DE MARCADORES MOLECULARES - Juntar todos os marcadores polimórficos em única planilha do Excel - Colocar nome dos genótipos e números de códigos (exemplo 1=cálculo da similaridade; 10=número de genótipos; 182=número de marcadores utilizados)
  • 57. - No NTSYS: entrar em Similarity, depois em quantitative date e no Input file one buscar a planilha de dados do Excel com os códigos, genótipos e marcadores. - Deixar clicado X em By rows, Coefficient clicar em DICE, e em Output file escrever qualquer nome de saída do arquivo de similaridade (só escrever o nome que ele salva no mesmo lugar que foi buscada a planilha de dados anterior. - Rodar a análise (compute) e depois editar o dendograma
  • 58.
  • 59. Transformá-la em dissimilaridade genética (1 menos os valores de similaridade que abrirem Após, sem números em formato de fórmula, inserir uma coluna e duas linhas, colocando o nome dos genótipos em forma de matriz, porém, nas primeiras três células da linha digitar os códigos: 2=indica cálculo de dissimilaridade, 10 e 10= indicam a dimensão da matriz.
  • 60.
  • 61. OBRIGADO  cristianolemes.utfpr@gmail.com