O documento discute a classificação biológica, a evolução humana, mecanismos de evolução como duplicação gênica e variações no tamanho e composição de genomas. A análise filogenética molecular permite inferir relações evolutivas entre organismos.
2. Classificação e
nomenclatura biológica
Se baseia na idéia de que organismos vivos
são divididos em espécies – grupos de
organismos similares com um reservatório
genético comum
Linnaeus – naturalista sueco – classificação em
hierarquia:
Reino, Filo, Classe, Ordem, Familia, Gênero e
Espécie
Identificação de espécie – binômio Gênero e
Espécie ex. Homo sapiens
3. Linha Evolutiva do Homem
LINHA EVOLUTIVA DO HOMEM
ORDEM PRIMATAS
SUB-ORDEM ANTROPOIDES PRÓ-SÍMIOS
GRUPO CATARRINOS PLATIRRINOS
SUPERFAMÍLIA HOMINOIDES
Hilobatídeos Pongídeos Panídeos Hominídeos
FAMÍLIA (orangotangos) (homens)
(Gibões) (Gorilas, chimpanzés)
4. Evolução Física
Postura ereta
Liberação dos
Membros superiores
Manipulação de
objetos
Alterações físicas
Evolução cerebral
Mudanças Desenvolvimento Evolução Cultural
comportamentais Social (saber do (saber erudito)
fazer)
5. Forças evolutivas
MUDANÇAS CLIMÁTICAS
FORTE PRESSÃO SELETIVA
ASSIM:
POSTURA ERETA E BIPEDALISMO
FORAM SELECIONADOS FAVORAVELMENTE
7. Duplicação dos genes
Susumu Ohno, 1970,
Evolution by gene
duplication. Berlin,
SpringerVerlag
8. Hipótese de Ohno
“Gene duplication emerged as the major
force of evolution. Only when a redundant
gene locus is created by duplication is it
permitted to accumulate forbidden
mutations and emerge as a new gene
locus with unknown function”
9. Duplicação gênica
• Duplicação em
tandem
• Translocação
• Transposição
• Não disjunção
meiótica
• Poliploidia
10. Mutações não silenciosas
Mutações específicas levam a novas
funções gênicas:
Sítio ativo de enzimas ou de
ligantes de proteínas;
Elementos reguladores determinam
expressão espaço-temporal dos
genes duplicados.
11.
12.
13. Evolução do tamanho e
Composição de genomas
Variedade em tamanho e organização do
genoma:
Bactéria marinha Brevundimonas diminuta –
1,6 Mb
Eucariotos: Neoceratodus forsteri – mais de
50Gb [1 gigabase (Gb) = 109 pb]
Variação na composição nucleotidea:
Bacteria = GC – de 20 a 70%
14. Complexidade organísmica
e o paradoxo do valor C
Amoeba dubia – 670 Gb
200 x maior que o genoma humano
Menos complexa que o ser humano
• evolução, desenvolvimento ou comportamento
Se refere ao paradoxo do valor C
quantidade característica de DNA por célula de
um organismo
Eucariotos com genomas grandes não tem
mais genes do que os que tem genomas
pequenos.
15. Consistência genômica
DNA extra
Sequencias repetitivas
Elementos transponíveis
Introns mais longos e sequencias não
codificadoras intercalam os genes
Aumento do tamanho do genomas resultou
do numero efetivo da população, diminuia
efeciencia da seleção para eliminar as
duplicações gênicas e as inserções de
elementos transponiveis
16. Modelo do paradoxo C
´O aumento do tamanho do genoma, não foi
em si próprio adaptativo, mas o DNA extra
propiciou muitas oportunidades novas para
a origem de inovações genéticas mediante
especialização da função de genes
duplicados, evolução de sequencias
reguladoras em grandes íntrons, e assim
por diante´
17. Composição de bases do
DNA genômico
Ampla variação do conteudo G+C
entre organismos éa viés mutacional
(Suoeka, 1988)
Significa mudança preferencial de GC
para AT, ou vice-versa
18. Viés mutacional
Viés mutacional pró-GC empurrará gradualmente o genoma
em direção a um conteudo de G+C mais alto
Viés mutacional pró-AT levará a um conteÚdo G+C mais
baixo.
Em regiões codificadoras, a extensão dessas mudanças é
restringida pela natureza do código genético, pois alguns
aminoácidos necessitam de códons ricos em A+T, e outros
ricos em G+C.
A terceira posição de muitos códons é mais flexível e as
diferentes composições de bases entre organismos estão
em geral refletidas em diferenças no conteúdo G+C da
terceira posição do códon, o que é simbolizado por GC3
19. Conversão gênica
enviesada
Sequencias semelhantes de DNA interagem no processo de
recombinação
Fitas de DNA de uma pequena região da dupla-hélice se separam e
formam pares de base com uma das fitas de outra dupla hélice no
mesmo núcleo.
Pareamento se faz com parte correspondente da molécula de DNA
que constitui o gene homólogo
Nessa região pareadas, as vezes há mau pareamento, são
corrigidos pelo reparo de mau pareamento, o nucleotídeo
malpareado é removido e substituído por um nucleotídeo correto
(aleatório)
Na conversão gênica enviesada há preferência pelo par G-C ou A-T
20. DIFERENÇAS ENTRE
ESPÉCIES
Divergência sinônima e não-sinônima
Duas sequencias coficadoras alinhadas, por
exemplo, sequencias de diferentes espécies, é
considerar sítio por sítio, levando em conta todas
as substituições nucleotídeas possíveis em cada
sitio seriam sinônimas e não sinônimas
Esses sítios não são fixos, mudam ao longo do
tempo
oportunidades mutacionais
21. Fungos mutualistas x patogênicos
Genômica estrutural
Contribuição para o entendimento das
relações fungo-planta do ponto de vista
evolutivo, o fato de que um microrganismo
endofítico pode se tornar patogênico.
O que faz um fungo ser patogênico?
A capacidade de causar doenças se origina de
multiplas vezes durante a evolução.
29. Comparações genômicas
permitem
Apontar novas famílias de genes que podem ter
função de virulência, permitindo sua seleção
para estudos funcionais
Identificar mecanismos patogenicos
conservados e inovações e adaptações
patogênicas de linhagens especificas
Revelar onde eventos de transferência gênica
horizontal contribuíram para aquisição de novas
funções associadas a virulência
37. E as moléculas também
Alinhamento múltiplo de proteínas ribossomais L36
38. Uso da filogenia
Historia da biogeografia
Estudar onde os organismos vivem
em seus nichos
Estudar a similaridade entre os
organismos
39. Árvore filogenética
• Diagrama constituído de nós e ramos, na qual um ramo
conecta dois nós adjacentes, representando relações de
ancestralidade.
•Representa a história evolutiva de um grupo de espécies ou
populações (árvore de espécie).
•Árvore construída apenas com um gene par cada espécie –
não representa a história evolutiva da espécie, mas sim do
gene (árvore gênica)
40. Alouatta
Ateles
raiz
Lagothrix
nó Grupos
monofiléticos
nó
Ancestral de
Lagothrix e
Brachyteles Brachyteles
Tempo evolucionário
Nó representa um unidade taxonômica (OTU), que pode ser uma
espécie atual ou ancestral
Ramo representa a relação entre táxons em termos de descendência e
ancestralidade
Comprimento do ramo representa o número de mudanças que
ocorreram ao longo do ramo desde sua separação do ancestral comum
mais recente ea raiz, ancestral comum a todos os taxons.
41. Filogenia com
características
morfológicas
Source: Cardini, A. 2003. The geometry of the
Marmot (Rodentia: Sciuridae) mandible:
phylogeny and patterns of morphological
evolution. Systematic Biology, 52(2): 186-205.
42. Filogenia geográfica
Source: Ribas, C.C. and Miyaki, C.Y. 2004. Molecular systematics in Aratinga parakeets: species limits
and historical biogeography in the ‘solstitialis’ group, and the systematic position of Nandayus
nenday. Molecular Phylogenetics and Evolution, 30: 663-675.
43. Até ~1990, as filogenias eram
baseadas na morfologia da especie
Agora temos muitas sequencias de
DNA e dados genomicos disponiveis
que podemos ter filogenia baseada na
molecular e morfologica.
44. Como é feita a analise
filogenética?
Inicia-se com um simples sequencia de 6 nucleotídeos
a partir de 5 especies:
A ACGTAA
B CCTTAA
C CGTCAA
D CGTCCG
E CGTCCG
Observe um único carácter
45. Posição 1: especie A tem um A onde todos tem um C
Posição 3: especie A tem um G onde todos tem um T
Posição 2: especie A e B tem um C onde todos tem um G
Continua com outras muitas posições
A ACGTAA
B CCTTAA
C CGTCAA
D CGTCCG
E CGTCCG
46. Análise filogenética
Dois principais métodos:
Métodos baseados em distâncias
Métodos baseados em caracteres
51. Relógio Molecular
À medida que duas
espécies divergem de um
ancestral comum,
acumulam mutações em
uma taxa regular, ficando
progressivamente mais
diferentes uma da outra...
53. Homologia
Um caráter é homólogo em dois organismos
se foi herdado por ambos a partir de seu
ancestral comum.
Para análise de sequências:
Não existe percentagem de homologia: ou uma
seqüência é homóloga, ou não é
Quanto maior a similaridade entre as
seqüências, maior a probabilidade de serem
homólogas
No entanto, duas seqüências podem ser
homólogas e não apresentar similaridades
54. Homologia
Exemplos:
Órgãos homólogos – asas de morcego e mãos de humanos (mesma origem)
Órgãos similares – asas de morcego e asas de borboleta (mesma função)
55. HOMOLOGIA vs SIMILARIDADE
Estes conceitos tendem a ser extremamente confundidos quando
aplicados a sequências de DNA e proteínas
Aplicações comuns: ‘high homology’, ‘significant homology’, ‘35%
homology’.
O termo homologia se refere a uma descendência evolucionária comum,
enquanto similaridade se refere a uma medida quantitativa daquilo que há
em comum.
56. Definições Críticas
Concluir que duas (ou mais) sequências são homólogas é uma suposição/
hipótese
Só é possível se pudermos explorar diretamente os ancestrais comuns
e todas as suas formas intermediárias
Homologia entre dois genes → Similaridade entre eles (variável observável
que pode ser expressa numericamente e correlacionada com probabilidade)
57. Homólogos: Ortólogos e Parálogos
Importante !!! Distinguir entre dois tipos de relação entre homólogos, as
quais diferem em suas implicações evolutivas e funcionais.
Ortólogos: genes presentes em diferentes
Especiação
organismos que se originaram de um
ancestral comum antes da especiação
Duplicação
do gene
Parálogos: genes presentes em um mesmo
organismo (geralmente famílias multigênicas)
que evoluíram dentro de um mesmo genoma
(antes ou depois da especiação)
58. Duplicação Gênica
Aumento da quantidade de genes nas
células
Freqüente formação de pseudo-genes
(genes que foram desligados)
59. Vantagens e Desvantagens
Vantagens:
• A comparação entre organismos muito diferentes é
possível
• Uso de genes diferentes para diferentes problemas
• A evolução molecular é melhor compreendida que a
morfológica
• Existem modelos e testes
• Relógio molecular e Neutralismo - Teoricamente é
possível datar os eventos de divergência.
60. Vantagens e Desvantagens
Desvantagens:
Técnicas mais
caras
Uso de produtos
cancerígenos e
radioativos
Árvores de genes
e não de
espécies
61. Escolha do Gene
De acordo com a taxa de substituições
nucleotídicas, levando em conta o tempo
estimado de divergência dos organismos a
serem comparados
Pseudogenes, regiões intergênicas e íntrons
são indicados para espécies próximas ou
populações
Histonas são indicadas para filogenias entre
reinos.
62. Métodos Moleculares
Extração do DNA total do
organismo
Reação de PCR com
“primers” apropriados para
amplificar o gene escolhido
Purificação dos fragmentos
Seqüenciamento
64. Análise das Seqüências
BLAST (ferramenta do NCBI)
Permite a comparação rápida da seqüência
obtida no laboratório com as seqüências
presentes nos bancos de dados
Permite a busca por seqüências semelhantes
para a construção de filogenias
65. Análise das Seqüências
Alinhamento de bases
Garante que os sítios a serem
comparados tenham maior
AAC T T probabilidade de seremThomólogosAA
C AGT C AT T GGT GT C C T T GT AGT T
AAC T T C AGT GAT T GGAGT C C T C T GT AGGT AC
G
AAT T T C AGT C AT NGGT GT C C T C T GT AGT AAC
AAC T T C AGAC AT T GGT GT C C T T T GT AGT T AC
66.
67.
68. Métodos de Reconstrução
da Filogenia
Métodos que buscam, dentre todas as
árvores possíveis, a que melhor represente a
história evolutiva dos organismos estudados:
Máxima Parcimônia
• Escolha da topologia que apresentar o menor número de
substituições.
Máxima Verossimilhança
• Escolha da topologia que apresentar o maior grau de
adequação a um modelo de substituição.
Evolução Mínima
• Escolha da topologia que apresentar o menor tamanho dos
ramos
• Problema: O número de topologias aumenta
exponencialmente com o número de OTUs.
69. N. de OTUs N. de árvores N. de árvores não
enraizadas enraizadas
2 1 1
3 3 1
4 15 3
5 105 15
6 945 105
7 10.395 945
8 135.135 1.395
9 2.027.025 135.135
10 34.459.425 2.027.025
15 2,13458 x 1014 7,90585 x 1012
20 8,20079 x 1021 2,21643 x 1020
25 1,19257 x 1030 2,53738 x 1028
30 4,9518 x 1038 8,68736 x 1036
40 1,00985 x 1057 1,31149 x 1055
50 2,75292 x 1076 2,83806 x 1074
70. CARACTERÍSTICAS DE UMA ÁRVORE FILOGENÉTICA
A maioria das árvores apresenta um padrão mais complexo →
necessidade de outros termos
Seqs. monofiléticas: derivam de um
ancestral comum
Clade: grupo de seq. monofiléticas
Grupo parafilético: quando algumas
seqs. da clade são excluídas
Grupo Polifilético: seqs. derivadas
de diferentes ancstrais
Árvore Inferida ≠ Árvore Real
71. Alinhamento de Sequências
Diferenças entre sequências são pontuadas
Se forem homólogas → ancestral comum = base para o estudo
Os métodos utilizados SEMPRE produzem uma árvore, mesmo com
informações errôneas
Os nucleotídeos homólogos devem ser comparados
72. Conversão do alinhamento em uma árvore
Diversos métodos
MATRIZ DE DISTÂNCIAS
Tabela contendo as distâncias evolucionárias entre todos os pares de
sequências.
Distância evolucionária: n° diferença de nucleotídeos = comprimento do ramo
comprimento das sequências
73. Conversão do alinhamento em uma árvore
NEIGHBOR-JOINING
- Usa os dados da matriz de distâncias
- Inicialmente, assume que há só um nó interno e todos os ramos que levam às seqs.
de DNA se irradiam dele.
- Um par de seqs. é escolhido ao acaso, removido do nó e anexado a um novo nó
- O comprimento do ramo é calculado
- Este processo é repetido com todos os possíveis pares até a identificação do
ramo com o menor comprimento
- As sequências restantes passam pelos mesmos passos descritos acima até que o
ramo com o segundo menor comprimento seja identificado, e assim
sussecivamente
74. Conversão do alinhamento em uma árvore
MÁXIMA PARSIMÔNIA
Usa os dados de alinhamento mútiplo
Parsimônia: é a preferência pela explicação mais simples para uma
observação
Estratégia que analisa diferentes árvores, identificando aquela que
apresenta a menor via evolucionária = aquela que requer o menor número
de mudanças de nucleotídeos para ir da seq. ancestral até as mais
recentes
Árvores são construídas ao acaso e o número de mudanças nucleotídicas é
calculado até todas as possíveis topologias terem sido examinadas.
75. Métodos baseados em distâncias
• A matriz de caracteres é transformada em uma
matriz de distâncias
• UGMA ( agrupamento de pares não ponderados
baseado na média aritmética)
• Quadrado mínimos (LS, least squares)
• Evolução mínima (ME, minimum evolution)
• Agrupamento de vizinho (NJ, neighborjoining)
76. Método dá máxima parcimônia (MP)
O princípio de parcimônia é um princípio filosófico
largamente empregado na Ciência.
Foi proposto por um filósofo inglês, Ockam no século
XVII e seu enunciado é aproximadamente o seguinte: S
“Se existe mais de uma explicação para uma dada
observação, devemos adotar aquela mais simples.”
O método de máxima parcimônia foi empregado em
análises de seqüências moleculares com o propósito de
reconstrução de árvores filogenéticas (Eck e Dayhoff ,
1967).
77. Método dá máxima parcimônia (MP)
•É baseado na suposição de que a árvore mais provável
é a que requer o menor número de mudanças para
explicar toda a variação observada na matriz de
caracteres (ex. seqüencias alinhadas).
• Baseia-se no principio da homologia, ou seja, se dois
táxons compartilham uma característica é porque foi
herdado do ultimo ancestral comum a ambos.
78. O princípio da parcimônia nas
reconstruções filogenéticas
•A aplicação do princípio de máxima parcimônia nas
reconstruções filogenéticas é conceitualmente muito
simples:
•Devemos escolher, dentre as árvores possíveis,
aquela com o menor número de substituições que
seja compatível com as seqüências observadas.
•Entretanto, a implementação é complexa, pois o
número de árvores possíveis pode atingir valores
muito altos.
•
79. Para 3 seq üências, existe apenas um a árvore possível
(que sejam bifurcantes, árvores tais com o A--B--C n ão
são consid erad as):
Para 4 seq üências, existem 3 árvores (bifurcantes) possíveis.
81. Avaliação da acurácia da árvore reconstruída
ANÁLISE BOOTSTRAP
Construção de um novo alinhamentoao acaso:
O novo alinhamento compreende sequências
que são diferentes do verdadeiro
Mas tem um padrão similar de variabilidade
82.
83. Quantas árvores?
•O número de árvores cresce muito rapidamente à medida que
aumenta o número de seqüências.
•Para 10 seqüências,mais de um milhão de árvores são possíveis.
Para se atingir o número de partículas elementares do Universo
conhecido (~ 1080), bastam 59 seqüências! E isso contando apenas as
árvores sem raiz e estritamente bifurcantes.