1. Uma abordagem computacional
para estudo de polimorfismos
de base única.
Orientando: Miguel Galves
Orientador: Zanoni Dias
Instituto de Computaç ão
UNICAMP
2. Roteiro
Contexto
SNPs: Polimorfismos de Base Única
Porque estudar SNPs?
Metodologias de estudo de SNPs:
PCR-RLFP
Abordagem computacional
Etapas para o estudo de SNPs
Alinhamento
Detecç ão
Correlaç ão
Projeto PIPE
Cronograma
3. Contexto
A informaç ão genética dos seres vivos
estácodificada em cadeias de
nucleotídeos (A, C, G, T).
Conjunto de sequências = genoma.
Genoma armazenado na forma de DNA ou
RNA.
Expressão gênica: geraç ão de proteínas a
partir do DNA.
Duas etapas: transcriç ão, traduç ão.
4. SNPs:
Polimorfismos de base única
Polimorfismo: mudanç a de uma ou mais
bases em sequências genêticas.
Devem ser observadas em mais de 1% de
índividuos de uma populaç ão.
SNP: Polimorfismo que ocorre em apenas
uma base em um dado gene.
Poderia ser bi, tri, ou tetra alélico.
Caso mais comum: bi-alélico.
5. Porque estudar SNPs?
Correspondem a mais de 90% dos
polimorfismos nos seres humanos.
Grande parte das doenç as com base genética
são causadas por um ou mais SNPs.
Grande interesse das industrias farmacêuticas:
Criaç ão de terapias específicas.
Farmacogenética: interface entre genética e
farmacêutica.
6. Metodologias de estudo
de SNPs: PCR-RLFP
RLFP - Restriction Length Fragment
Polymorphisms.
Utiliza enzimas de restriç ão para detectar
polimorfismos.
Restrito ao estudo de SNPs conhecidos:
Permite detectar apenas SNPs que criem ou
destruam sítios de restriç ão.
Depende da disponibilidade de enzimas de
restriç ão apropriadas.
7. Metodologias de estudo de SNPs:
Abordagem computacional
Utiliza sequências de DNA obtidas através de
métodos de sequenciamento automático.
Se baseia em comparaç ão utilizando
ferramentas computacionais.
Método que estáse popularizando com o
barateamento do processo de sequenciamento
automático.
Se beneficia do grande número de sequências
armazenadas em bases de dados públicas.
8. Etapas para o estudo de SNPs:
Alinhamento - Conceitos
Inserç ão de buracos em duas sequências
deixando-as com mesmo tamanho:
Permite criar uma pontuaç ão para avaliar os
alinhamentos obtidos.
Exemplo: match =1, mismatch = -1, gap = -2.
Exemplo: match =1, mismatch = -1, g = -2, h = -1
Objetivo: obter um alinhamento ó timo entre
duas sequências.
ACGTTCGGCT
A-GTTTG-CT
9. Etapas para o estudo de SNPs:
Alinhamento - Estratégias
Alinhamento global: visa gerar o melhor
alinhamento entre duas sequências.
ACTGACCTCGGG
AC-G-CGT--GG
ACTGACCTCGGG
ACGCGTGG
10. Etapas para o estudo de SNPs:
Alinhamento - Estratégias
Alinhamento semi-global: utilizado para
alinhar sequências incompletas.
Não penaliza a criaç ão de buracos no início e final
das sequências.
ACTGACC-TCGGG---
----ACCGTCGGGCGG
ACTGACCTCGGG
ACCGTCGGGCGG
11. Etapas para o estudo de SNPs:
Alinhamento - Estratégias
Alinhamento local: encontra o melhor
alinhamento entre duas sub-sequências.
Retorna apenas o alinhamento dos segmentos
que geram a maior pontuaç ão.
TCGGG
TCGGG
ACTGACCTCGGG
ACCGTCGGGCGG
12. Etapas para o estudo de SNPs:
Alinhamento - Problema
Problema: alinhar
cDNA e RNA com
DNA genô mico:
DNA muito maior que
cDNA.
DNA pode conter
regiões de íntrons.
13. Etapas para o estudo de SNPs:
Alinhamento - Objetivos
Estudar os métodos de alinhamento de
DNA genô mico e cDNA utilizados por
ferramentas de domínio público.
Definir um conjunto de parâmetros ideais
para alinhamento de DNA com cDNA
utilizando estratégia semi-global.
Executar testes para medir a qualidade
dos alinhamentos obtidos.
14. Etapas para o estudo de SNPs:
Detecç ão - Métodos existentes
Análise de cromatograma (polyphred).
Analisa o cromatograma obtido apó s análise
sequenciamento.
15. Etapas para o estudo de SNPs:
Detecç ão - Métodos existentes
Análise de sequências alinhadas (polybayes).
Utiliza métodos Bayesianos para determinar SNPs
em um alinhamento
16. Etapas para o estudo de SNPs:
Detecç ão - Objetivos
Análise dos métodos existentes para
detecç ão de polimorfismos.
Formulaç ão de uma nova metodologia
para detecç ão de SNPs.
Montar casos de testes com dados reais
para avaliaç ão da metodologia proposta.
17. Etapas para o estudo de SNPs:
Correlaç ão - Motivaç ão
Predisposiç ão a uma doenç a pode ser
influenciada por SNPs agindo em
conjunto.
LD: associaç ão não-aleató ria de alelos.
Quand um alelo estápresente, o outro
também estará, e vice-versa.
Importante ter medidas para quantificar o
grau de correlaç ão.
18. Etapas para o estudo de SNPs:
Correlaç ão - Medidas Existentes
D = PAB - PA x PB
Primeira medida proposta.
Não tem muita utilidade.
D’ = D / (máx D)
D’ = 1 representa LD completo.
r2
= D2
/(PA x PA’ x PB x PB’)
r2
= 1 representa LD perfeito.
Medida utilizada para medir a utilidade de um LD.
r2
> 1/3 indica LDs úteis em processos de
mapeamento.
19. Etapas para o estudo de SNPs:
Correlaç ão - Objetivos
Análise das medidas utilizadas para
avaliaç ão de SNPs.
Formulaç ão de uma metodologia que
permita integraç ão destas medidas ao
processo de estudo de SNPs
20. PIPE: Sistema de Identificaç ão
de Polimorfismos
Programa de apoio a pequenas empresas de
base tecnoló gica.
Concedido à empresa Scylla Bioinformática.
Coordenaç ão: Prof. João Meidanis
Visa desenvolver a ferramenta SIP
Projeto serádesenvolvido nas instalaç ões da
empresa.
Trabalho comprenderáa documentaç ão das
metodologias desenvolvidas.
21. Cronograma
I - Estudo e identificaç ão de parâmetros ideais para
alinhamento.
II - Testes com os novos métodos de alinhamento
obtidos.
III - Escrita dos resultados obtidos nos testes.
22. Cronograma
IV - Análise dos métodos existentese formulaç ão de
uma nova metodologia de correlaç ão de SNPs.
V - Testes computacionais com os novos métodos de
correlaç ão de SNPs.
VII - Escrita dos resultados obtidos nos testes.
23. Cronograma
VII - Análise das metodologias utilizadas e formulaç ão
de uma nova metodologia de detecç ão de SNPs.
VIII - Testes computacionais com os novos métodos
propostos.
IX - Escrita dos resultados obtidos nos testes.
24. Cronograma
X - Revisão do texto da dissertaç ão.
XII - Defesa da dissertaç ão