SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Uma abordagem computacional
para estudo de polimorfismos
de base única.
Orientando: Miguel Galves
Orientador: Zanoni Dias
Instituto de Computaç ão
UNICAMP
Roteiro
 Contexto
 SNPs: Polimorfismos de Base Única
 Porque estudar SNPs?
 Metodologias de estudo de SNPs:
 PCR-RLFP
 Abordagem computacional
 Etapas para o estudo de SNPs
 Alinhamento
 Detecç ão
 Correlaç ão
 Projeto PIPE
 Cronograma
Contexto
 A informaç ão genética dos seres vivos
estácodificada em cadeias de
nucleotídeos (A, C, G, T).
 Conjunto de sequências = genoma.
 Genoma armazenado na forma de DNA ou
RNA.
 Expressão gênica: geraç ão de proteínas a
partir do DNA.
 Duas etapas: transcriç ão, traduç ão.
SNPs:
Polimorfismos de base única
 Polimorfismo: mudanç a de uma ou mais
bases em sequências genêticas.
 Devem ser observadas em mais de 1% de
índividuos de uma populaç ão.
 SNP: Polimorfismo que ocorre em apenas
uma base em um dado gene.
 Poderia ser bi, tri, ou tetra alélico.
 Caso mais comum: bi-alélico.
Porque estudar SNPs?
 Correspondem a mais de 90% dos
polimorfismos nos seres humanos.
 Grande parte das doenç as com base genética
são causadas por um ou mais SNPs.
 Grande interesse das industrias farmacêuticas:
 Criaç ão de terapias específicas.
 Farmacogenética: interface entre genética e
farmacêutica.
Metodologias de estudo
de SNPs: PCR-RLFP
 RLFP - Restriction Length Fragment
Polymorphisms.
 Utiliza enzimas de restriç ão para detectar
polimorfismos.
 Restrito ao estudo de SNPs conhecidos:
 Permite detectar apenas SNPs que criem ou
destruam sítios de restriç ão.
 Depende da disponibilidade de enzimas de
restriç ão apropriadas.
Metodologias de estudo de SNPs:
Abordagem computacional
 Utiliza sequências de DNA obtidas através de
métodos de sequenciamento automático.
 Se baseia em comparaç ão utilizando
ferramentas computacionais.
 Método que estáse popularizando com o
barateamento do processo de sequenciamento
automático.
 Se beneficia do grande número de sequências
armazenadas em bases de dados públicas.
Etapas para o estudo de SNPs:
Alinhamento - Conceitos
 Inserç ão de buracos em duas sequências
deixando-as com mesmo tamanho:
 Permite criar uma pontuaç ão para avaliar os
alinhamentos obtidos.
 Exemplo: match =1, mismatch = -1, gap = -2.
 Exemplo: match =1, mismatch = -1, g = -2, h = -1
 Objetivo: obter um alinhamento ó timo entre
duas sequências.
ACGTTCGGCT
A-GTTTG-CT
Etapas para o estudo de SNPs:
Alinhamento - Estratégias
 Alinhamento global: visa gerar o melhor
alinhamento entre duas sequências.
ACTGACCTCGGG
AC-G-CGT--GG
ACTGACCTCGGG
ACGCGTGG
Etapas para o estudo de SNPs:
Alinhamento - Estratégias
 Alinhamento semi-global: utilizado para
alinhar sequências incompletas.
 Não penaliza a criaç ão de buracos no início e final
das sequências.
ACTGACC-TCGGG---
----ACCGTCGGGCGG
ACTGACCTCGGG
ACCGTCGGGCGG
Etapas para o estudo de SNPs:
Alinhamento - Estratégias
 Alinhamento local: encontra o melhor
alinhamento entre duas sub-sequências.
 Retorna apenas o alinhamento dos segmentos
que geram a maior pontuaç ão.
TCGGG
TCGGG
ACTGACCTCGGG
ACCGTCGGGCGG
Etapas para o estudo de SNPs:
Alinhamento - Problema
 Problema: alinhar
cDNA e RNA com
DNA genô mico:
 DNA muito maior que
cDNA.
 DNA pode conter
regiões de íntrons.
Etapas para o estudo de SNPs:
Alinhamento - Objetivos
 Estudar os métodos de alinhamento de
DNA genô mico e cDNA utilizados por
ferramentas de domínio público.
 Definir um conjunto de parâmetros ideais
para alinhamento de DNA com cDNA
utilizando estratégia semi-global.
 Executar testes para medir a qualidade
dos alinhamentos obtidos.
Etapas para o estudo de SNPs:
Detecç ão - Métodos existentes
 Análise de cromatograma (polyphred).
 Analisa o cromatograma obtido apó s análise
sequenciamento.
Etapas para o estudo de SNPs:
Detecç ão - Métodos existentes
 Análise de sequências alinhadas (polybayes).
 Utiliza métodos Bayesianos para determinar SNPs
em um alinhamento
Etapas para o estudo de SNPs:
Detecç ão - Objetivos
 Análise dos métodos existentes para
detecç ão de polimorfismos.
 Formulaç ão de uma nova metodologia
para detecç ão de SNPs.
 Montar casos de testes com dados reais
para avaliaç ão da metodologia proposta.
Etapas para o estudo de SNPs:
Correlaç ão - Motivaç ão
 Predisposiç ão a uma doenç a pode ser
influenciada por SNPs agindo em
conjunto.
 LD: associaç ão não-aleató ria de alelos.
 Quand um alelo estápresente, o outro
também estará, e vice-versa.
 Importante ter medidas para quantificar o
grau de correlaç ão.
Etapas para o estudo de SNPs:
Correlaç ão - Medidas Existentes
 D = PAB - PA x PB
 Primeira medida proposta.
 Não tem muita utilidade.
 D’ = D / (máx D)
 D’ = 1 representa LD completo.
 r2
= D2
/(PA x PA’ x PB x PB’)
 r2
= 1 representa LD perfeito.
 Medida utilizada para medir a utilidade de um LD.
 r2
> 1/3 indica LDs úteis em processos de
mapeamento.
Etapas para o estudo de SNPs:
Correlaç ão - Objetivos
 Análise das medidas utilizadas para
avaliaç ão de SNPs.
 Formulaç ão de uma metodologia que
permita integraç ão destas medidas ao
processo de estudo de SNPs
PIPE: Sistema de Identificaç ão
de Polimorfismos
 Programa de apoio a pequenas empresas de
base tecnoló gica.
 Concedido à empresa Scylla Bioinformática.
 Coordenaç ão: Prof. João Meidanis
 Visa desenvolver a ferramenta SIP
 Projeto serádesenvolvido nas instalaç ões da
empresa.
 Trabalho comprenderáa documentaç ão das
metodologias desenvolvidas.
Cronograma
 I - Estudo e identificaç ão de parâmetros ideais para
alinhamento.
 II - Testes com os novos métodos de alinhamento
obtidos.
 III - Escrita dos resultados obtidos nos testes.
Cronograma
 IV - Análise dos métodos existentese formulaç ão de
uma nova metodologia de correlaç ão de SNPs.
 V - Testes computacionais com os novos métodos de
correlaç ão de SNPs.
 VII - Escrita dos resultados obtidos nos testes.
Cronograma
 VII - Análise das metodologias utilizadas e formulaç ão
de uma nova metodologia de detecç ão de SNPs.
 VIII - Testes computacionais com os novos métodos
propostos.
 IX - Escrita dos resultados obtidos nos testes.
Cronograma
 X - Revisão do texto da dissertaç ão.
 XII - Defesa da dissertaç ão

Weitere ähnliche Inhalte

Ähnlich wie Abordagem computacional para estudo de SNPs

Análises de metagenomas
Análises de metagenomasAnálises de metagenomas
Análises de metagenomasLeandro Lemos
 
Análises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTAnálises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTLeandro Lemos
 
Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...Ystallonne Alves
 
Algorítimos Genéticos
Algorítimos GenéticosAlgorítimos Genéticos
Algorítimos Genéticosiaudesc
 
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...Genomika Diagnósticos
 
Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionaisFrancisco Couto
 
TCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueTCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueThiego de Oliveira
 
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPU
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPUAuxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPU
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPUIsrael Vieira
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a BioinformáticaRicardo Leite
 
Aplicação de RNA seq em biologia molecular
Aplicação de RNA seq em biologia molecularAplicação de RNA seq em biologia molecular
Aplicação de RNA seq em biologia molecularEdivaldo Júnior
 
Minicurso Técnicas de Sequenciamento e suas Aplicações
Minicurso Técnicas de Sequenciamento e suas AplicaçõesMinicurso Técnicas de Sequenciamento e suas Aplicações
Minicurso Técnicas de Sequenciamento e suas AplicaçõesAna Paula Mendes Silva
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Orlando Junior
 
Revisão sistemática - Parte 2
Revisão sistemática - Parte 2Revisão sistemática - Parte 2
Revisão sistemática - Parte 2bibmedufrgs
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de ClusterizaçãoGabriel Peixe
 

Ähnlich wie Abordagem computacional para estudo de SNPs (20)

Análises de metagenomas
Análises de metagenomasAnálises de metagenomas
Análises de metagenomas
 
Análises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RASTAnálises de sequências metagenômicas via MG-RAST
Análises de sequências metagenômicas via MG-RAST
 
Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...Predicting protein interaction sites from residue spatial sequence profile an...
Predicting protein interaction sites from residue spatial sequence profile an...
 
Aula 2 - Validação de um método análitico.pdf
Aula 2 - Validação de um método análitico.pdfAula 2 - Validação de um método análitico.pdf
Aula 2 - Validação de um método análitico.pdf
 
Algorítimos Genéticos
Algorítimos GenéticosAlgorítimos Genéticos
Algorítimos Genéticos
 
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...
Detecção de CNVs por NGS: validação de pipeline de bioinformática para painéi...
 
Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
 
Minicurso 2013
Minicurso 2013Minicurso 2013
Minicurso 2013
 
TCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da DengueTCC Bioinfomática - Genômica da Dengue
TCC Bioinfomática - Genômica da Dengue
 
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPU
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPUAuxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPU
Auxílio na Detecção de Câncer Usando Deep Learning em Redes Neurais e GPU
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 
Aplicação de RNA seq em biologia molecular
Aplicação de RNA seq em biologia molecularAplicação de RNA seq em biologia molecular
Aplicação de RNA seq em biologia molecular
 
Minicurso Técnicas de Sequenciamento e suas Aplicações
Minicurso Técnicas de Sequenciamento e suas AplicaçõesMinicurso Técnicas de Sequenciamento e suas Aplicações
Minicurso Técnicas de Sequenciamento e suas Aplicações
 
ACC-Bioinformatica-Seminario
ACC-Bioinformatica-SeminarioACC-Bioinformatica-Seminario
ACC-Bioinformatica-Seminario
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
 
Revisão sistemática - Parte 2
Revisão sistemática - Parte 2Revisão sistemática - Parte 2
Revisão sistemática - Parte 2
 
Revisão Sistemática - Parte 2
Revisão Sistemática - Parte 2Revisão Sistemática - Parte 2
Revisão Sistemática - Parte 2
 
Biologia molecular
Biologia molecularBiologia molecular
Biologia molecular
 
PCR
PCRPCR
PCR
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de Clusterização
 

Mehr von Miguel Galves

Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014
Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014
Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014Miguel Galves
 
Redis para iniciantes - TDC 2014
Redis para iniciantes - TDC 2014Redis para iniciantes - TDC 2014
Redis para iniciantes - TDC 2014Miguel Galves
 
New Strategy to detect SNPs
New Strategy to detect SNPsNew Strategy to detect SNPs
New Strategy to detect SNPsMiguel Galves
 
Comparison of Genomic DNA to cDNA Alignment Methods
Comparison of Genomic DNA to cDNA Alignment MethodsComparison of Genomic DNA to cDNA Alignment Methods
Comparison of Genomic DNA to cDNA Alignment MethodsMiguel Galves
 
Django: Uso de frameworks ágeis para desenvolvimento web
Django: Uso de frameworks ágeis para desenvolvimento webDjango: Uso de frameworks ágeis para desenvolvimento web
Django: Uso de frameworks ágeis para desenvolvimento webMiguel Galves
 
Data Mining em redes sociais
Data Mining em redes sociaisData Mining em redes sociais
Data Mining em redes sociaisMiguel Galves
 

Mehr von Miguel Galves (8)

Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014
Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014
Processamento de tweets em tempo real com Python, Django e Celery - TDC 2014
 
Redis para iniciantes - TDC 2014
Redis para iniciantes - TDC 2014Redis para iniciantes - TDC 2014
Redis para iniciantes - TDC 2014
 
New Strategy to detect SNPs
New Strategy to detect SNPsNew Strategy to detect SNPs
New Strategy to detect SNPs
 
Comparison of Genomic DNA to cDNA Alignment Methods
Comparison of Genomic DNA to cDNA Alignment MethodsComparison of Genomic DNA to cDNA Alignment Methods
Comparison of Genomic DNA to cDNA Alignment Methods
 
Django: Uso de frameworks ágeis para desenvolvimento web
Django: Uso de frameworks ágeis para desenvolvimento webDjango: Uso de frameworks ágeis para desenvolvimento web
Django: Uso de frameworks ágeis para desenvolvimento web
 
GIS em 3 horas
GIS em 3 horasGIS em 3 horas
GIS em 3 horas
 
AJAX
AJAXAJAX
AJAX
 
Data Mining em redes sociais
Data Mining em redes sociaisData Mining em redes sociais
Data Mining em redes sociais
 

Abordagem computacional para estudo de SNPs

  • 1. Uma abordagem computacional para estudo de polimorfismos de base única. Orientando: Miguel Galves Orientador: Zanoni Dias Instituto de Computaç ão UNICAMP
  • 2. Roteiro  Contexto  SNPs: Polimorfismos de Base Única  Porque estudar SNPs?  Metodologias de estudo de SNPs:  PCR-RLFP  Abordagem computacional  Etapas para o estudo de SNPs  Alinhamento  Detecç ão  Correlaç ão  Projeto PIPE  Cronograma
  • 3. Contexto  A informaç ão genética dos seres vivos estácodificada em cadeias de nucleotídeos (A, C, G, T).  Conjunto de sequências = genoma.  Genoma armazenado na forma de DNA ou RNA.  Expressão gênica: geraç ão de proteínas a partir do DNA.  Duas etapas: transcriç ão, traduç ão.
  • 4. SNPs: Polimorfismos de base única  Polimorfismo: mudanç a de uma ou mais bases em sequências genêticas.  Devem ser observadas em mais de 1% de índividuos de uma populaç ão.  SNP: Polimorfismo que ocorre em apenas uma base em um dado gene.  Poderia ser bi, tri, ou tetra alélico.  Caso mais comum: bi-alélico.
  • 5. Porque estudar SNPs?  Correspondem a mais de 90% dos polimorfismos nos seres humanos.  Grande parte das doenç as com base genética são causadas por um ou mais SNPs.  Grande interesse das industrias farmacêuticas:  Criaç ão de terapias específicas.  Farmacogenética: interface entre genética e farmacêutica.
  • 6. Metodologias de estudo de SNPs: PCR-RLFP  RLFP - Restriction Length Fragment Polymorphisms.  Utiliza enzimas de restriç ão para detectar polimorfismos.  Restrito ao estudo de SNPs conhecidos:  Permite detectar apenas SNPs que criem ou destruam sítios de restriç ão.  Depende da disponibilidade de enzimas de restriç ão apropriadas.
  • 7. Metodologias de estudo de SNPs: Abordagem computacional  Utiliza sequências de DNA obtidas através de métodos de sequenciamento automático.  Se baseia em comparaç ão utilizando ferramentas computacionais.  Método que estáse popularizando com o barateamento do processo de sequenciamento automático.  Se beneficia do grande número de sequências armazenadas em bases de dados públicas.
  • 8. Etapas para o estudo de SNPs: Alinhamento - Conceitos  Inserç ão de buracos em duas sequências deixando-as com mesmo tamanho:  Permite criar uma pontuaç ão para avaliar os alinhamentos obtidos.  Exemplo: match =1, mismatch = -1, gap = -2.  Exemplo: match =1, mismatch = -1, g = -2, h = -1  Objetivo: obter um alinhamento ó timo entre duas sequências. ACGTTCGGCT A-GTTTG-CT
  • 9. Etapas para o estudo de SNPs: Alinhamento - Estratégias  Alinhamento global: visa gerar o melhor alinhamento entre duas sequências. ACTGACCTCGGG AC-G-CGT--GG ACTGACCTCGGG ACGCGTGG
  • 10. Etapas para o estudo de SNPs: Alinhamento - Estratégias  Alinhamento semi-global: utilizado para alinhar sequências incompletas.  Não penaliza a criaç ão de buracos no início e final das sequências. ACTGACC-TCGGG--- ----ACCGTCGGGCGG ACTGACCTCGGG ACCGTCGGGCGG
  • 11. Etapas para o estudo de SNPs: Alinhamento - Estratégias  Alinhamento local: encontra o melhor alinhamento entre duas sub-sequências.  Retorna apenas o alinhamento dos segmentos que geram a maior pontuaç ão. TCGGG TCGGG ACTGACCTCGGG ACCGTCGGGCGG
  • 12. Etapas para o estudo de SNPs: Alinhamento - Problema  Problema: alinhar cDNA e RNA com DNA genô mico:  DNA muito maior que cDNA.  DNA pode conter regiões de íntrons.
  • 13. Etapas para o estudo de SNPs: Alinhamento - Objetivos  Estudar os métodos de alinhamento de DNA genô mico e cDNA utilizados por ferramentas de domínio público.  Definir um conjunto de parâmetros ideais para alinhamento de DNA com cDNA utilizando estratégia semi-global.  Executar testes para medir a qualidade dos alinhamentos obtidos.
  • 14. Etapas para o estudo de SNPs: Detecç ão - Métodos existentes  Análise de cromatograma (polyphred).  Analisa o cromatograma obtido apó s análise sequenciamento.
  • 15. Etapas para o estudo de SNPs: Detecç ão - Métodos existentes  Análise de sequências alinhadas (polybayes).  Utiliza métodos Bayesianos para determinar SNPs em um alinhamento
  • 16. Etapas para o estudo de SNPs: Detecç ão - Objetivos  Análise dos métodos existentes para detecç ão de polimorfismos.  Formulaç ão de uma nova metodologia para detecç ão de SNPs.  Montar casos de testes com dados reais para avaliaç ão da metodologia proposta.
  • 17. Etapas para o estudo de SNPs: Correlaç ão - Motivaç ão  Predisposiç ão a uma doenç a pode ser influenciada por SNPs agindo em conjunto.  LD: associaç ão não-aleató ria de alelos.  Quand um alelo estápresente, o outro também estará, e vice-versa.  Importante ter medidas para quantificar o grau de correlaç ão.
  • 18. Etapas para o estudo de SNPs: Correlaç ão - Medidas Existentes  D = PAB - PA x PB  Primeira medida proposta.  Não tem muita utilidade.  D’ = D / (máx D)  D’ = 1 representa LD completo.  r2 = D2 /(PA x PA’ x PB x PB’)  r2 = 1 representa LD perfeito.  Medida utilizada para medir a utilidade de um LD.  r2 > 1/3 indica LDs úteis em processos de mapeamento.
  • 19. Etapas para o estudo de SNPs: Correlaç ão - Objetivos  Análise das medidas utilizadas para avaliaç ão de SNPs.  Formulaç ão de uma metodologia que permita integraç ão destas medidas ao processo de estudo de SNPs
  • 20. PIPE: Sistema de Identificaç ão de Polimorfismos  Programa de apoio a pequenas empresas de base tecnoló gica.  Concedido à empresa Scylla Bioinformática.  Coordenaç ão: Prof. João Meidanis  Visa desenvolver a ferramenta SIP  Projeto serádesenvolvido nas instalaç ões da empresa.  Trabalho comprenderáa documentaç ão das metodologias desenvolvidas.
  • 21. Cronograma  I - Estudo e identificaç ão de parâmetros ideais para alinhamento.  II - Testes com os novos métodos de alinhamento obtidos.  III - Escrita dos resultados obtidos nos testes.
  • 22. Cronograma  IV - Análise dos métodos existentese formulaç ão de uma nova metodologia de correlaç ão de SNPs.  V - Testes computacionais com os novos métodos de correlaç ão de SNPs.  VII - Escrita dos resultados obtidos nos testes.
  • 23. Cronograma  VII - Análise das metodologias utilizadas e formulaç ão de uma nova metodologia de detecç ão de SNPs.  VIII - Testes computacionais com os novos métodos propostos.  IX - Escrita dos resultados obtidos nos testes.
  • 24. Cronograma  X - Revisão do texto da dissertaç ão.  XII - Defesa da dissertaç ão