SlideShare ist ein Scribd-Unternehmen logo
1 von 1
Discente | Programa de Iniciação Científica - Ciências Exatas, da Terra e Engenharias

Estudo prático no uso de Business Intelligence em
Bioinformática para análise de resultados da diferenças
das distâncias calculadas a partir da sobreposição de
trechos de proteínas
Cristiano Heleno dos Santos
Prof(a). Orientador(a): Sandro Renato Dias | Prof(a). Colaborador(a): Zilma da Silva Gusmão
Faculdade Anhanguera de Belo Horizonte | Análise e Desenvolvimento de Sistemas

Introdução
A biologia está deixando de ser uma ciência e se tornando
uma tecnologia (COWELL, 2009). Em decorrência disto, a
grande quantidade de informações geradas por biólogos,
agora armazenados em bancos de dados, somente será útil se
aplicada a inteligência necessária para gerar conhecimento. A
exemplo, o alinhamento de sequências é utilizado para a
descoberta de informações funcionais, estruturais e
evolucionárias nas sequências biológicas. Partindo da
premissa de que as sequência similares possuem estrutura e
comportamento similares, pode-se inferir sobre uma nova
sequência comparando-a a outras previamente conhecidas
(MOUNT, 2004).
Neste estudo foi utilizada especificamente uma ferramenta de
análise de BI, o QlikView, para determinar o melhor resultado
das sequências considerando as diferenças das distâncias
calculadas a partir da sobreposição da sequência de átomos.
Objetivos
Sugerir as sobreposições de proteínas mais próximas em
relação a uma proteína alvo utilizando análises, métodos e
ferramentas de BI .
Metodologia
Para este estudo foram utilizados os arquivos resultantes
(deltas) a partir de uma sobreposição de um banco de dados
contra uma proteína alvo. Os arquivos compõem a base de
dados (estrutural) com os pares de resíduos interagentes no
formato PDB (DIAS, 2011).

Figura 2 - Arquivo delta gerados
sobe a proteína alvo

Figura 1 - Trecho da proteína alvo

A figura 1 demonstra de forma gráfica um trecho da proteína
alvo contida no arquivo. A figura 2 é exemplo de arquivo que
compõe o banco de dados demonstrado pelos átomos C –
Carbono, CA – carbono alfa, N – Nitrogênio e O – oxigênio.
Os arquivos foram carregados para a base de dados da
ferramenta de análise de BI, o QlikView, e posteriormente
tratados e analisados. As figuras de 3 a 4 apresentam a
estrutura de dados e gráficos utilizados na ferramenta
QlikView.

Figura 3 – Tabela de arquivo carregados

Figura 4 – Gráfico de seqüência de sobreposições

Resultados e análise
As figuras de 5 a 8 identificam a sobreposição do par mais
próximo proteína alvo utilizando recursos gráficos, funções
matemáticas e escalas.

Figura 5 – Destaque da sobreposição sugerindo uma conformação mais
uniforme

Figura 6 – Sobreposições com valores médios
mais próximos de zero candidatos a mutação
da cadeia lateral.

Figura 7 – Escala de pesquisa de valores
atômicos da sobreposição

Figura 8 – Gráfico de resultado identificando a melhor sobreposição do
domínio de dados.

Conclusão
Com base nas análises e resultados propostos neste trabalho
é possível afirmar que o uso de BI como ferramenta de auxilio
em bioinformática é completamente factível, tendo em vista
as inúmeras possibilidades de análises, combinações,
comparações e recursos que facilitam a decisão do melhor
caminho a seguir. O QlikView se apresentou como uma
ferramenta de grande potencial para suprir esta necessidade
devido a sistemática simples e recursos de fácil operação.
O campo da bioinformática é muito vasto e o uso de BI como
auxilio decisório ainda é embrionário. Este trabalho veio
contribuir com a abertura de novos caminhos e incentivo para
novas pesquisas e aperfeiçoamento do tema.
Realização
Instituto de Pesquisas Aplicadas
e Desenvolvimento Educacional
Apoio
Núcleo de Produção Multimídia
Patrocínio

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (20)

Postal pascoa 2012
Postal pascoa 2012Postal pascoa 2012
Postal pascoa 2012
 
Reunião Coletivo Fortalecer - 2012
Reunião Coletivo Fortalecer - 2012Reunião Coletivo Fortalecer - 2012
Reunião Coletivo Fortalecer - 2012
 
Atividade 2.2 diálogos sobre as gerações aula
Atividade 2.2 diálogos sobre as gerações   aulaAtividade 2.2 diálogos sobre as gerações   aula
Atividade 2.2 diálogos sobre as gerações aula
 
Vazios
VaziosVazios
Vazios
 
Vazios
VaziosVazios
Vazios
 
Caso ze lider
Caso ze liderCaso ze lider
Caso ze lider
 
Prisao da mulher de tiago 2
Prisao da mulher de tiago 2Prisao da mulher de tiago 2
Prisao da mulher de tiago 2
 
Programación torneo regional femenino Ángela Cañas
Programación torneo regional femenino Ángela CañasProgramación torneo regional femenino Ángela Cañas
Programación torneo regional femenino Ángela Cañas
 
A caminho jun jul 2012 3
A caminho jun jul 2012 3A caminho jun jul 2012 3
A caminho jun jul 2012 3
 
2011 requer envio de expediente ao exmo sr prefeito municipal solicitando a...
2011   requer envio de expediente ao exmo sr prefeito municipal solicitando a...2011   requer envio de expediente ao exmo sr prefeito municipal solicitando a...
2011 requer envio de expediente ao exmo sr prefeito municipal solicitando a...
 
Comissão científica II ENCOSMAT
Comissão científica II ENCOSMATComissão científica II ENCOSMAT
Comissão científica II ENCOSMAT
 
decamerom
decamerom decamerom
decamerom
 
3º calendario cinema_portugues
3º calendario cinema_portugues3º calendario cinema_portugues
3º calendario cinema_portugues
 
épocas
épocasépocas
épocas
 
Joana vasconcelos
Joana vasconcelosJoana vasconcelos
Joana vasconcelos
 
Publicação1
Publicação1Publicação1
Publicação1
 
A vaca
A vacaA vaca
A vaca
 
Introdução à engenharia de produção. Francisco Javier Cervigon Ruckaver
Introdução à engenharia de produção. Francisco Javier Cervigon RuckaverIntrodução à engenharia de produção. Francisco Javier Cervigon Ruckaver
Introdução à engenharia de produção. Francisco Javier Cervigon Ruckaver
 
Sinais de Deus
Sinais de DeusSinais de Deus
Sinais de Deus
 
4 estações do casamento
4 estações do casamento4 estações do casamento
4 estações do casamento
 

Ähnlich wie Business Intelligence em Bioinformática

Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...Vinícius Barros
 
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...Heitor Ganzeli
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Christiano Avila
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de ClusterizaçãoGabriel Peixe
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPSMarcio Duarte
 
Redes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaRedes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaAdolfo Neto
 
Aula pratica k-means-rp2009
Aula pratica k-means-rp2009Aula pratica k-means-rp2009
Aula pratica k-means-rp2009Marcelo Silva
 
ommercial banking including robustness tests
ommercial banking including robustness testsommercial banking including robustness tests
ommercial banking including robustness testsWallace Almeida
 
Apostila projeto geo 2005
Apostila projeto geo 2005Apostila projeto geo 2005
Apostila projeto geo 2005Hudson Góis
 
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...Marcos Camargo
 
Revisão Sistemática de Literatura
Revisão Sistemática de LiteraturaRevisão Sistemática de Literatura
Revisão Sistemática de LiteraturaJean Hauck
 
Versão 2 poster sbpc - grupos de pesquisa cm
Versão 2 poster sbpc - grupos de pesquisa cmVersão 2 poster sbpc - grupos de pesquisa cm
Versão 2 poster sbpc - grupos de pesquisa cmsfausto
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Avelino Ferreira Gomes Filho
 
Scientific and technological information organization in open systems: Lattes...
Scientific and technological information organization in open systems: Lattes...Scientific and technological information organization in open systems: Lattes...
Scientific and technological information organization in open systems: Lattes...Fabio Silva
 

Ähnlich wie Business Intelligence em Bioinformática (20)

Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
 
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...
Metodologia para a análise da qualidade de Web Sites baseada em técnicas de a...
 
Atlas analise de dados
Atlas analise de dadosAtlas analise de dados
Atlas analise de dados
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de Clusterização
 
Normas para Organização do TCC - CPS
Normas para Organização do TCC - CPSNormas para Organização do TCC - CPS
Normas para Organização do TCC - CPS
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
2014-CBA
2014-CBA2014-CBA
2014-CBA
 
Webmedia2007 V4
Webmedia2007 V4Webmedia2007 V4
Webmedia2007 V4
 
Redes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaRedes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação Estruturada
 
Aula pratica k-means-rp2009
Aula pratica k-means-rp2009Aula pratica k-means-rp2009
Aula pratica k-means-rp2009
 
ommercial banking including robustness tests
ommercial banking including robustness testsommercial banking including robustness tests
ommercial banking including robustness tests
 
Apostila projeto geo 2005
Apostila projeto geo 2005Apostila projeto geo 2005
Apostila projeto geo 2005
 
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
 
Revisão Sistemática de Literatura
Revisão Sistemática de LiteraturaRevisão Sistemática de Literatura
Revisão Sistemática de Literatura
 
Versão 2 poster sbpc - grupos de pesquisa cm
Versão 2 poster sbpc - grupos de pesquisa cmVersão 2 poster sbpc - grupos de pesquisa cm
Versão 2 poster sbpc - grupos de pesquisa cm
 
Pré projeto de metodologia
Pré projeto de metodologiaPré projeto de metodologia
Pré projeto de metodologia
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...
 
Ana lucia
Ana luciaAna lucia
Ana lucia
 
Scientific and technological information organization in open systems: Lattes...
Scientific and technological information organization in open systems: Lattes...Scientific and technological information organization in open systems: Lattes...
Scientific and technological information organization in open systems: Lattes...
 

Business Intelligence em Bioinformática

  • 1. Discente | Programa de Iniciação Científica - Ciências Exatas, da Terra e Engenharias Estudo prático no uso de Business Intelligence em Bioinformática para análise de resultados da diferenças das distâncias calculadas a partir da sobreposição de trechos de proteínas Cristiano Heleno dos Santos Prof(a). Orientador(a): Sandro Renato Dias | Prof(a). Colaborador(a): Zilma da Silva Gusmão Faculdade Anhanguera de Belo Horizonte | Análise e Desenvolvimento de Sistemas Introdução A biologia está deixando de ser uma ciência e se tornando uma tecnologia (COWELL, 2009). Em decorrência disto, a grande quantidade de informações geradas por biólogos, agora armazenados em bancos de dados, somente será útil se aplicada a inteligência necessária para gerar conhecimento. A exemplo, o alinhamento de sequências é utilizado para a descoberta de informações funcionais, estruturais e evolucionárias nas sequências biológicas. Partindo da premissa de que as sequência similares possuem estrutura e comportamento similares, pode-se inferir sobre uma nova sequência comparando-a a outras previamente conhecidas (MOUNT, 2004). Neste estudo foi utilizada especificamente uma ferramenta de análise de BI, o QlikView, para determinar o melhor resultado das sequências considerando as diferenças das distâncias calculadas a partir da sobreposição da sequência de átomos. Objetivos Sugerir as sobreposições de proteínas mais próximas em relação a uma proteína alvo utilizando análises, métodos e ferramentas de BI . Metodologia Para este estudo foram utilizados os arquivos resultantes (deltas) a partir de uma sobreposição de um banco de dados contra uma proteína alvo. Os arquivos compõem a base de dados (estrutural) com os pares de resíduos interagentes no formato PDB (DIAS, 2011). Figura 2 - Arquivo delta gerados sobe a proteína alvo Figura 1 - Trecho da proteína alvo A figura 1 demonstra de forma gráfica um trecho da proteína alvo contida no arquivo. A figura 2 é exemplo de arquivo que compõe o banco de dados demonstrado pelos átomos C – Carbono, CA – carbono alfa, N – Nitrogênio e O – oxigênio. Os arquivos foram carregados para a base de dados da ferramenta de análise de BI, o QlikView, e posteriormente tratados e analisados. As figuras de 3 a 4 apresentam a estrutura de dados e gráficos utilizados na ferramenta QlikView. Figura 3 – Tabela de arquivo carregados Figura 4 – Gráfico de seqüência de sobreposições Resultados e análise As figuras de 5 a 8 identificam a sobreposição do par mais próximo proteína alvo utilizando recursos gráficos, funções matemáticas e escalas. Figura 5 – Destaque da sobreposição sugerindo uma conformação mais uniforme Figura 6 – Sobreposições com valores médios mais próximos de zero candidatos a mutação da cadeia lateral. Figura 7 – Escala de pesquisa de valores atômicos da sobreposição Figura 8 – Gráfico de resultado identificando a melhor sobreposição do domínio de dados. Conclusão Com base nas análises e resultados propostos neste trabalho é possível afirmar que o uso de BI como ferramenta de auxilio em bioinformática é completamente factível, tendo em vista as inúmeras possibilidades de análises, combinações, comparações e recursos que facilitam a decisão do melhor caminho a seguir. O QlikView se apresentou como uma ferramenta de grande potencial para suprir esta necessidade devido a sistemática simples e recursos de fácil operação. O campo da bioinformática é muito vasto e o uso de BI como auxilio decisório ainda é embrionário. Este trabalho veio contribuir com a abertura de novos caminhos e incentivo para novas pesquisas e aperfeiçoamento do tema. Realização Instituto de Pesquisas Aplicadas e Desenvolvimento Educacional Apoio Núcleo de Produção Multimídia Patrocínio