Este documento describe el uso de Python para la bioinformática y la biología molecular. Explica que Python es un lenguaje de programación útil para el análisis de grandes cantidades de datos biológicos debido a su facilidad de uso, capacidad de integrarse con otros programas, y aptitud para aplicaciones web. También presenta ejemplos de cómo se puede usar Python y la biblioteca Biopython para tareas comunes de bioinformática como el alineamiento de secuencias y la búsqueda de similitud.
2. La biología está siendo transformada en una ciencia de la información "LOS COMPUTADORES SON A LA BIOLOGIA, LO QUE LA MATEMÁTICA ES A LA FISICA"
7. “ This deluge of genomic information has, in turn, led to an absolute requirement for computerized databases to store, organize, and index the data and for specialized tools to view and analyze the data.” Source: NCBI, National Center for Biotechnology Information www.ncbi.nlm.nih.gov
9. Desarrollo e implementación de herramientas para acceder, usar y administrar varios tipos de información. Desarrollo de nuevos algoritmos para establecer relaciones entre miembros de grandes cantidades de datos: Localizar genes en secuencias, predecir estructuras proteicas o función, establecer relaciones evolutivas, agrupar proteinas en familias, etc. Campos de acción de la bioinformática
10. Lenguajes: Compilados vs. Interpretados Esquema ciclo de lenguaje compilado The Intute Consortium. This material may be freely distributed and copied for educational purposes only, provided that appropriate acknowledgement is given to Intute as the copyright holder and original publisher.
16. Copia de archivo en C #include <stdio.h> int main(int argc, char **argv) { FILE *in, *out; int c; in = fopen("input.txt", "r"); out = fopen("output.txt", "w"); while ((c = fgetc(in)) != EOF) { fputc(c, out); } fclose(out); fclose(in); }
17. Copia de archivo en Python in = open("input.txt") out = open("output.txt", "w") out.writelines(in)
18.
19. Aplicaciones bioinformáticas: Búsqueda de similitud de secuencias. BLAST: B asic L ocal A lignment S earch T ool Descripción del problema: Se obtienen nuevas secuencias y se quiere averiguar su función (¿codifica para una proteína? ¿que función cumple?)
20.
21.
22. Biopython: NCBIStandalone and NCBIXML >>> from Bio.Blast import NCBIStandalone >>> rh, eh = NCBIStandalone.blastall(my_blast_exe, "blastn", my_blast_db, in_file) >>> from Bio.Blast import NCBIXML >>> blast_records = NCBIXML.parse(rh)