Bioinformatica

Primera Parte Se nos entregó una lista de secuencias y número de accesos para buscar a qué organismo pertenecían o proteína. Se utilizó el website de NCBI para hacer este análisis. Para las secuencias de amino ácidos utilizamos el Protein BLAST. Para las secuencias de nucleótidos utilizamos Nucleotide BLAST.

Secuencia 1 Resultado 1 caaaaattcccaatttgttttttcaaacaaacttgctcagatcctcttcttcttagggat 61 caatcttcaaatcaattgttgttaaaataaatgggattaaagcgaccttatgatgctgaa 121 gagatgcaaaagtgcaatgctaagcatgcaagacagcttagttacaaaaaccataaccaa 181 tttgacgaagctattccatatcatcatgcttctatggagaagaagacaaatgttttagag 241 gatctgattggtctctgtgagaatcctacgtggactaatgatgcaaatcacgttgacaag 301 ggttttgaaacaaccggtttgtgtcaggaagattctcagtctggagtgacgactcagtca 361 gatctttctcatcaatcttctggttcagatttcacctggaagccagtggaagatgtttat 421 acttgtttgatgaatcaacctcctaggaaacaagttcttgttgggtctaatcatcaagcg 481 gatattcccgagtttgtcaaggaagagattcttgatcagtcagaggctcgaactaaggag 541 gacttagaagggaagctgatgagaaagtgtgtgataccaatgtctgactctgacctttgt 601 ggaaccggtcaaggaagaaaggaatgtctttgcctagataaaggctctattagatgtgtg 661 cggcgacatatcattgaagccagagagagtttggttgaaactattggatatgaaaggttt 721 atggagctagggttatgtgagatgggggaggaagttgcgagtttatggacagaggaagaa 781 gaagatctctttcacaaggttgtatactccaatcctttctcagcgggtcgtgacttctgg 841 aagcaattaaagggaacgtttccttcaagaaccatgaaggagttggttagctactacttc 901 aatgtcttcatcttgcggagacggggtattcagaatcggttcaaagccctagatgttaac 961 agtgatgatgacgagtggcaagttgaatacaacatttttaacagcaccaaatctttagat 1021 gaggaaaacaacaatggaaatcgctcctcatatgaagataacgaggaagaagaagaaacc 1081 agcagcaatgatgatgatgaagaagaagaagaggaagacgactcatcaagtaacgatgct 1141 cattgtgtagatacggataaggcttcaagagacggttttggtgaagaagtaaatgtggaa 1201 gacgactcatgtatgtccttcgagttacaagactccaacttgatcttcagtcacaaccca 1261 atcaaaaacagagagtgccacagatctggtgaagattcatattcatttgatgatcagaaa 1321 ttcacatcagattgttggaacaagaacaacgatctactaccaacttcaaacattattgag 1381 gagatatttggtcaagacgattggggagataaagatgataataacttgaaggagaagtaa 1441 ataaaaagttttcttctcttctttcatggattctgcagattttttttttcttaagtgaat 1501 tagataaagatgcagaagtttgaaagtttcatctttaggagttttgtgttggttaaggtt 1561 gaagaagaaaggacttcctgattgatttgactctgtaaaaaatgctattcaaatccatga 1621 acctttttttctctagttgttttagtcctcaagatctcaatgtacattattatggtataa 1681 aa Se sometió esta secuencia a nucleotide BLAST, se escogió la opción de OTHERS para buscar el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arabidopsisthaliana Resultados

Secuencia 2 Resultado MKVYFESYGCTLNKRDTLYMQAQIENTTNNLEEADVVVINSCIV KQPTETKILYRINQLKKMGKKIVLTGCMVSEPYLKYKELQDISLVNIYNQDRIKEAIE RTYKGERVLFLEKKKIYKEFARPLSKARAIIQIQEGCLWRCTYCGTKLARSMFYSYPP KLIKREIEEKLKQGIKIFYLTGPDTATYGKDINYSLADLLKDLIEIEGDFYIRVGMAN PTFFLEQIDELIDVFKSNKIFKFFHLPVQSGSNKVLKDMNRPYTIEEYKELIYKLRKH FPLATYVTDIIVGYPTETEEDFEQTLELVREIKFDGINISRFWRRPGTIAWNLKQLDP EIVTNRVKRLKEVFLQGAYERNKLWLNWEGEAIIEEKGKNNTWIAKNEMYKQIIVKGN YEEGQKIKVKIKKARAIDLIA MERDLNVTDLELVEKVKSGDRRSFSELVKRHQRSVLRMSLRFVK DMDTAEDVTQEAFIKAYEKLNTFEGRSSFKSWLFQIAVNTARNKLREWKRDTVDIDDV QLAVDAEAETTLVHTAVSDILKNEVEKLPFKQKTALVLRVYEDLSFNEIADIMECPYD TAKANYRHALMKLRQTFEQQAELKNWTEEVGGFFLEVNQRFAEAEG Se sometió a Protein BLAST y se encontró que no hay un por ciento de similaridad mayor de 45% en el banco. Encontramos que la secuencia tiene un 45% de similaridad a la proteína de Thermotoga marítima: Sadenosyl-methioninemethylthio- transferase. Resultados

Número de acceso Resultado NC_005014BX842648 Sometiendo el número encontramos que corresponde 100% a Salmonella entericasubsp. entérica serovarTyphimuriumplasmid R64 Resultados

Secuencia 3 Resultado 1 gatgaacgctggcggcgtgcttaacacatgcaagtcgaacgatgatcccagcttgctggg 61 ggattagtggcgaacgggtgagtaacacgtgagtaacctgcccttaactctgggataagc 121 ctgggaaactgggtctaataccggatatgactcctcatcgcatggtggggggtggaaagc 181 tttattgtggttttggatggactcgcggcctatcagcttgttggtgaggtaatggctcac 241 caaggcgacgacgggtagccggcctgagagggtgaccggccacactgggactgagacacg 301 gcccagactcctacgggaggcagcagtggggaatattgcacaatgggcgaaagcctgatg 361 cagcgacgccgcgtgagggatgacggccttcgggttgtaaacctctttcagtagggaaga 421 agcgaaagtgacggtacctgcagaagaagcgccggctaactacgtgccagcagccgcggt 481 aatacgtagggcgcaagcgttatccggaattattgggcgtaaagagctcgtaggcggttt 541 gtcgcgtctgccgtgaaagtccggggctcaactccggatctgcggtgggtacgggcagac 601 tagagtgatgtaggggagactggaattcctggtgtagcggtgaaatgcgcagatatcagg 661 aggaacaccgatggcgaaggcaggtctctgggcattaactgacgctgaggagcgaaagca 721 tggggagcgaacaggattagataccctggtagtccatgccgtaaacgttgggcactaggt 781 gtgggggacattccacgttttccgcgccgtagctaacgcattaagtgccccgcctgggga 841 gtacggccgcaaggctaaaactcaaaggaattgacgggggcccgcacaagcggcggagca 901 tgcggattaattcgatgcaacgcgaagaaccttaccaaggcttgacatgaaccggtaata 961 cctggaaaacaggtgccccgcttgcggtcggtttacaggtggtgcatggttgtcgtcagc 1021 tcgtgtcgtgagatgttgggttaagtcccgcaacgagcgcaaccctcgttctatgttgcc 1081 agcgcgtgatggcggggactcataggagactgccggggtcaactcggaggaaggtgggga 1141 cgacgtcaaatcatcatgccccttatgtcttgggcttcacgcatgctacaatggccggta 1201 caaagggttgcgatactgtgaggtggagctaatcccaaaaagccggtctcagttcggatt 1261 ggggtctgcaactcgaccccatgaagtcggagtcgctagtaatcgcagatcagcaacgct 1321 gcggtgaatacgttcccgggccttgtacacaccgcccgtcaagtcacgaaagttggtaac 1381 acccgaagccggtggcctaaccccttgtgggagggagctgtcgaaggtgggactggcgat 1441 tgggactaagtcgtaacaaggta Se sometió esta secuencia a nucleotide BLAST, el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arthrobactersp. Resultados

Secuencia 4 Resultado 1 aattcgatgcaacgcgaagaaccttacctgggtttgacatgcacaggacgccggcagaga 61 tgtcggttcccttgtggcctgtgtgcaggtggtgcatggctgtcgtcagctcgtgtcgtg 121 agatgttgggttaagtcccgcaacgagcgcaacccttgtcctatgttgccagcgggttat 181 gccggggactcgtaggagactgccggggtcaactcggaggaaggtggggatgacgtcaag 241 tcatcatgccccttatgtccagggcttcacacatgctacaatggccggtacaaagggctg 301 cgatgccgtgaggtggagcgaatcctttcaaagccggtctcagttcggatcggggtctgc 361 aactcgaccccgtgaagtcggagtcgctagtaatcgcagatcagcaacgctgcggtgaat 421 acgttcccgggccttgtacacaccgcccgtcacgtcatgaaagtcggtaacacccgaagc 481 cggtggcctaacccttgtggagggagccgtcgaaggtgggatcggcgattgg Organismo encontrado fue Mycobacteriummucogenicum Resultados

Secuencia 5 Resultado MSRPRLIVALFLFFNVFVHGENKVKQSTIALALLPLLFTPVTKA RTPEMPVLENRAAQGDITAPGGARRLTADQTAALRDSLSDKPAKNIILLIGDGMGDSE ITAARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKT YNGALGVDIHEKDHPTILEMAKAAGLATGNVSTAELQDATPAALVAHVTSRKCYGPSA TSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETATAGEWQGKTLREQAQA RGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTPN PQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDE AVQRALEFAKKDGNTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNS EEDSQEHTGSQLRIAAYGPHAANVVGLTDQTDLFYTMKAALGLK Se encuentra que para el Protein BLAST, hay un 91% de similitud de la secuencia de una proteína de E. coli– AlkalinePhosphatase Resultados

Secuencia 6 Resultado MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANL ILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD Esta secuencia pertenece a una mutación del citocromo c de Rhodobactersphaeroides Resultados

Secuencia 7 Resultado YVEPPPAAFIGIDELGKWSFYRALIAEFIATLLFLYITVLTVIG YKSQSATDPCGGVGILGIAWAFGGMIFVLVYCTAGISGGHINPAVT Pertenece a aquaporine PIP3-like protein de Apiumgraveolens Resultados

Segunda Parte Ir al Map Viewer del Human Genome en NCBI y determinar lo siguiente: ¿Cuántoscromosomastiene un perro, una rata y Arabidopsis? Determine en quécromosoma(s) se encuentran los genes relacionados con lo siguiente: a. Anemia falciforme b. Parkinson c. Alzheimer d. fibrosis cística e. Diabetes f. cancer (seleccioneuno) UsandoGenBank Número de acceso: AF321136 a. organismo del cualproviene la secuencia b. número de genes presentes en la secuencia c. funciónsugerida de alguno de el o los genes d. Seleccione 20 nucleótidos de cualquierregión de uno de los genes. e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes. Usando BLAST Determine a quiénperteneceesasecuencia de la parte d y e a. Realiceunabúsquedausando la secuencia de DNA y proteínasque copio en 2d y 2e (arriba). b. ¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna? Ir a http://expasy.cbr.nrc.ca/tools/scnpsit1.html a. Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda. b. Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción.

Cromosomas Perro:Canis lupus familiaris 40 cromosomas Rata: Rattusnorvegicus 21 cromosomas Thale cress: Arabidopsisthaliana 5 cromosomas

Anemica falciforme Parkinson Cromosomas: 1, 2, 4, 5, 6, 8, 9, 11, 12, 17, 18, 22, X: 172 hits Cromosoma 11: 1 hit Enfermedades

Fibrosis cística Diabetes Cromosomas: 1, 7, 13, 19: 241 hits Cromosomas no relacionados: 21, 2, Y: 259 hits Enfermedades

Alzheimer Cáncer de la próstata Cromosomas no relacionados 13,15,16,18, 11, Y: 184 hits Cromosomas todos excepto Y: 600 hits Enfermedades

GenBank y Número de acceso AF321136 a. organismo del cualproviene la secuencia: Rhodobactersphaeroides b. número de genes presentes en la secuencia: Se encuentran 3 genes en la secuencia c. funciónsugerida de los genes: 1. Gen ccmH = maduración de la proteínaCcmH. 2. Gen ccmF = maduración de la proteínaCcmF. 3. Gen quecodificapara la proteínaenoyl-CoA-Hydratase d. Seleccione 20 nucleótidos: Gen ccmH : 1 atgaggctcgcggcgcttct e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes: Gen ccmH: MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANLILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD

Buscar la secuencia de DNA y proteínasquecopioanteriormente ¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna? Secuencia de DNA: 29-40 EGF_1(PS00022) 81-96 INTEGRIN_BETA(PS00243) 138-151 INTEGRIN_BETA(PS00243) Secuencia de aminoácidos: Rhodobactersphaeroides Rhodobactersphaeroides 2.4.1 RhodobactersphaeroidesKD131 BLAST

Usando http://expasy.cbr.nrc.ca/tools/scnpsit1.html Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción Resultado: PDOC00021: EGF-like domain signatures and profile Descripción: Secuencia de 30-40 residuos de aminoácidos de largo encontrada en la secuencia del factor de crecimento epidermal (EGF), el cual se ha encontradomayormente en proteínas de animales. EGF es un polipéptido de 50 aminoácidos con 3 puentesdisulfurointernos. Este primero se enlaza con altaafinidad a un receptor específico en la superficie de unacélula y luego induce sudimerización, la cualesesencialpara la activación de la tirosina-kinasa en el dominiocitoplasmático del receptor, iniciandoasíunaseñal de transducciónqueresulta en la síntesis de DNA y proliferacióncelular. Además ha sidoencontrado en el dominioextracelular de todaslasproteínas de la membrana o en proteínaque son secretadas.

Bioinformatica

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Ähnlich wie Bioinformatica

Ähnlich wie Bioinformatica (20)

Bioinformatica