El documento presenta los resultados del análisis de 71 secuencias del gen 16S utilizando los programas BioEdit y NCBI. Los resultados incluyen la calidad, tamaño, organismo y porcentaje de similitud de cada secuencia. La mayoría de las secuencias tuvieron buena calidad y mostraron similitud con géneros como Enterobacter, Klebsiella y Pseudomonas. Algunas secuencias no pudieron ser identificadas. Los resultados se organizaron en una tabla de Excel y serán comparados en gráficos.
1. TEMA:
“ANALISIS DE SECUENCIAS DEL GN 16S”
DOCENTE:
Dr. HEBERT HERNAN SOTO GONZALES
CURSO:
BIOTECNOLOGÍA
ESTUDIANTE:
RUTH MAYRA APAZA FORAQUITA
CORREO:
ruthmayra717@gmail.com
FECHA DE ENTREGA:
17/09/2021
ILO - MOQUEGUA
UNIVERSIDAD NACIONAL DE MOQUEGUA
FACULTAD DE INGENIERIA
ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL
3. 1 INTRODUCCIÓN
La secuenciación de Sanger se basa en la polimerización del ADN y el uso de
dideoxinucleótidos que sirven como terminadores de la reacción. En la actualidad la
reacción de secuenciación se basa en una modificación de la PCR con
dideoxinucleótidos marcados con fluoróforos y se resuelve mediante una electroforesis
capilar. El sistema más utilizado es el desarrollado por Applied Biosystems.
(Bioinformatics at COMAV, 2011)
BLAST es un programa informático de alineamiento de secuencias de tipo local,
ya sea de ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia
problema contra una gran cantidad de secuencias que se encuentren en una base de
datos. (Wikipedia, 2021) La familia de programas BLAST es la más utilizada para buscar
secuencias similares en una base de datos dada una secuencia problema.
Bioedit es un programa gratuito para edición de alineamientos y análisis de
secuencias que funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda,
uno de los programas más conocidos para edición de secuencias para dicho sistema
operativo. (V, Introducción a la Bioinformática, 2006) BioEdit cuenta con varias
herramientas que van desde la creación de alineamientos hasta la anotación de
plásmidos. En esta oportunidad utilizaremos este programa para manipular parcialmente
nuestro alineamiento recién creado.
El Centro Nacional para la Información Biotecnológica (en inglés: National Center
for Biotechnology Information [NCBI]) es parte de la Biblioteca Nacional de Medicina de
Estados Unidos, una rama de los Institutos Nacionales de Salud. (WINKIPEDIA, 2014)
4. 2 OBJETIVOS
2.1 Objetivo general:
o Desarrollar la practica N° 01 usando el programa “BIOEDIT” para el análisis de
la secuencia del GEN 16S.
2.2 Objetivos específicos:
o Revisar los fundamentos de las técnicas de secuenciación de ácidos nucleicos.
o Efectuar el análisis y la selección de electroferogramas automatizados de
secuenciación mediante la aplicación de software libre BIOEDIT en específico el
estudio del gen ribosomal 16S.s Análisis del uso del NCBI.
5. 3 MATERIALES Y METODOS
3.1 Materiales:
3.1.1 Laptop:
Es una computadora portátil, lo cual quiere decir que puede ser
llevada a cualquier lado debido a su funcionamiento a través de una
batería o de electricidad, pero no exclusivamente de esta última. La
apariencia de una laptop es similar a la de un libro ya que cuenta con una
tapa y una base que pueden mantenerse abiertas para trabajar o
cerradas cuando la computadora está apagada. De este modo, sea cual
sea el modelo, la laptop puede ser guardada en un cajón o en un espacio
mucho más reducido que lo que ocupa normalmente una computadora
de escritorio. Uno de los elementos en contra que tienen las laptops es
que suelen ser más caras en términos de precios, aunque
proporcionalmente la inversión es mucho más aconsejable. (Bembibre,
2010)
3.1.2 Excel:
Excel es un programa del tipo Hoja de Cálculo que permite realizar
operaciones con números organizados en una cuadrícula. Es útil para
realizar desde simples sumas hasta cálculos de préstamos hipotecarios.
Veremos cuáles son los elementos básicos de Excel, la pantalla, las
barras, etc., para saber diferenciar entre cada uno de ellos. Aprenderás
cómo se llaman, dónde están y para qué sirven. También cómo obtener
ayuda, por si en algún momento no sabes cómo seguir trabajando.
(Manual de excel, 2013)
3.1.3 Word:
El programa Microsoft WORD es un poderoso procesador de
textos en español, desarrollado específicamente para ser ejecutado bajo
Microsoft Windows. En consecuencia, posee una marcada tendencia
gráfica y esto se manifiesta en el diseño de las pantallas, en los cuadros
de diálogos y en la forma de elegir una actividad determinada dentro de
las mismas mediante el uso de íconos. Básicamente, un procesador de
texto, es un programa que nos permite escribir, y luego realizar todas las
modificaciones necesarias para poderlo imprimir. (Mendoza, 2015)
6. 3.1.4 Software:
Se conoce como software al equipamiento lógico o soporte lógico
de un sistema informático; comprende el conjunto de los componentes
lógicos necesarios que hacen posible la realización de tareas específicas,
en contraposición a los componentes físicos, que son llamados hardware.
(López, 2013)
Los componentes lógicos incluyen, entre muchos otros, las
aplicaciones informáticas; tales como el procesador de texto, que permite
al usuario realizar todas las tareas concernientes a la edición de textos;
el software de sistema, tal como el sistema operativo, que, básicamente,
permite al resto de los programas funcionar adecuadamente, facilitando
también la interacción entre los componentes físicos y el resto de las
aplicaciones, y proporcionando una interfaz con el usuario.
7. 3.2 Metodos:
3.2.1 NCBI:
El Centro Nacional para la Información Biotecnológica es parte de
la Biblioteca Nacional de Medicina de Estados Unidos, una rama de los
Institutos Nacionales de Salud.
Almacena y constantemente actualiza lainformación referente a
secuencias genómicas en GenBank, un índice de artículos científicos
referentes a biomedicina, biotecnología, bioquímica,genética y genómica
en PubMed, una recopilación de enfermedades genéticas humanas en
OMIM, además de otros datos biotecnológicos derelevancia en diversas
bases de datos.
Todas las bases de datos del NCBI están disponibles en línea de
manera gratuita, y son accesibles usando el buscador Entrez. El NCBI
ofrece además algunas herramientas bioinformáticas para el análisis de
secuencias de ADN, ARN y proteínas, siendo BLAST una de las más
usadas. (Wikipedia, 2021).
3.2.2 Blast:
BLAST o “Basic Local Alignment Search Tool” [4] es posiblemente
la herramienta bioinformática más popular. El programa fue creado por
Eugene Myers, Stephen Altschul, Warren Gish, David J. Lipman y Webb
Miller en el NCBI (National Center for Biotechnology Information) y
publicado en 1990, convirtiéndose en uno de los artículos más citados de
la década de los 90 (en la actualidad tiene más de 32.000 referencias).
(Collado, 2010).
La característica que distingue a BLAST de herramientas más
tradicionales, como Smith-Waterman, es su énfasis en reducir el tiempo
necesario para realizar el alineamiento local, a cambio de sacrificar la
sensibilidad.
Dicha eficiencia temporal se logra gracias al uso de un algoritmo
heurístico, no garantizándose, por tanto, el descubrimiento de la solución
(alineamiento) óptimo.
8. 3.2.3 Bioedit:
Bioedit es un programa gratuito para edición de alineamientos y
análisis de secuencias que funciona únicamente sobre ambiente
MS/Windows. Es, sin lugar a duda, uno de los programas más conocidos
para edición de secuencias para dicho sistema operativo.
BioEdit cuenta con varias herramientas que van desde la creación
de alineamientos hasta la anotación de plásmidos. En esta oportunidad
utilizaremos este programa para manipular parcialmente nuestro
alineamiento recién creado. (V, Introducción a la Bioinformática, 2006.)
9. 4 RESULTADOS
En el presente informe se dará a conocer los 71 datos que fueron analizados con
el BIOEDIT y luego se entrara a la página del NCBI (Base de datos de búsqueda de
información del Centro Nacional de Biotecnología), todos estos datos serán reflejados
en un cuadro de Excel donde se dará a conocer su Calidad, Tamaño de secuencia,
Organismo y Porcentaje; así mismo estos datos serán comparados en gráficos
N° Datos
Calidad Tamaño
de la
Sec.
Organismo Porcentaje
Buena Mala Regular
1 Diversos-_a07_1h_01.ab1 Mala 978 Negativo -
2 Diversos-_a08_9h_02.ab1 Buena 944 stenotrophomonas sp. 74.24%
3 Diversos-_a09_1_01.ab1 Buena 958 leclercia adecarboxilata 83.45%
4 Diversos-_a10_9_02.ab1 Buena 939 klebsiella grimontii 82.35%
5 Diversos-_a11_17_01.ab1 Mala 1163 Negativo -
6 Diversos-_b07_2h_03.ab1 Mala 944 Negativo -
7 Diversos-_b08_10h_04.ab1 Regular 957 Leclercia adecarboxylata 85.62%
8 Diversos-_b09_2_03.ab1 Buena 939 Klebsiella oxytoca 84.01%
9 Diversos-_b10_10_04.ab1 Mala 1020 Negativo -
10 Diversos-_b11_18_03.ab1 Mala 993 Negativo -
11 Diversos-_c07_3h_05.ab1 Buena 963 Enterobacter sp. Na10140 92.53%
12 Diversos-_c08_11h_06.ab1 Buena 965 Enterobacter sp. Na10140 92.51%
13 Diversos-_c09_3_05.ab1 Buena 944 Phytobacter diazotrophicus 86.91%
14 Diversos-_c10_11_06.ab1 Mala 979 Negativo -
15 Diversos-_c11_19_05.ab1 Mala 950 Negativo -
16 Diversos-_d07_4h_07.ab1 Buena 928 Uncultured bacterium 90.18%
17 Diversos-_d08_12h_08.ab1 Buena 963 Uncultured bacterium 85.40%
18 Diversos-_d09_4_07.ab1 Buena 983 Phytobacter diazotrophicus 89.23%
19 Diversos-_d10_12_08.ab1 Regular 986 pseudomonas putida 81.82%
20 Diversos-_e07_5h_09.ab1 Mala 926 Negativo -
21 Diversos-_e08_13h_10.ab1 Buena 932
paraburkholderia
silvatlantica
79.97%
22 Diversos-_e09_5_09.ab1 Buena 981 enterobacter ludwigii 88.43%
23 Diversos-_e10_13_10.ab1 Buena 1057 bacteria no cultivada 67.47%
24 Diversos-_f07_6h_11.ab1 Buena 915 enterobacter ludwigii 95.89%
25 Diversos-_f09_6_11.ab1 Buena 956 klebsiella sp. 81.75%
26 Diversos-_f10_14_12.ab1 Mala 1204 Negativo -
27 Diversos-_g07_7h_13.ab1 Buena 931 enterobacter sp. Icbr 189 91.07%
28 Diversos-_g09_7_13.ab1 Buena 935 enterobacter sp. 73.78%
29 Diversos-_g10_15_14.ab1 Buena 950 enterobacter asburiae 93.40%
30 Diversos-_h07_8h_15.ab1 Mala 1101 Negativo -
31 Diversos-_h09_8_15.ab1 Mala 1262 Negativo -
32 Diversos-_h10_16_16.ab1 Buena 948 enterobacter sp. Iicdbz9 84.42%
11. a) Comparación de Calidad de los 71 datos:
GRAFICO 01: Datos de la Calidad.
En el presente grafico se muestra que de los 71 datos; de los cuales el
49% (conformado por 35 datos de los 71) es de buena calidad, el 41%
(conformado por 29 datos de los 36 datos restantes) es de mala calidad
y con un 10% (conformado por 7 datos restantes) es de una calidad
regular.
b) Tamaño de secuencia de los 71 datos donde se observará el promedio,
valor máximo y valor mínimo:
GRAFICO 02: Datos de Tamaño de Secuencia.
En el gráfico de barras se observa los 71 datos donde se ve el promedio
con una cantidad de 979.056338 del tamaño de secuencia, así mismo
también se da el valor máximo con una cantidad de 1347 del tamaño de
secuencia y un valor mínimo de 839 del tamaño de secuencia.
49%
41%
10%
DATOS DE CALIDAD
BUENA
MALA
REGULAR
PROMEDIO V. MAXIMO V. MINIMO
979.056338 1347 839
DATOS DEL TAMAÑO
12. c) Organismos que se repiten en los 71 datos:
GRAFICO 03: Datos del Organismo al cual pertenecen.
En el grafico se da los datos donde se ve los organismos con sus
respectivos nombres, así mismo se ve que 29 datos fueron negativos
mientras otros datos se repiten en una mínima cantidad de 5, 4, 2 y otros
que no se repiten; pero al final se obtiene en total de 71 datos.
d) Identidad % de los 71 datos donde se observará si los datos son positivos
o negativos; así mismo se mostrará el promedio, valor máximo y valor
mínimo.
GRAFICO 04: Datos Positivos y Negativos de la Identidad %.
29
1 2 2 1 2 2 2 1 1 2 2 1 1
4
1 1
5
2 1 1 2
0 1 1 1 1 1
0
10
20
30
40
1
DATOS DEL ORGANISMO
NEGATIVO Stenotrophomonas sp. UYSB32
Leclercia adecarboxilata Klebsiella grimontii
Klebsiella oxytoca Enterobacter sp. NA10140
Phytobacter diazotrophicus uncultured bacterium
Pseudomonas putida Paraburkholderia silvatlantica
Enterobacter ludwigii bacteria no cultivada
Klebsiella sp. Enterobacter sp. ICBR 189
Enterobacter sp. Enterobacter asburiae
Enterobacter sp. IICDBZ9 Klebsiella variicola
Enterobacter Klebsiella
Klebsiella pneumoniae Klebsiella pneumoniae cepa
Kosakonia radicinci Kosakonia oryzae
uncultured Treponema clone RsDiSp8 Pantoea deleyi
proteobacterias no cultivadas Herbaspirillum seropedicae
59%
41%
DATOS DE IDENTIDAD %
DATOS POSITIVOS DATOS NEGATIVOS
13. En el grafico se da a conocer que, de los 71 datos brindados, el 56% son
positivos con una cantidad de datos de 42 y el 44% es negativo con una
cantidad de 29 datos.
GRAFICO 04: Promedio, V. Max. y V. Min. De la Identidad %
En el gráfico de barras se observa los 71 datos donde se ve el promedio
con una cantidad de 43.60% de la identidad %, así mismo también se da
el valor máximo con una cantidad de 95.89% de la identidad % y un valor
mínimo de 0.00% de la identidad %.
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
1
43.60%
95.89%
0.00%
DATOS DE IDENTIDAD %
PROMEDIO V. MAXIMO V, MINIMO
14. 5 CONCLUSIONES
Podemos llegar a la conclusión que el avance de la tecnología nos permite usar
aplicativos como los Software del BLAST, el BIOEDIT, entre otro; estos nos facilitan el
poder analizar datos de GEN RIBOSOMAL 16S, de tal manera podemos ver que calidad
tienen, a que organismos pertenecen, que identidad % contiene, el tamaño de
secuencia, entre otros datos.
La secuenciación es un método muy eficaz ya que nos nos permite identificar el
organismo al cual pertenece cualquier Gen Ribosomal 16S; los datos obtenidos nos
beneficia en algunas especialidades de la Biotecnología y estas aportar con mejorar los
interés del ser humano, ya que como bien sabemos la biotecnología es un conjunto de
técnicas, procesos y métodos que utilizan organismos vivos, ya sea hongos, virus o
bacterias para toda aplicación tecnológica que utilice sistemas biológicos y organismos
vivos o sus derivados para la creación o modificación de productos o procesos para
usos específicos.
En los datos dados se vi que hay Genes Ribosomales 16S que no tienen una
buena calidad, como también se pudo identificar que algunos contienen una cantidad
muy buena y esto nos beneficia; los organismos fueron introducidos en el Software
BLAST y se vio que en cierta cantidad los Gen 16S tienen organismos positivos mientras
otros tienen los organismos negativos (no coincide con ningún Gen) y otros tienen el
organismo regular.
Concluimos que mientras más pase el tiempo la tecnología va mejorando y esto
nos permite nuevos alcances, más soluciones, más eficacia y rapidez al momento de
analizar cualquier Gen; esta práctica nos sirvió para explorar en nuevos Softwares,
saber nuevos términos, así mismo nos abrió la curiosidad para saber que función tenía
cada opción dada en los Software, como también encontramos estrategias para
culminar la partica de manera satisfactoria y poder presentar en el tiempo establecido.
15. 6 BIBLIOGRAFIA
Bembibre, C. (2010). DEFINICIÓN ABC. Obtenido de
https://www.definicionabc.com/tecnologia/laptop.php
Bioinformatics at COMAV. (2011). Obtenido de Bioinformatics at COMAV:
https://bioinf.comav.upv.es/courses/intro_bioinf/sanger.html
Collado, A. A. (2010). Análisis y caracterización de trabajos BLAST para la planificación
eficiente en entornos Grid y Supercomputación. Obtenido de
https://riunet.upv.es/bitstream/handle/10251/13855/TesisMaster_acarrion.pdf?sequenc
e=1
López, J. S. (2013). Sistema Operativo Software de Aplicación. Obtenido de
https://proyectocirculos.files.wordpress.com/2013/11/software.pdf
(2013). Manual de excel. Obtenido de https://www.uv.mx/personal/llopez/files/2013/03/Manual-
Microsoft-Office-Excel-2010.pdf
Mendoza, J. (2015). Manual de Microsoft@Word. Obtenido de
http://www2.jus.mendoza.gov.ar/informacion/EscAct/Manual%20Word.pdf
V, A. M. (2006). Introducción a la Bioinformática. Bogotá Colombia . Obtenido de
http://bioinf.ibun.unal.edu.co/documentos/multAlignmentCBIB.pdf
V, A. M. (2006.). Introducción a la Bioinformática. Obtenido de
http://bioinf.ibun.unal.edu.co/documentos/multAlignmentCBIB.pdf
Wikipedia. (DOMINGO de JUNIO de 2021). Obtenido de wikipedia:
https://es.wikipedia.org/wiki/BLAST
WINKIPEDIA. (2014). Centro Nacional para la Información Biotecnológica. Obtenido de
https://es.wikipedia.org/wiki/Centro_Nacional_para_la_Informaci%C3%B3n_Biotecnol%
C3%B3gica#:~:text=El%20Centro%20Nacional%20para%20la,los%20Institutos%20Na
cionales%20de%20Salud.
16. 7 ANEXOS
Figura 01: Ingreso al Software de BLAST
Fuente: Captura Realizada de la pagina
https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=MegaBlast&PROGRAM=blastn&PAGE_
TYPE=BlastSearch&BLAST_SPEC=
Descripción de la imagen:
Paso 01: Escribir en Google la palabra BLAST y buscar.
Paso 02: Darle Clic en Nucleotide BLAST para empezar.
Paso 03: Marcar el cuadrado hasta que aparezca la viñeta.
Paso 04: Pegar el texto y darte clic BLAST para obtener Resultados.
17. Figura 02: Ingreso los datos obtenidos en Excel
Fuente: Captura Realizada
Descripción de la imagen
Los 71 datos son colócalos en un Excel para poder realizar los gráficos.
Se ve los 71 datos la calidad, tamaño de la secuencia, organismo y porcentaje.