Este documento describe herramientas para la anotación funcional de genes utilizando la ontología de genes (GO). Explica cómo Apollo y la GO permiten editar y asignar términos GO de forma precisa y profunda para mejorar la anotación estructural y funcional de genomas. También describe dónde se encuentran los archivos de anotación GO y cómo la estructura de la GO como un grafo acíclico dirigido permite análisis complejos de conjuntos de datos.
CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional
1. CONSORCIO ONTOLOGÍA DE GENES:
herramientas para anotación funcional
Mónica Muñoz-Torres | @monimunozto
For the Gene Ontology Consortium. Also at BBOP: Christopher Mungall, Seth Carbon, Heiko
Dietze, Jeremy Nguyen, Nicole Washington, Nathan Dunn, and Suzanna E. Lewis (PI).
Berkeley Bioinformatics Open-Source Projects
Environmental Genomics & Systems Biology Division
Lawrence Berkeley National Laboratory
BIOS. Manizales, Colombia, 22-Sep-2015
2. EQUIPOS DE DESARROLLADORES
APOLLO DEVELOPERS 2
h " p : / / G e n e O n t o l o g y . o r g
Nathan Dunn
Suzi Lewis
Principal Investigator
BBOP
Moni Munoz-TorresChris Mungall
Nicole WashingtonHeiko Dietze
Seth Carbon
Jeremy
Nguyen
... and a few hundred of our closest friends at the GOC.
UniProt-GOA team at EMBL-EBI
Rachael
Huntley
Now at UCL
Tony
Swafford
Maria
Martin
Claire
O’Donovan
Team Leader
Paul
Thomas
(PI)
Huaiyu
Mi
PANTHER DB
University of Southern
California
3. CONTENIDO
• Hoy
descubriremos
cómo
u/lizar
la
ontología
de
genes
de
una
forma
más
eficiente,
y
descubriremos
algunas
herramientas
para
su
acceso.
GENE
ONTOLOGY
CONSORTIUM
herramientas
para
anotación
funcional.
3OUTLINE
6. ANOTACION DE GENOMAS
requiere precisión y profundidad
Anotaciones con Precisión 6
La
colección
de
genes
de
cada
organismo
informa
una
variedad
de
análisis:
• Número
de
genes,
%
GC,
composición
de
TEs,
áreas
repe//vas
• Asignar
función
• Evolución
molecular,
conservación
de
secuencias
• Familias
de
genes
• Caminos
metabólicos
• ¿Qué
hace
único
a
cada
organismo?
¿Qué
hace
“abeja”
a
una
abeja?
Marbach et al. 2011. Nature Methods | Shutterstock.com | Alexander Wild
7. 7
BIOCURACION
ajustes estructurales y funcionales
Iden/ficar
los
elementos
del
genoma
que
mejor
representan
la
biología
subyacente
y
eliminar
los
elementos
que
reflejan
errores
sistémicos
de
los
análisis
automa/zados.
Asignar
funciones
a
través
de
análisis
compara/vos
entre
elementos
genómicos
similares
de
organismos
cercanamente
relacionados
usando
literatura,
bases
de
datos,
y
datos
experimentales.
BIOCURACION
hTp://GeneOntology.org
1
2
8. ANOTACION
un ejercicio en colaboración
COLABORANDO 8
Los
inves5gadores
usualmente
buscamos
las
opiniones
y
percepciones
de
colegas
con
experiencia
en
áreas
específicas
del
conocimiento.
Por
ejemplo,
dominios
conservados
o
familias
de
genes.
10. Apollo
una herramienta para editar anotaciones
10
v En
la
web,
integrado
con
JBrowse.
v ¡Permite
la
colaboración
en
/empo
real!
v Automá/camente
genera
datos
en
formatos
comunes
para
análisis.
v Anotación
de
genes,
pseudogenes,
tRNAs,
snRNAs,
snoRNAs,
ncRNAs,
miRNAs,
TEs,
y
fragmentos
repe//vos.
v Funciones
intui/vas
y
menús
desplegables
crean
y
editan
estructuras
de
transcritos
y
exones,
insertan
comentarios
(CV,
texto
libre),
y
términos
de
GO,
etc.
INTRODUCING APOLLO
hTp://GenomeArchitect.org/
12. LA ONTOLOGIA DE GENES
anotación funcional
The Gene Ontology 12
•
GO
es
una
forma
de
capturar
el
conocimiento
biológico
para
productos
de
genes
individuales
de
forma
computable,
usando
ontologías.
•
Es
un
grupo
de
conceptos,
y
las
relaciones
entre
ellos,
arreglados
como
una
jerarquía
(no
linear).
•
GOC
genera
recursos
que
puedan
ser
usados
para
asignar
funciones
a
los
genes
de
interés,
usando
GO.
Conceptos
menos
específicos
Conceptos
más
específicos
13. LAS ONTOLOGIAS
todos para uno…
DEMO 13
3.
Componente
Celular
Donde
se
localiza
el
producto
de
gen
•
mitocondria
•
matriz
mitocondrial
•
membrana
interna
mitocondrial
1.
Función
Molecular
Una
ac/vidad,
tarea,
o
trabajo
elementales
•
Ac/vidad
de
proteína
quinasa
• Ac/vidad
de
receptor
de
insulina
2.
Proceso
Biológico
Una
serie
de
eventos
comúnmente
reconocidos
•
División
celular
Mitochondrion.
PaisekaScience Photo Library
Insulin Receptor
Petrus et al, 2009, ChemMedChem|
End of Telophase.
Lothar Schermelleh
14. ANATOMIA
DE
UN
TERMINO
DE
GO
DEMO
14
ID
único
Nombre
del
término
Ontología
Sinónimo
Definición
Información
relacionada
con
el
término.
15. ONTOLOGIA
DE
GENES
estructura
DEMO
15
•
Grafo
acíclico
dirigido
-‐
Un
término
puede
tener
más
de
un
“parental”
•
Los
términos
están
unidos
por
relaciones
is_a
es_un
part_of
parte_de
regulates
(&
+/-‐)
regula
(&+/-‐)
occurs_in
ocurre_en
has_part
5ene_parte
Estas
relaciones
permiten
análisis
complejos
de
conjuntos
de
datos
de
gran
envergadura
-‐
Un
término
puede
tener
más
de
un
“hijo”
16. GO ANNOTATIONS 16
¿DÓNDE ESTAN LAS ANOTACIONES?
hTp://www.ebi.ac.uk/GOA/downloads.html
1.
Si/o
de
internet
del
Consorcio
de
GO
Los
archivos
de
anotación
guardan
información
acerca
de
cada
asociación
entre
un
producto
de
gen
y
un
término.
Archivo
de
anotación
por
cada
especie.
hTp://GeneOntology.org/
17. GO ANNOTATIONS 17
hTp://www.ebi.ac.uk/GOA/downloads.html
2.
Si/o
de
internet
de
UniProt-‐GOA
Los
archivos
de
anotación
guardan
información
acerca
de
cada
asociación
entre
un
producto
de
gen
y
un
término.
Archivo
de
anotación
por
cada
especie.
hTp://www.ebi.ac.uk/GOA
¿DÓNDE ESTAN LAS ANOTACIONES?
21. GO BROWSERS 21
NAVEGADORES PARA GO
hTp://www.ebi.ac.uk/GOA/downloads.html
hTp://amigo.geneontology.org/
Grebe:
interface
de
asistencia
para
AmiGO2
con
opción
para
“llenar
el
espacio
en
blanco”.
GOOSE:
interrogar
la
base
de
datos
de
GO
usando
SQL.
Servicio
de
análisis
de
representación
de
términos.
Generado
por
PANTHER
Búsqueda
simple:
con
auto-‐completar.
22. GO BROWSERS 22
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html
Búsqueda
simple:
busca
términos
GO
o
proteínas;
con
auto-‐completar.
InvesUga
GO
Slims:
Visualización
enfocada
de
ciertas
porciones
de
GO.
hTp://www.ebi.ac.uk/QuickGO/
Encuentra
conjuntos
de
anotaciones
GO:
Con
filtros
para
generar
subconjuntos
de
anotaciones.
25. RAZONES PARA QUE EXISTA GO
Razones 25
• Inconsistencia
en
el
lenguaje:
Inglés
26. INCONSISTENCIA EN EL LENGUAJE: INGLÉS
Razones 26
• El
mismo
nombre
para
conceptos
diferentes
Cell
o
???
www.robertpaterson.com www.biology.usf.edu
27. INCONSISTENCIA EN EL LENGUAJE: INGLÉS
Razones 27
• Nombres
diferentes
para
el
mismo
concepto
Eggplant
Lo
mismo
es
cierto
cuando
se
trata
de
conceptos
biológicos:
• Esto
dificulta
las
comparaciones,
par/cularmente
cuando
se
comparan
especies
o
bases
de
datos.
Aubergine
Brinjal
Melongene
www.care2.com
28. RAZONES PARA QUE EXISTA GO
Razones 28
• Inconsistencia
en
el
lenguaje:
Inglés
• Creciente
can/dad
de
datos
biológicos
disponibles
29. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS DISPONIBLES
Razones 29
Una
búsqueda
con
“DNA
repair”
genera
más
de
80,000
resultados.
hTp://www.ncbi.nlm.nih.gov/pubmed/
30. RAZONES PARA QUE EXISTA GO
Razones 30
• Inconsistencia
en
el
lenguaje:
Inglés
• Creciente
can/dad
de
datos
biológicos
disponibles
• Creciente
can/dad
de
datos
biológicos
aún
por
venir
31. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS AÚN POR VENIR
Razones 31
Expansión
de
la
información
en
pares
de
bases.
http://www.ncbi.nlm.nih.gov/
32. RAZONES PARA QUE EXISTA GO
Razones 32
• Inconsistencia
en
el
lenguaje:
Inglés
• Creciente
can/dad
de
datos
biológicos
disponibles
• Creciente
can/dad
de
datos
biológicos
que
aún
están
por
venir
• Conjuntos
de
datos
enormes
necesitan
ser
interpretados
rápidamente
33. OBJETIVOS DEL PROYECTO GO
Razones 33
• Compilar
las
ontologías
-‐ Actualmente
hay
más
de
41,000
términos
-‐ Aumentando
y
mejorando
constantemente
• Anotar
productos
de
genes
usando
términos
de
ontología
-‐ Unos
30
grupos
contribuyen
anotaciones
• Proveer
un
recurso
público
de
datos
y
herramientas
-‐ Lanzamientos
regulares
de
archivos
con
anotaciones
-‐ Herramientas
para
navegar
e
interrogar
las
anotaciones
y
también
para
editar
las
anotaciones.
36. UNA ANOTACION GO ES...
Anotación 36
...
una
declaración
que
dice
que
el
producto
de
un
gen:
1. /ene
una
función
molecular
par/cular
o,
está
involucrado
en
un
proceso
biológico
o,
está
localizado
en
cierto
componente
celular
2. lo
que
ha
sido
determinado
por
un
método
par/cular
3. y
ha
sido
descrito
en
una
referencia
en
especial
37. INCORPORANDO ANOTACIONES
Anotación 37
Las
anotaciones
GO
se
pueden
incorporar
usando
dos
métodos:
1.
Anotación
Electrónica
• Una
forma
rápida
de
producir
un
gran
número
de
anotaciones
• Las
anotaciones
usan
términos
GO
menos
específicos
• La
única
fuente
de
anotación
para
muchos
de
los
organismos
no
modelo
(non-‐MODs).
2.
Anotación
Manual
• Este
proceso
toma
/empo
y
produce
un
menor
número
de
anotaciones
• Las
anotaciones
/enden
a
usar
términos
GO
muy
específicos
38. 1. ANOTACION ELECTRONICA
Anotación 38
1.1
Mapeo
de
conceptos
externos
a
términos
GO
GO:0005634:
Nucleus
GO:0004707:
MAP
kinase
ac/vity
GO:0009734:
Auxin-‐ac/vated
signaling
pathway
39. 1. ANOTACION ELECTRONICA
Anotación 39
1.2
Transferencia
automá/ca
de
anotaciones
electrónicas
a
ortólogos
e.g.
Humano
Macaco
Ratón
Chimpancé
Vaca
Cuy
Ratón
Rata
Pollo
...
y
otros
más
Ensembl
compara
hTp://www.geneontology.org/cgi-‐bin/references.cgi
Arabidopsis
Rice
Alamo
Maíz
Braquiaria
Uva
...
y
otros
más
Ensembl
compara
Las
anotaciones
son
de
alta
calidad
e
incluyen
una
explicación
del
método
u/lizado
(ver
GO_REF)
40. 2. ANOTACION MANUAL (en UniProt-GOA)
Anotación 40
Anotaciones
específicas
y
de
alta
calidad
son
hechas
usando:
• Aryculos
completos,
revisados
por
expertos
• Un
rango
de
códigos
de
evidencia
(“evidence
codes”)
para
categorizar
los
/pos
de
evidencia
que
se
encuentran
en
un
aryculo.
E.g.
IDA,
IMP,
IPI
41. NUMERO TOTAL DE ANOTACIONES UniProt-GOA
Anotación 41
Anotaciones
electrónicas
Anotaciones
manuales*
213,536,891
2,865,245
31,499,149
432,005
Número
de
diferentes
productos
de
gen
*Incluye
anotaciones
manuales
integradas
de
grupos
externos
MOD
y
grupos
especializados.
42. GO BROWSERS 42
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html
Búsqueda
simple:
busca
términos
GO
o
proteínas;
con
auto-‐completar.
InvesUga
GO
Slims:
Visualización
enfocada
de
ciertas
porciones
de
GO.
hTp://www.ebi.ac.uk/QuickGO/
Encuentra
conjuntos
de
anotaciones
GO:
Con
filtros
para
generar
subconjuntos
de
anotaciones.
45. ¿PARA QUE SIRVE GO?
¿Para qué sirve la Ontología de Genes? 45
• Acceder
a
información
funcional
de
productos
de
genes
• Analizar
datos
genómicos
o
proteómicos
de
alto
rendimiento
• Validación
de
técnicas
experimentales
• Obtener
una
visión
general
de
las
funciones
de
un
proteoma
• Obtener
información
funcional
para
nuevos
productos
de
genes
• Etc…
Dutkowski et al 2013, Nature Biotechnology.
47. Interpretando experimentos “ómicos” de alto rendimiento
Pruebas de representación y enriquecimiento 47
Escenarios:
• Cuando
/enes
un
experimento
con
datos
de
todo
el
genoma,
e.g.:
• Estudio
de
asociación
de
enfermedad
con
>100M
si/os
de
variantes
genómicas
diferentes
• Experimento
de
RNA-‐seq
que
cuan/fica
los
cambios
en
decenas
de
miles
de
genes
o
de
isoformos.
• Etc.
48. “ENRIQUECIMIENTO”
Pruebas de representación y enriquecimiento 48
• Es
el
método
más
común
para
interpretar
un
gran
número
de
medidas
individuales,
en
términos
de
la
biología
subyacente.
• Determina
cuáles
términos
de
GO
están
más
comúnmente
asociados
con
una
lista
específica
de
genes
/
proteínas,
cuando
se
compara
con
una
lista
control
o
con
el
resto
del
genoma.
• Conocido
en
inglés
como
“enrichment
analysis”
o
“pathway
analysis”.
49. “ENRIQUECIMIENTO”
Pruebas de representación y enriquecimiento 49
• U/liza
información
conocida
acerca
de
la
función
de
un
gen
para
ver
si
hay
alguna
tendencia
estadís/ca
en
los
/pos
de
FUNCIONES
de
los
genes
muestran
cambios
en
el
experimento.
• Hipótesis
de
trabajo:
• Los
genes
el
en
mismo
subsistema
biológico
(“módulo”
o
“camino”)
/enden
a
estar
regulados
de
forma
coordinada,
o
a
tener
efectos
biológicos
similares
cuando
son
perturbados.
50. VARIACIONES COMUNES DE ANALISIS DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 50
Para
tener
en
cuenta:
• Diferentes
pruebas
estadís/cas
requieren
diferentes
conjuntos
de
datos.
• Hay
diferentes
“conjuntos
de
datos
de
anotación”
(“annota/on
sets”).
• Si
se
observan
diferencias
en
los
resultados,
no
escoja
la
respuesta
que
más
le
gustaría
que
fuera
cierta,
sino
examine
los
resultados
para
entenderlos
bien.
51. CONJUNTOS DE DATOS DE ANOTACION
Pruebas de representación y enriquecimiento 51
• Los
conjuntos
apropiados
dependen
de
la
pregunta
biológica
• El
obje/vo
de
la
mayoría
de
análisis
de
datos
“ómicos”
es
iden/ficar
cambios
correlacionados
entre
grupos
de
genes
que
posiblemente
funcionan
juntos:
procesos
biológicos
de
GO
(incluyendo
caminos
/
pathways).
• Los
análisis
de
enriquecimiento
iden/fican
diferentes
aspectos
de
la
ontología
de
genes.
• Función
molecular,
componente
celular,
proceso
biológicos
• Hay
diferentes
versiones
del
mismo
conjunto
de
datos:
• Siempre
haz
uso
de
los
conjuntos
de
datos
más
recientes:
los
más
completos,
los
más
acertados.
• Con
GO,
puedes
restringirte
a
un
subconjunto
de
/pos
de
evidencia
52. DOS TIPOS PRINCIPALES DE PRUEBAS
Pruebas de representación y enriquecimiento 52
• “Suprarepresentación
/
Infrarepresentación”
• ¿Considerando
mi
lista
de
genes,
hay
alguna(s)
clase(s)
funcional(es)
que
se
encuentre(n)
representada(s)
más
/
menos
frecuentemente
de
lo
esperado?
• “Enriquecimiento”
(e.g.
Gene
Set
Enrichment
Analysis
(GSEA))
• No
hay
una
lista.
En
cambio,
para
cada
gen
en
el
experimento
se
mide
y
se
computa
un
valor.
• ¿Tienen
los
genes
de
una
clase
funcional
en
par5cular
una
distribución
de
valores
que
es
diferente
de
la
esperada?
53. PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 53
• Entrada
• Una
lista
de
genes
de
interés.
• Opcional,
pero
recomendado:
una
lista
de
referencia
de
genes
de
la
cuál
se
sacaron
los
genes
de
la
primera
lista.
¿Se
ven
algunas
de
las
clases
funcionales
supra
(o
infra)
representadas
en
la
lista
comparada
con
lo
esperado
por
azar?
• Salida
• Enriquecimiento
/
disminución:
¿Cuántos
más
(menos)
genes
de
cada
clase
hay
en
la
lista,
comparado
con
lo
esperado?
• P-‐value:
probabilidad
que
el
enriquecimiento
/
disminución
observado(a)
sea
significa/vamente
diferente
de
la
hipótesis
nula
de
NO
ENRIQUECIMIENTO
/
DISMINUCIÓN.
54. PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 54
Lista
de
genes
como
referencia
Tu
lista
de
genes
de
interés
Es
necesario
definir:
• Lista(s)
de
genes
de
interés
• Lista
de
genes
como
referencia
EJEMPLO
1
55. PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 55
Tu
lista
de
genes
como
referencia
Lista
de
genes
de
interés
Genes
anotados
con
un
término
GO
Genes
no
anotados
con
un
término
GO
¿Está
la
clase
de
anotación
supra
o
infra
representada,
comparada
con
la
referencia?
EJEMPLO
1
56. PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 56
Por
cada
término
de
anotación:
¿Hay
más
(supra)
o
menos
(infra)
genes
representados
en
la
lista
de
interés,
comparados
con
lo
esperado
por
azar?
EJEMPLO
2
57. PRUEBA DE SUPRA / INFRA REPRESENTACIÓN
Pruebas de representación y enriquecimiento 57
Tabal
de
conUngencia
P-‐value
Conteo
de
genes
con
término
GO
en
el
conjunto
de
datos
Conteo
de
genes
sin
término
GO
en
el
conjunto
de
datos
Conteo
en
el
conjunto
(e.g.
genes
expresados
diferencialmente)
Conteo
en
conjunto
de
referencia
(e.g.
todos
los
genes
en
el
arreglo)
Test
exacto
de
Fisher
o
prueba
chi-‐cuadrado
o
Bionomial
o
hipergeométrico
51
125
173
416
8588
9004
467
8713
9177
8
x
10-‐52
EJEMPLO
2
58. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS
Pruebas de representación y enriquecimiento 58
Para
MODs
Especie
Ontología
Corrección
Fuente
de
datos,
visualización.
Powered
by
h"p://www.pantherdb.org/
hTp://GeneOntology.org/
hTp://amigo.geneontology.org/
hTp://geneontology.org/page/go-‐enrichment-‐analysis
59. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS
Pruebas de representación y enriquecimiento 59
hTp://www.ebi.ac.uk/interpro/search/sequence-‐search
• InterProScan
-‐
Predice
términos
de
GO
basado
en
dominios
detectados
usando
nuestro
archivo
de
mapeo
InterPro-‐2-‐GO,
una
secuencia
a
la
vez.
hTp://geneontology.org/page/download-‐mappings
-‐
Descarga
e
instala
la
úl/ma
versión
de
InterProScan
Si
no
trabajas
con
MODs
60. PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 60
• Entrada
• Una
lista
de
genes
(tantos
como
sea
posible
para
obtener
buen
soporte
estadís/co!)
y
un
valor
cuan/ta/vo
para
cada
gen
(e.g.
medida
de
aumento
de
cambio,
“fold
change”).
• Salida
• La
probabilidad
que
la
distribución
de
los
valores
para
los
genes
en
cada
clase
de
GO
es
significa/vamente
diferente
de
la
distribución
de
valores
para
todos
los
genes.
61. PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 61
Tick
para
remover
el
uso
de
parámetros
por
defecto
h"p://www.pantherdb.org/
62. PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 62
Estadís/camente
compara
la
distribución
de
los
valores
para
todos
los
genes
en
cada
clase
de
anotación,
con
la
distribución
de
valores
para
todos
los
genes
en
el
experimento.
Enriquecimiento
en
un
conjunto
de
genes
-‐
Gene
set
enrichment
(GSEA)
63. RESUMEN FUNCIONAL
GO slims
Term Representation, so-called “Enrichment” 63
Para
conjuntos
de
datos
de
larga
envergadura:
• Muchas
herramientas
de
análisis
de
GO
u/lizan
GO
slims
para
ofrecer
un
resumen
general
de
los
datos.
•
GO
slims
son
versiones
recortadas
de
GO
y
con/enen
un
subconjunto
de
los
términos
de
la
ontología
completa.
•
Usualmente
los
GO
slims
con/enen
términos
GO
menos
especializados
64. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH”
Term Representation, so-called “Enrichment” 64
Muchos
productos
de
genes
están
asociados
con
un
gran
número
de
nodos
finales
(leaf
nodes)
de
GO,
que
son
descrip/vos
en
detalle.
65. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH”
Term Representation, so-called “Enrichment” 65
...
sin
embargo,
las
anotaciones
pueden
ser
mapeadas
a
conjuntos
más
pequeños
de
términos
de
GO:
66. RESUMEN FUNCIONAL
GO slims
Term Representation, so-called “Enrichment” 66
• Hay
GO
slims
personalizados
disponibles
para
especies
y
grupos
de
cierto
enfoque
en
hTp://geneontology.org/page/go-‐slim-‐and-‐subset-‐guide
• Puedes
generar
tu
propio
GO
slim
usando
las
siguientes
herramientas:
• hTp://www.ebi.ac.uk/QuickGO
• hTp://go.princeton.edu/
67. GO BROWSERS 67
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html
Búsqueda
simple:
busca
términos
GO
o
proteínas;
con
auto-‐completar.
InvesUga
GO
Slims:
Visualización
enfocada
de
ciertas
porciones
de
GO.
hTp://www.ebi.ac.uk/QuickGO/
Encuentra
conjuntos
de
anotaciones
GO:
Con
filtros
para
generar
subconjuntos
de
anotaciones.
69. PRECAUCIONES AL USAR GO
Term Representation, so-called “Enrichment” 69
• La
Ontología
de
Genes
cambia
constantemente
y
nuevas
anotaciones
son
creadas
con/nuamente:
• ¡Siempre
usa
las
versiones
más
actualizadas
de
ambas!
• Cuando
publiques
tus
análisis,
cita
al
GOC:
hTp://geneontology.org/page/go-‐cita/on-‐policy
• Es
recomendable
remover
anotaciones
“NOT”
antes
de
conducir
análisis.
• ~7K
/
141M
son
“NOT”
• Pueden
causar
confusión
en
el
análisis
70. PRECAUCIONES AL USAR GO
Term Representation, so-called “Enrichment” 70
• “Unannotated”
no
significa
“unknown”
• Cuando
no
hay
evidencia
en
la
literatura
acerca
de
un
proceso,
función
o
localización,
el
producto
de
gen
se
anota
al
nodo
raíz
apropiado
en
la
ontología
con
un
código
de
evidencia
“ND”
(no
biological
data),
dis/nguiendo
así
entre
“unannotated”
y
“unknown”.
• Pon
atención
a
la
infrarepresentación
de
términos
GO
• Una
infrarepresentación
muy
notoria
para
un
camino
metabólico
puede
representar
que
es
necesario
tener
una
función
normal
de
este
camino
para
la
condición
específica
bajo
estudio.
72. PAINT
Phylogenetic Annotation INference Tool
PAINT 72
Datos
experimentales
Anotaciones
propagadas
(azul
oscuro)
PAINT
Propagación
de
anotaciones
basado
en
árboles
filogené/cos
construidos
con
familias
de
genes.
Trabaja
sobre
los
principios
evolu/vos
de
ancestro
común
y
divergencia.
73. Noctua
edición de modelos moleculares
Noctua | LEGO 73
• Edición
gráfica,
colaboraUva
para
colecciones
de
anotaciones
GO:
modelos
‘LEGO’.
• Los
usuarios
pueden
mover
y
adicionar
elementos.
• Cada
nódulo
(caja)
es
una
función
o
proceso.
• Todos
los
modelos
se
guardan
en
OWL
en
GitHub
(repo)
y
son
sincronizados
por
un
servidor
llamado
Minerva.
• Se
puede
decir
mucho
más
en
un
modelo
LEGO
con
menos
esfuerzo
y
/empo
inver/do.
74. CONTENIDO
• ESTRUCTURA
DE
GO
descripción
y
búsqueda
• ANOTACION
¿Cómo
se
anota
con
GO?
• ANALISIS
Usos
de
GO
• OTRAS
HERRAMIENTAS
PAINT
&
Noctua
CONSORCIO
ONTOLOGÍA
DE
GENES:
herramientas
para
anotación
funcional
74OUTLINE
75. • Berkeley
BioinformaUcs
Open-‐source
Projects
(BBOP),
Berkeley
Lab:
Apollo
and
Gene
Ontology
teams.
Suzanna
E.
Lewis
(PI).
• The
members
of
the
Gene
Ontology
Consor/um.
• Rachael
Huntley
&
Paul
Thomas
for
teaching
materials.
• GO
is
supported
by
NIH
(NHGRI)
grant
5U41HG002273-‐14
and
by
the
Director,
Office
of
Science,
Office
of
Basic
Energy
Sciences,
of
the
U.S.
Department
of
Energy
under
Contract
No.
DE-‐
AC02-‐05CH11231
•
• For
your
a"enUon,
thank
you!
Thank you. 75
Suzanna
Lewis
(PI)
Chris
Mungall
Seth
Carbon
Heiko
Dietze
Jeremy
Nguyen
Nicole
Washington
Nathan
Dunn
Mis
colegas
en
BBOP
GO:
hTp://GeneOntology.org
¡Gracias!