SlideShare ist ein Scribd-Unternehmen logo
1 von 34
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
Distribuciones
Distribuciones Puntos georeferenciados
1. Para cada terminal  t 2. Para todas las celdas  (i,j) 3. D t  (i,j)   ←  0,  4. Para cada registro  r  en  t 5. D t  (i,j)   ←  1 para la celda  (x,y)  asignada al registro  r 6. Para cada  V k  de  (x,y) ,  D t  (v1,v2)   ←  1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
Relleno de “imagen digital”
Distribuciones Rellenado de la distribución
Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro  ←  anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2))  Q -> esCelda?  ←  verdadero retornar Q 5. x  ←  i1 + ((i2 – i1) / 2), y  ←  j1 + ((j2 – j1) / 2) Q -> esCelda?  ←  falso 6. Q -> NW  ←  Construir Q (i1, x, j1, y, Q) Q -> NE  ←  Construir Q (x, i2, j1, y, Q) Q -> SW  ←  Construir Q (i1, x, y, j2, Q) Q -> NW  ←  Construir  Q (x, i2, y, j2, Q) 7. Retornar Q ∎
Quad-árboles
Criterio de optimalidad
Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
Criterio de optimalidad Sea un nodo- j  un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
Sea  C n  el costo de la reconstrucción del nodo  n , y  desc (n)  es la lista de descendientes de  n . C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Criterio de optimalidad
Criterio de optimalidad C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Donde  Y n Y n  = costo de una eliminación, si la distribución de  n  es eliminada, De lo contrario,  Y n  = 0
C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n y  X n X n  = 0, si  n  es un nodo- j , X n  = 0, si  n  es un nodo vicariante, X n  = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
Optimar (nodo  n ) 1. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal, retornar  C n 3. Para cada  i  que sea  desc(n) C n   ←   C n  + Optimar ( i ) 5. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 6. Retornar  C n ∎ Optimación ingenua
Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
Optimar (nodo  n ) 1. Minetras n dif NULL 2. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal,  n   ←   anc (n) , volver a 1 3. Para cada  i  que sea  desc(n) C n   ←   C n  +  C i 4. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 5. n   ←   anc (n) 6. Fin-Mientras ∎ Optimación incremental
Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
“ Subida de colina” simple 1. Min  ←  C t 2. Para cada nodo  n  en el árbol  t 3. Eliminar  n Optimizar  t 4. Si ( C t  < Min ) volver a 1. 5. Restaurar  n Optimizar  t 6. Fin para-2. ∎
“ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
Heurística de Page 1.  Prev  ←  C t 2. Min  ←  C t Pos   ←  NULL 3. Para cada nodo  n  en el árbol  t 4. Eliminar  n , Optimizar  t 5. Si ( C t  < Min ) Min  ←  C t Pos  ←  n 6. Restaurar  n , Optimizar  t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar  n , Optimizar  t volver a 2. ∎
Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos

Weitere ähnliche Inhalte

Was ist angesagt?

Pisos zoogeográficos
Pisos zoogeográficosPisos zoogeográficos
Pisos zoogeográficosJairo Molina
 
Taxonomía y clasificación zoológica
Taxonomía y clasificación zoológicaTaxonomía y clasificación zoológica
Taxonomía y clasificación zoológicaCarlos Cáceres
 
Peces condrictios del ecuador por Carlos Macas
Peces condrictios del ecuador por Carlos MacasPeces condrictios del ecuador por Carlos Macas
Peces condrictios del ecuador por Carlos Macasluis carlos macas soto
 
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO JaSon SebaStian
 
PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR Denishita Ramos
 
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Tania Vásquez
 
Peces cartilaginosos
Peces cartilaginososPeces cartilaginosos
Peces cartilaginososSandra Ruiz
 
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy QuinatoaMetodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy QuinatoaScarlatos
 
Piso Alto andino del Ecuador
Piso Alto andino del EcuadorPiso Alto andino del Ecuador
Piso Alto andino del Ecuadorpandresaguaguina
 
Consumo de peces en la ciudad de Quito (Mercado Andalucia) Autora; Vanessa ...
Consumo de peces en la ciudad de Quito (Mercado Andalucia)   Autora; Vanessa ...Consumo de peces en la ciudad de Quito (Mercado Andalucia)   Autora; Vanessa ...
Consumo de peces en la ciudad de Quito (Mercado Andalucia) Autora; Vanessa ...vanealejandra
 
Fauna Ecuatoriana y su taxonomía de peces e imágenes
Fauna Ecuatoriana y su taxonomía de peces e  imágenes Fauna Ecuatoriana y su taxonomía de peces e  imágenes
Fauna Ecuatoriana y su taxonomía de peces e imágenes MarcelaHerrera123456
 
Metodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorMetodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorKarlaLlumiquinga
 
Reserva cuyabeno
Reserva cuyabenoReserva cuyabeno
Reserva cuyabenoSandra Ruiz
 
Metodos de captura de peces
Metodos de captura de pecesMetodos de captura de peces
Metodos de captura de pecesJhossePaul
 
Peces Origen y Evolución
Peces Origen y EvoluciónPeces Origen y Evolución
Peces Origen y EvoluciónpameCabrera4
 
Cordados
CordadosCordados
Cordadoscecilia
 

Was ist angesagt? (20)

Pisos zoogeográficos
Pisos zoogeográficosPisos zoogeográficos
Pisos zoogeográficos
 
Concha de abanico
Concha de abanicoConcha de abanico
Concha de abanico
 
Taxonomía y clasificación zoológica
Taxonomía y clasificación zoológicaTaxonomía y clasificación zoológica
Taxonomía y clasificación zoológica
 
Peces condrictios del ecuador por Carlos Macas
Peces condrictios del ecuador por Carlos MacasPeces condrictios del ecuador por Carlos Macas
Peces condrictios del ecuador por Carlos Macas
 
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO
PERFIL DEL PROYECTO DE PREFERENCIA EN EL CONSUMO DE PECES EN QUITO
 
Anfibios del ecuador
Anfibios del ecuadorAnfibios del ecuador
Anfibios del ecuador
 
PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR
 
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
 
Peces cartilaginosos
Peces cartilaginososPeces cartilaginosos
Peces cartilaginosos
 
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy QuinatoaMetodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
 
Piso Alto andino del Ecuador
Piso Alto andino del EcuadorPiso Alto andino del Ecuador
Piso Alto andino del Ecuador
 
Consumo de peces en la ciudad de Quito (Mercado Andalucia) Autora; Vanessa ...
Consumo de peces en la ciudad de Quito (Mercado Andalucia)   Autora; Vanessa ...Consumo de peces en la ciudad de Quito (Mercado Andalucia)   Autora; Vanessa ...
Consumo de peces en la ciudad de Quito (Mercado Andalucia) Autora; Vanessa ...
 
Fauna Ecuatoriana y su taxonomía de peces e imágenes
Fauna Ecuatoriana y su taxonomía de peces e  imágenes Fauna Ecuatoriana y su taxonomía de peces e  imágenes
Fauna Ecuatoriana y su taxonomía de peces e imágenes
 
Metodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorMetodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuador
 
Manejo de reptiles
Manejo de reptiles Manejo de reptiles
Manejo de reptiles
 
Reserva cuyabeno
Reserva cuyabenoReserva cuyabeno
Reserva cuyabeno
 
Libro peces-oseos
Libro peces-oseosLibro peces-oseos
Libro peces-oseos
 
Metodos de captura de peces
Metodos de captura de pecesMetodos de captura de peces
Metodos de captura de peces
 
Peces Origen y Evolución
Peces Origen y EvoluciónPeces Origen y Evolución
Peces Origen y Evolución
 
Cordados
CordadosCordados
Cordados
 

Andere mochten auch

BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaBIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaJavier Alexander Cucaita Moreno
 
Síntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenSíntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenAndres Prieto Pineda
 
1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolleOscar Garcia Montesinos
 
Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1marianax3
 

Andere mochten auch (6)

Biogeografía
BiogeografíaBiogeografía
Biogeografía
 
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaBIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
 
Síntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenSíntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - Resumen
 
1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle
 
Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1
 
Biogeografia aula 1
Biogeografia   aula 1Biogeografia   aula 1
Biogeografia aula 1
 

Ähnlich wie Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...jfrchicanog
 
Algoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesAlgoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesDaniel Molina Cabrera
 
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfS13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfEddyBerlyFloresMejia
 
Optimizacion Univariada
Optimizacion UnivariadaOptimizacion Univariada
Optimizacion Univariadamuanjaba
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4jcbenitezp
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4jcbenitezp
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasolimpica
 
Clase io3
Clase io3Clase io3
Clase io3clavelm
 
1157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 20051157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 2005Gonzalo Gatica
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.pptnicoals2
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no linealesAndres Milquez
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por seriesKike Prieto
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Velmuz Buzz
 

Ähnlich wie Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional (20)

Optimización. Métodos numéricos
Optimización. Métodos numéricosOptimización. Métodos numéricos
Optimización. Métodos numéricos
 
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
 
Algoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesAlgoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodales
 
Sistemas Difusos
Sistemas DifusosSistemas Difusos
Sistemas Difusos
 
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfS13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
 
Optimizacion Univariada
Optimizacion UnivariadaOptimizacion Univariada
Optimizacion Univariada
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Paralela4
Paralela4Paralela4
Paralela4
 
Paralela6
Paralela6Paralela6
Paralela6
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
 
Clase io3
Clase io3Clase io3
Clase io3
 
Metodo Simplex
Metodo SimplexMetodo Simplex
Metodo Simplex
 
1157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 20051157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 2005
 
Complejidad de Algoritmos
Complejidad de AlgoritmosComplejidad de Algoritmos
Complejidad de Algoritmos
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.ppt
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no lineales
 
2014 iii 07 cocientes notables
2014 iii 07 cocientes notables2014 iii 07 cocientes notables
2014 iii 07 cocientes notables
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por series
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1
 

Mehr von Asociación Argentina de Bioinformática y Biología Computacional

Mehr von Asociación Argentina de Bioinformática y Biología Computacional (16)

About using new descriptors for cheminformatics
About using new descriptors for cheminformaticsAbout using new descriptors for cheminformatics
About using new descriptors for cheminformatics
 
La Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTALa Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTA
 
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
 
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
 
Cooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje EstocásticoCooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje Estocástico
 
Prediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDHPrediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDH
 
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
 
Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...
 
Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...
 
A structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plantsA structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plants
 
Modelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondiiModelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondii
 
Data balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPsData balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPs
 
Gene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette indexGene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette index
 
Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...
 
Biopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and OutlookBiopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and Outlook
 
¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?
 

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

  • 1. Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
  • 2. Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
  • 3. Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
  • 4. Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
  • 5. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
  • 6. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
  • 7. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
  • 10. 1. Para cada terminal t 2. Para todas las celdas (i,j) 3. D t (i,j) ← 0, 4. Para cada registro r en t 5. D t (i,j) ← 1 para la celda (x,y) asignada al registro r 6. Para cada V k de (x,y) , D t (v1,v2) ← 1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
  • 11. Relleno de “imagen digital”
  • 12. Distribuciones Rellenado de la distribución
  • 13. Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
  • 14. Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro ← anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2)) Q -> esCelda? ← verdadero retornar Q 5. x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2) Q -> esCelda? ← falso 6. Q -> NW ← Construir Q (i1, x, j1, y, Q) Q -> NE ← Construir Q (x, i2, j1, y, Q) Q -> SW ← Construir Q (i1, x, y, j2, Q) Q -> NW ← Construir Q (x, i2, y, j2, Q) 7. Retornar Q ∎
  • 17. Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
  • 18. Criterio de optimalidad Sea un nodo- j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
  • 19. Sea C n el costo de la reconstrucción del nodo n , y desc (n) es la lista de descendientes de n . C n = ( ∑ i = desc(n) C i ) + Y n + X n Criterio de optimalidad
  • 20. Criterio de optimalidad C n = ( ∑ i = desc(n) C i ) + Y n + X n Donde Y n Y n = costo de una eliminación, si la distribución de n es eliminada, De lo contrario, Y n = 0
  • 21. C n = ( ∑ i = desc(n) C i ) + Y n + X n y X n X n = 0, si n es un nodo- j , X n = 0, si n es un nodo vicariante, X n = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
  • 22. Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
  • 23. Optimar (nodo n ) 1. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, retornar C n 3. Para cada i que sea desc(n) C n ← C n + Optimar ( i ) 5. Si n es no vicariante C n ← C n + Costo_no_vic 6. Retornar C n ∎ Optimación ingenua
  • 24. Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
  • 25. Optimar (nodo n ) 1. Minetras n dif NULL 2. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, n ← anc (n) , volver a 1 3. Para cada i que sea desc(n) C n ← C n + C i 4. Si n es no vicariante C n ← C n + Costo_no_vic 5. n ← anc (n) 6. Fin-Mientras ∎ Optimación incremental
  • 26. Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
  • 27. Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
  • 28. “ Subida de colina” simple 1. Min ← C t 2. Para cada nodo n en el árbol t 3. Eliminar n Optimizar t 4. Si ( C t < Min ) volver a 1. 5. Restaurar n Optimizar t 6. Fin para-2. ∎
  • 29. “ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
  • 30. Heurística de Page 1. Prev ← C t 2. Min ← C t Pos ← NULL 3. Para cada nodo n en el árbol t 4. Eliminar n , Optimizar t 5. Si ( C t < Min ) Min ← C t Pos ← n 6. Restaurar n , Optimizar t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar n , Optimizar t volver a 2. ∎
  • 31. Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
  • 32. Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
  • 33. Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
  • 34. Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos