SlideShare una empresa de Scribd logo
1 de 88
Astronomía 
y Big Data 
Juan Ignacio Pérez Sacristán 
linkedin.com/in/semanticwebarchitect
¿Qué es Big Data? 
● Big Data son PB, PetaBytes. 
● Bytes, KB, MB, GB, TB, PB, EB 
● 1 foto = 1 MB 
● 1.000 fotos = 1 GB 
● 1.000.000 fotos = 1 TB
Ejemplos de Big Data 
● Al usar un buscador de Internet 
10^10 páginas web 
● Al escribir en redes sociales 
10^12 mensajes 
● Google Knowledge Vault, una Wikipedia 
hecha por robots 
10^9 hechos
Hype Cycle 
Ciclo de sobreexpectación 
● El proceso de asimilación de las nuevas tecnologías en la sociedad casi 
siempre sufre un período inicial de gran emoción y crecimiento, 
alcanzando un máximo para después desinflarse al no cumplir las 
exageradas expectativas que se prometían al principio. Por último, se 
alcanza un estado de equilibrio cuando la sociedad convive con 
normalidad con dicha tecnología. 
● Ejemplos: Inteligencia Artificial, Ordenadores Cuánticos, ...
La ley de Moore 
● Cada 2 años la capacidad de un ordenador 
(memoria y velocidad) se multiplica por 2. 
● ¿El Big Data cumple esta ley?
¿Qué es Cloud Computing? 
● El Cloud (Nube) son enormes datacenters 
donde es fácil montar un cluster, o 
superordenador paralelo. 
● Si el Cloud es el hardware del Big Data 
¿cuál es su software?
¿Qué es Data Science? 
● Los Data Scientists aplican sofisticados 
algoritmos estadísticos y de Inteligencia 
Artificial (Machine Learning) para extraer 
conclusiones de los datos. 
● Es el software del Big Data.
Adquisición de Datos 
● Evolución histórica de los catálogos que 
contienen datos astronómicos 
● ¿Nos acercamos al Big Astronomy / Big 
Science?
Sala de los Toros 
Cueva de Lascaux, Francia, (15.000 a.C.) 
Alcance: 10 estrellas 
Magnitud límite: 2
Catálogo Estelar Babilónico 
La astronomía babilónica recoge observaciones de 
estrellas y constelaciones, durante y después de la 
dinastía Kassite (en torno al año 1750 a.C.) en Babilonia 
en una serie de catálogos estelares en escritura 
cuneiforme. En ellos figuran listas de constelaciones 
(antiguas), planetas y estrellas. 
Alcance: 75 estrellas 
Magnitud límite: 3
Carta estelar de Dunhuang 
China, Dinastía Tang (940 a.C.) 
Alcance: 1.300 estrellas 
Magnitud límite: 6
Almagesto 
Nombre árabe del tratado astronómico escrito en el siglo II por Claudio 
Ptolomeo de Alejandría, Egipto (¿plagio de Hiparco 300 años antes?). 
Contiene el catálogo estelar más completo de la antigüedad que fue utilizado 
ampliamente por los árabes y luego los europeos hasta la alta Edad media, y 
en el que se describen el sistema geocéntrico y el movimiento aparente de las 
estrellas y los planetas. Contiene más de 1.000 estrellas hasta magnitud 6, 
límite visual sin telescopio. 
Alcance: 1.022 estrellas 
Magnitud límite: 6
Catálogo de Bayer, Uranometría 
Realizado por Johann Bayer en el año 1.603, 
incorpora la nomenclatura del tipo "alfa Orionis" 
=> Betelgeuse 
Alcance: 788 estrellas 
Magnitud límite: 5
LAL 
Jérôme Lalande y sus ayudantes, publicaron 
"Histoire Céleste Française" en 1801 desde el 
Observatorio de París con las posiciones de 
47.390 estrellas hasta magnitud 9. 
Alcance: 47.390 estrellas 
Magnitud límite: 9
SAO 
Smithsonian Astrophysical Observatory. 
Realizado en 1966, es un catalogo fotográfico. 
Introduce la nomenclatura SAO NNNNNN, 
donde NNNNNN es un número comprendido 
entre 1 y 258.997. 
Alcance: 258.997 estrellas 
Magnitud límite: 10
Catálogo Hipparcos 
Creado en el año 1989 a partir de la misión 
astrométrica Hipparcos de la Agencia Espacial 
Europea (ESA). 
Alcance: 2,5 millones de estrellas 
Magnitud límite: 13
GSC 
Hubble Space Telescope Guide Star 
Catalogue. 
Alcance: 19 millones de estrellas 
Magnitud límite: 16
Catálogo NOMAD 
Naval Observatory Merged Astrometric Dataset: Derivado 
de otros catálogos como Hipparcos, Tycho-2, UCAC2, 
Yellow-Blue 6, USNO-B y 2MASS. 
Alcance: 1.100 millones de estrellas 
Magnitud límite: 18 (~ 1.5m OTA) 
Archivo total: 100 GB 
==> Stellarium.org (resumido a 1 GB y 100M de estrellas)
Catálogo IPHAS DR2 
The INT Photometric H-alpha Survey of the Northern 
Galactic Plane 
Isaac Newton Telescope (INT) en la isla de La Palma, 
Canarias, España 
Alcance: 219 millones de estrellas 
Magnitud límite: 20 (~ 2.5m OTA) 
Archivo total: 2,5 TB
The SDSS (1999-2005) 
Sloan Digital Sky Survey, Telescopio en Nuevo México de 2,5 m de apertura. 
Fotografió 1,3 millones de imágenes astronómicas, cubriendo 1/4 del cielo. 
Alcance: 360M objs, 930K galaxias, 100K cuásares 
Magnitud límite: 22 (~ 10m OTA) 
Flujo de datos: 0,2 TB/día. 
Archivo total: 80 TB 
==> Sky-map.org, Google Sky
NASA Mars Reconnaissance Orbiter 
La Mars Reconnaissance Orbiter (MRO) es una nave espacial, lanzada el 12 
de agosto de 2005 para el avance del conocimiento de Marte. 
Los datos se almacenan en una grabadora de estado sólido que usa más de 
700 chips de memoria de 256MB, en total su capacidad es de 160GB. 
Archivo total: 200 TB
Dark Energy Camera, Chile 
La Dark Energy Camera (DECam) es uno de los sensores del Dark Energy 
Survey (DES). 
Mediante técnicas de Advanced Machine Learning (Data Science) se realizan 
clasificaciones automáticas de objetos astronómicos, usando los algoritmos 
MCMC (Markov chain Monte Carlo). 
Alcance: 300 millones de galaxias 
Flujo de datos: 0,4 TB/día. 
Archivo total: 1 PB
CEFCA 
Centro de Estudios de Física del Cosmos de Aragón, Javalambre, Teruel, 
España. Telescopio JST/T250 de 2,55m de diámetro y cámara panorámica 
científica. La JPCam tiene 1.300 Megapixels, compuesta por un mosaico de 14 
CCD. 
Alcance: 100 millones de galaxias 
Magnitud límite: 22 (~ 10m OTA) 
Tecnología: 300 cores cluster 
Flujo de datos: 2 TB/día. 
Archivo total: 2,5 PB
Off-topic: Walmart 
Wal-Mart Stores, Inc., marcada como Walmart, es una corporación 
multinacional de minoristas de origen estadounidense, que opera cadenas de 
grandes almacenes. 
Archivo total: 2,5 PB
Very Long Baseline Array (VLBA) 
Diez radiotelescopios con reflectores de 25 
metros. 
Tecnología: Linux Beowulf cluster 
Flujo de datos: 100 TB/día. 
Archivo total: 10 PB
Pan-STARRS 
El Panoramic Survey Telescope and Rapid Response System, son dos 
telescopios de 1.8 m tipo Ritchey-Chretien en Hawaii. Es el mayor survey 
operativo del mundo y su misión principal es la detección de asteroides 
potencialmente peligrosos. Un sensor mosaico de CCD, en total 1.400 
megapixels. 
Magnitud límite: 24 (~ 40m OTA, como el European Extremely Large 
Telescope) 
Tecnología: PSPS 
Flujo de datos: 5 TB/día. 
Archivo total: 20 PB
LSST, Chile 
En construcción y operativo hacia el 2020, el Large Synoptic Survey Telescope 
será un telescopio de 8.4 metros equipado con una cámara digital de 3.200 
Megapixels. La cámara digital más grande del mundo tomará 800 imágenes 
cada noche. 
Alcance: 4.000 millones de galaxias 
Magnitud límite: 24 (~ 40m OTA, como el European Extremely Large 
Telescope) 
Flujo de datos: 10 TB/día. 
Archivo total: 60 PB
Off-topic: CERN, LHC 
Large Hadron Collider: 150 millones de sensores ofreciendo datos 40 millones 
de veces por segundo. 
Experimento ATLAS, Higgs boson 
Tecnología: MongoDB/CouchDB 
Flujo de datos: 100 TB/día. 
Archivo total: 140 PB
Square Kilometer Array (SKA) 
Proyecto de radiotelescopio ubicado en Australia y 
Sudáfrica, con 3.000 antenas haciendo interferometría, 
operativo en el 2024. 
"Massive Processing: 10^9 top range PCs" (como 1.000 Googles) 
Flujo de datos: 10 EB(exabytes)/día, aunque la mayoría se descarta... 
Archivo total: 200 PB (todo lo impreso en el mundo)
Off-topic: Facebook 
Tecnología: Apache Hadoop/MapReduce 
Flujo de datos: 500 TB/día. 
Archivo total: 300 PB
Off-topic: Google 
Tecnología: BigTable, Mesa 
Flujo de datos: 25 PB/día. 
Archivo total: 2 EB (exabyte, 10^18 bytes)
Off-topic: Internet 
Flujo de datos: 5 EB/día. 
Archivo total: 250 EB
Off-topic: Información digital en todo el mundo 
Archivo total: 1 ZB (zettabyte, 10^21 bytes)
Universo 
Información que contiene el Universo entero según un 
cálculo de Seth Lloyd, investigador de Complex Systems 
en el MIT. 
Archivo total: 10^91 bytes
Procesamiento de Datos 
● ¿Cómo son los datos astronómicos? 
● ¿Cómo se almacenan? 
● ¿Qué podemos hacer con ellos?
Ficheros FITS 
● Flexible Image Transport System 
● Cabeceras ASCII de metadatos: ubicación, condiciones 
ambientales, instrumentación, etc. 
● Caben imágenes (visible, infrarrojos, rayos X), 
espectros electromagnéticos, listas de fotones, cubos 
de datos, incluso tablas de datos.
Soluciones de Archivo 
En Big Data / Cloud se usan sistemas distribuidos de 
archivo: 
● Google File System (GFS) 
● Hadoop Distributed File System (HDFS), Yahoo 
● Amazon S3 (Simple Storage Service) 
● Windows Azure Storage
Soluciones de Procesamiento 
● ¿Cómo sumar imágenes? 
● ¿Cómo reducir/transformar datos? 
● ¿Cómo ordenar los objetos detectados?
Coaddition mediante MapReduce 
● MapReduce es multiplicar una orden en el 
cluster. 
● La solución de código abierto más extendida 
de MapReduce es Hadoop. 
● Amazon EC2 ofrece un servicio de Hadoop.
Coaddition mediante MapReduce 
Ejemplo de co-addition: 
Región del cielo: SDSS Stripe 
82, R bandpass. Tras sumar 
79 exposiciones el ratio S/N 
(signal/noise) mejora en un 
factor 9, y se detectan nuevos 
objetos.
Selección de imágenes: Apache Pig 
Con Pig Latin, al igual que usa Yahoo para 
gestionar su enorme cantidad de datos, es 
posible ejecutar operaciones de Hadoop con 
un lenguaje de alto nivel, similar a SQL.
Reducción de datos 
● Imágenes FITS 
● magnitudes, variabilidad, espectro 
● curva de luz, corrimiento al rojo, líneas de 
emisión
Clasificación de objetos 
● Técnicas de Advanced Machine Learning 
(Data Science) 
● Por ejemplo, la DECam usa MCMC (Markov 
chain Monte Carlo) para diferenciar galaxias
Support Vector Machines (SVM) 
● Algoritmo de clasificación que encuentra el “hiperborde” entre distintos 
tipos de datos. 
● Reconocimiento de habla y escritura, visión artificial,... 
● Mediante lenguaje R y librerías CRAN 
función svm ( install.packages('e1071') ) 
● Es el método que mejor funciona para discernir estrellas de la secuencia 
principal, de enanas blancas y de cuásares, respecto a otros como LDA, 
k-Nearest-neighbor, Regression Trees. 
● ¿Cómo hacer esto con Big Data? ... Existen librerías de código abierto 
que implementan Support Vector Machines (SVM) paralelizado en GPUs, 
sistemas multinúcleo en CPU y también sistemas distribuidos tipo Cloud.
The SVM must be trained, just as Artificial Neural 
Networks. It maps training data in the "input 
space" into a high dimensional "feature space". It 
determines a linear decision boundary in the 
feature space by constructing the "optimal 
separating hyperplane" distinguishing the classes. 
This allows the SVM to achieve a nonlinear 
boundary in the input space. The "support 
vectors" are those points in the input space which 
best define the boundary between the classes. 
Work on SVMs began in the 1960s but recent 
developments in the 1990s have made SVMs 
much more useful for application to real-world 
problems.
Plataformas comerciales Cloud 
● Google Compute Engine 
● Amazon Elastic Compute Cloud (EC2) 
● Microsoft Azure 
● Rackspace 
● Salesforce 
● IBM
Creating A Galactic Plane Atlas 
● Ejemplo de Big Data en Astronomía 
● Amazon EC2 
● Un cluster de máquinas Unix 
● Equivalente a 30 años de ejecución en CPU. 
● "Creating A Galactic Plane Atlas With Amazon Web 
Services" por G. Bruce Berriman, Ewa Deelman, John 
Good, Gideon Juve, Jamie Kinney, Ann Merrihew, 
Mats Rynge.
Galaxy Zoo Supernovae 
● Ejemplo de Big Data en Astronomía 
● Amazon EC2 y Amazon S3 como almacenamiento 
● "Galaxy Zoo Supernovae", A. M. Smith, et all. 
● Se han descubierto asteroides, supernovas y estrellas variables.
LSST 
● Ejemplo de Big Data en Astronomía 
● Google Exacycle 
● "Simulating a Dynamic Universe with the Large Synoptic Sky Survey" por 
Jeff Gardner, University of Washington, Seattle, WA
Unificando el Big Data astronómico 
Los Observatorios Virtuales son centros abiertos de datos 
donde se aglutinan las observaciones realizadas en 
distintos observatorios a lo largo del planeta. 
● International Virtual Observatory Alliance (IVOA) 
ivoa.net 
● The European Virtual Observatory Euro-VO 
euro-vo.org 
● Spanish Virtual Observatory 
svo.cab.inta-csic.es
Citizen Science, eScience 
Ciencia Ciudadana: investigación científica llevada a cabo por una suma de colaboradores, en su totalidad 
o en parte por científicos, profesionales junto a gente común. 
● Galaxy Zoo: Creado en el 2007 con el objeto de clasificar 900.000 galaxias, explorando visualmente 
los últimos surveys disponibles. 
● Stardust@home: Se estudian el polvo recogido del Cometa Wild2 por la sonda espacial Stardust. 
Aquél que realice un descubrimiento co-firmará los artículos científicos del proyecto Stardust@home. 
● SETI@home: científicos utilizan los ordenadores de voluntarios conectados a Internet para la 
búsqueda de inteligencia extraterrestre: setiathome.berkeley.edu 
● Otros: asteroids@home, cosmology@home, einstein@home, milkyway@home, SETIlive, … 
● Off-topic: Mención especial a ibercivis.es, proyecto aragonés de ciencia ciudadana, desarrollado en el BIFI.
Pregunta Abierta 
● ¿Cómo serán los telescopios de 
aficionados del futuro? 
● ¿Se comercializará en el año 
2020 el C14 series Big Data? 
● ¿Qué sorprendentes 
funcionalidades incluirá? 
Juan Ignacio Pérez Sacristán 
linkedin.com/in/semanticwebarchitect
Bibliografía 
* Big Data en la Astronomía: Una copia digital del universo, Sara Zambrano, 
blog.nul-unu.com/2013/10/08/big-data-en-la-astronomia-una-copia-digital-del-universo/ 
* The Observatorio Astrofísico de Javalambre: current status and future developments, A.J. Cenarro, M. Moles, D. Cristóbal-Hornillos, et all. 
sea-astronomia.es/drupal/sites/default/files/archivos/proceedings10/instrumentacion/ORALES/cenarroaj.pdf 
* Large Scale Data Processing and Astronomy: Mashups, Widgets, and Custom Configurable Data Applications, Andrew Connolly 
escience.washington.edu/get-help-now/astronomy-large-scale-data-processing 
* Astronomical Image Processing with Hadoop, Keith Wiley 
escience.washington.edu/get-help-now/astronomical-image-processing-hadoop 
* Big data challenges in astronomy, Juande Santander-Vela 
slideshare.net/juandesant/10-astronomy-bigdatachallenges
Bibliografía 
* From Big Bang to Big Data, wordlessTech 
wordlesstech.com/2012/04/04/from-big-bang-to-big-data/ 
* Analytics Astronomy: Unlocking the Physics of the Web, Kris Bishop 
exchanges.wiley.com/blog/2013/06/06/analytics-astronomy-unlocking-the-physics-of-the-web/ 
* Putting Astronomy's Head in the Cloud, CluE 
ssg.astro.washington.edu/clue.shtml?clue/CluE1 
* Wiley, Keith, et al. "Astronomy in the cloud: using mapreduce for image co-addition." Astronomy 123.901 (2011): 366-380. 
* Loebman, Sarah, et al. "Analyzing massive astrophysical datasets: Can Pig/Hadoop or a relational DBMS help?." Cluster Computing and 
Workshops, 2009. CLUSTER'09. IEEE International Conference on. IEEE, 2009. 
* Ekanayake, Jaliya, Shrideep Pallickara, and Geoffrey Fox. "Mapreduce for data intensive scientific analyses." eScience, 2008. eScience'08. 
IEEE Fourth International Conference on. IEEE, 2008.
Bibliografía 
* Tim Adams, Galaxy Zoo and the New Dawn of Citizen Science, The Guardian, Mar. 17, 2012 
guardian.co.uk/science/2012/mar/18/galaxy-zoo-crowdsourcing-citizen-scientists 
* Space telescopes and human genomes: How researchers share petabyte data sets, Sean Gallagher 
arstechnica.com/information-technology/2013/04/the-troubles-with-storing-and-sharing-the-universe-and-our-dna/ 
* 219 million stars: a detailed catalogue of the visible Milky Way 
ras.org.uk/news-and-press/2507-219-million-stars 
* Prolific NASA Mars Orbiter Passes Big Data Milestone 
jpl.nasa.gov/news/news.php?release=2013-324 
* Students tackle astronomically big data challenges in Chile 
iacs.seas.harvard.edu/news/students-tackle-astronomically-big-data-challenges-chile
Bibliografía 
* Google's fact-checking bots build vast knowledge bank, 20 August 2014, Hal Hodson 
newscientist.com/article/mg22329832.700-googles-factchecking-bots-build-vast-knowledge-bank.html 
* How to Manage Exabytes of Distributed Data?, Rich Brueckner 
insidehpc.com/2014/03/manage-exabytes-distributed-data/ 
* NASA uses big data to confirm 715 strange new exoplanets 
geek.com/science/nasa-uses-big-data-to-confirm-715-strange-new-exoplanets-1586061/ 
* Astronomy and Big Data: A Data Clustering Approach to Identifying Uncertain Galaxy Morphology by Kieran Jay Edwards and Mohamed 
Medhat Gaber 
ISBN: 331906598X, 2014
Bibliografía 
* Advances in Machine Learning and Data Mining for Astronomy by Michael J. Way, Jeffrey D. Scargle, Kamal M. Ali and Ashok N. Srivastava 
* Machine Learning Algorithm Cheat Sheet 
lauradhamilton.com/machine-learning-algorithm-cheat-sheet 
* Sakr, S., Liu, A., & Fayoumi, A. G. (2013). The family of MapReduce and large-scale data processing systems. ACM Computing Surveys 
(CSUR), 46(1), 11. 
* Scientists show what 100M computing hours on Google’s cloud can do 
gigaom.com/2012/12/17/scientists-show-what-100m-computing-hours-on-googles-cloud-can-do/ 
googleresearch.blogspot.com.es/2012/12/millions-of-core-hours-awarded-to.html

Más contenido relacionado

La actualidad más candente

Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias Escudero
Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias EscuderoEntrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias Escudero
Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias EscuderoCARMEN IGLESIAS
 
Origen i Evolució de l'Univers II
Origen i Evolució de l'Univers IIOrigen i Evolució de l'Univers II
Origen i Evolució de l'Univers IIrsalgas
 
Proyecto Newton
Proyecto NewtonProyecto Newton
Proyecto NewtonCucaxito
 
Una galaxia infantil pero hiperactiva sociedad el país
Una galaxia infantil pero hiperactiva   sociedad   el paísUna galaxia infantil pero hiperactiva   sociedad   el país
Una galaxia infantil pero hiperactiva sociedad el paísmariavarey
 
Proyecto final powerpoint
Proyecto final powerpointProyecto final powerpoint
Proyecto final powerpointTRKrule
 
Procesos 7o.Control de Lectura.La luz y sus relaciones.
Procesos 7o.Control de Lectura.La luz  y sus relaciones.Procesos 7o.Control de Lectura.La luz  y sus relaciones.
Procesos 7o.Control de Lectura.La luz y sus relaciones.Wilson Montana
 
Ciencias Naturales PEP
Ciencias Naturales PEPCiencias Naturales PEP
Ciencias Naturales PEPMilenaPeroni
 
Eduardo Ros - 'Cooperación internacional en la exploración espacial'
Eduardo Ros - 'Cooperación internacional en la exploración espacial'Eduardo Ros - 'Cooperación internacional en la exploración espacial'
Eduardo Ros - 'Cooperación internacional en la exploración espacial'Fundación Ramón Areces
 
Linea del tiempo del telescopio.
Linea del tiempo del telescopio.Linea del tiempo del telescopio.
Linea del tiempo del telescopio.DMBZ
 
PresentaciónCharla Antonio
PresentaciónCharla AntonioPresentaciónCharla Antonio
PresentaciónCharla AntonioEva Brañas
 
Brevisima historia-del-tiempo-ok
Brevisima historia-del-tiempo-okBrevisima historia-del-tiempo-ok
Brevisima historia-del-tiempo-okAlejandro Álvarez
 

La actualidad más candente (19)

Planeta X, Otra vez?
Planeta X, Otra vez?Planeta X, Otra vez?
Planeta X, Otra vez?
 
Tecnologia espacial Romero Y Carucci
Tecnologia espacial Romero Y CarucciTecnologia espacial Romero Y Carucci
Tecnologia espacial Romero Y Carucci
 
Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias Escudero
Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias EscuderoEntrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias Escudero
Entrevista Periodico La Opinion amora abril 2010 - Carmen Iglesias Escudero
 
Leyendo la Luz de las Galaxias
Leyendo la Luz de las GalaxiasLeyendo la Luz de las Galaxias
Leyendo la Luz de las Galaxias
 
Origen i Evolució de l'Univers II
Origen i Evolució de l'Univers IIOrigen i Evolució de l'Univers II
Origen i Evolució de l'Univers II
 
Astronomía: En busca de nuevas Tierras
Astronomía: En busca de nuevas TierrasAstronomía: En busca de nuevas Tierras
Astronomía: En busca de nuevas Tierras
 
Proyecto Newton
Proyecto NewtonProyecto Newton
Proyecto Newton
 
Una galaxia infantil pero hiperactiva sociedad el país
Una galaxia infantil pero hiperactiva   sociedad   el paísUna galaxia infantil pero hiperactiva   sociedad   el país
Una galaxia infantil pero hiperactiva sociedad el país
 
Física, radioastronomía.
Física, radioastronomía.Física, radioastronomía.
Física, radioastronomía.
 
Proyecto final powerpoint
Proyecto final powerpointProyecto final powerpoint
Proyecto final powerpoint
 
Procesos 7o.Control de Lectura.La luz y sus relaciones.
Procesos 7o.Control de Lectura.La luz  y sus relaciones.Procesos 7o.Control de Lectura.La luz  y sus relaciones.
Procesos 7o.Control de Lectura.La luz y sus relaciones.
 
Radiastronomia1
Radiastronomia1Radiastronomia1
Radiastronomia1
 
Ciencias Naturales PEP
Ciencias Naturales PEPCiencias Naturales PEP
Ciencias Naturales PEP
 
Eduardo Ros - 'Cooperación internacional en la exploración espacial'
Eduardo Ros - 'Cooperación internacional en la exploración espacial'Eduardo Ros - 'Cooperación internacional en la exploración espacial'
Eduardo Ros - 'Cooperación internacional en la exploración espacial'
 
Linea del tiempo del telescopio.
Linea del tiempo del telescopio.Linea del tiempo del telescopio.
Linea del tiempo del telescopio.
 
201301 proyecto espacial
201301 proyecto espacial201301 proyecto espacial
201301 proyecto espacial
 
Telescopio
TelescopioTelescopio
Telescopio
 
PresentaciónCharla Antonio
PresentaciónCharla AntonioPresentaciónCharla Antonio
PresentaciónCharla Antonio
 
Brevisima historia-del-tiempo-ok
Brevisima historia-del-tiempo-okBrevisima historia-del-tiempo-ok
Brevisima historia-del-tiempo-ok
 

Similar a Astronomía y Big Data. Estrellas en la era del Petabyte

El Experimento ATLAS: Ciencia y TICs
El Experimento ATLAS: Ciencia y TICsEl Experimento ATLAS: Ciencia y TICs
El Experimento ATLAS: Ciencia y TICsElias Said Hung
 
Martalosada 100322123912-phpapp02
Martalosada 100322123912-phpapp02Martalosada 100322123912-phpapp02
Martalosada 100322123912-phpapp02Proyecto CeVALE2
 
Aqueta de un radiotelescopio
Aqueta de un radiotelescopioAqueta de un radiotelescopio
Aqueta de un radiotelescopioJULIO PEREZ
 
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...UnioviHEP
 
Astronomía en la era de la información
Astronomía en la era de la informaciónAstronomía en la era de la información
Astronomía en la era de la informaciónRoberto Muñoz
 
Presentacion LHC E309
Presentacion LHC E309Presentacion LHC E309
Presentacion LHC E309pinomdq
 
48ca9cb8b362elhc Ai1pol E306
48ca9cb8b362elhc Ai1pol E30648ca9cb8b362elhc Ai1pol E306
48ca9cb8b362elhc Ai1pol E306agusyflor
 
Space systems engineering proexia
Space systems engineering proexiaSpace systems engineering proexia
Space systems engineering proexiaCONALEP 177
 
Tend. analisis de datos a n. mundial sl
Tend. analisis de datos a n. mundial slTend. analisis de datos a n. mundial sl
Tend. analisis de datos a n. mundial slMario Melgar M
 
Data analysis worldwide trends
Data analysis worldwide trendsData analysis worldwide trends
Data analysis worldwide trendsMario Melgar M
 
De hierros y cables al bosón de Higgs
De hierros y cables al bosón de HiggsDe hierros y cables al bosón de Higgs
De hierros y cables al bosón de HiggsJonatan Piedra
 
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014UnioviHEP
 
TP del Gran Colisionador de Hadrones
TP del Gran Colisionador de HadronesTP del Gran Colisionador de Hadrones
TP del Gran Colisionador de Hadronesguest847b3c
 
presentacion sobre el LHC
presentacion sobre el LHCpresentacion sobre el LHC
presentacion sobre el LHCjulitaa
 

Similar a Astronomía y Big Data. Estrellas en la era del Petabyte (20)

El Experimento ATLAS: Ciencia y TICs
El Experimento ATLAS: Ciencia y TICsEl Experimento ATLAS: Ciencia y TICs
El Experimento ATLAS: Ciencia y TICs
 
Martalosada 100322123912-phpapp02
Martalosada 100322123912-phpapp02Martalosada 100322123912-phpapp02
Martalosada 100322123912-phpapp02
 
Aqueta de un radiotelescopio
Aqueta de un radiotelescopioAqueta de un radiotelescopio
Aqueta de un radiotelescopio
 
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...
Semana de la ciencia 2016 - Explorando las fronteras de la Física de partícul...
 
Astronomía en la era de la información
Astronomía en la era de la informaciónAstronomía en la era de la información
Astronomía en la era de la información
 
CTA LST 1st prototype
CTA LST 1st prototypeCTA LST 1st prototype
CTA LST 1st prototype
 
Presentacion LHC E309
Presentacion LHC E309Presentacion LHC E309
Presentacion LHC E309
 
48ca9cb8b362elhc Ai1pol E306
48ca9cb8b362elhc Ai1pol E30648ca9cb8b362elhc Ai1pol E306
48ca9cb8b362elhc Ai1pol E306
 
Lhc
LhcLhc
Lhc
 
Lhc
LhcLhc
Lhc
 
Space systems engineering proexia
Space systems engineering proexiaSpace systems engineering proexia
Space systems engineering proexia
 
Tend. analisis de datos a n. mundial sl
Tend. analisis de datos a n. mundial slTend. analisis de datos a n. mundial sl
Tend. analisis de datos a n. mundial sl
 
Data analysis worldwide trends
Data analysis worldwide trendsData analysis worldwide trends
Data analysis worldwide trends
 
De hierros y cables al bosón de Higgs
De hierros y cables al bosón de HiggsDe hierros y cables al bosón de Higgs
De hierros y cables al bosón de Higgs
 
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014
Buscando la Materia Oscura en el LHC - Semana de la Ciencia 2014
 
TP del Gran Colisionador de Hadrones
TP del Gran Colisionador de HadronesTP del Gran Colisionador de Hadrones
TP del Gran Colisionador de Hadrones
 
Computar para la ciencia
Computar para la cienciaComputar para la ciencia
Computar para la ciencia
 
T
TT
T
 
presentacion sobre el LHC
presentacion sobre el LHCpresentacion sobre el LHC
presentacion sobre el LHC
 
Alma
AlmaAlma
Alma
 

Último

Osteología del miembro torácico - Anatomía Veterinaria
Osteología del miembro torácico - Anatomía VeterinariaOsteología del miembro torácico - Anatomía Veterinaria
Osteología del miembro torácico - Anatomía Veterinariaspeckledpelt
 
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdf
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdfSpinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdf
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdffrank0071
 
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptx
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptxRespuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptx
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptxabrilhernandez45
 
CuidadoCR-Hemodinamia-Edwards.pdf libro.
CuidadoCR-Hemodinamia-Edwards.pdf libro.CuidadoCR-Hemodinamia-Edwards.pdf libro.
CuidadoCR-Hemodinamia-Edwards.pdf libro.antilhue72
 
terminologia medica en medicina y salud.
terminologia medica en medicina y salud.terminologia medica en medicina y salud.
terminologia medica en medicina y salud.SaritaMendozaChanco
 
Las propiedades fisicas de los minerales .pdf
Las propiedades fisicas de los minerales .pdfLas propiedades fisicas de los minerales .pdf
Las propiedades fisicas de los minerales .pdfyaisdiazca
 
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdfClaudiaMolina492672
 
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...web jabon
 
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEO
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEOCASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEO
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEOKarlaAguirre72
 
Hipertension Arterial 2024..............
Hipertension Arterial 2024..............Hipertension Arterial 2024..............
Hipertension Arterial 2024..............AnaLauraEstigarribia
 
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...Alemendoza52
 
PRESENTACION DE ELECTROCARDIOGRAMA BASICO
PRESENTACION DE ELECTROCARDIOGRAMA BASICOPRESENTACION DE ELECTROCARDIOGRAMA BASICO
PRESENTACION DE ELECTROCARDIOGRAMA BASICOgonzalezdelatorreitz
 
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptxlesli10cayao
 
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptx
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptxACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptx
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptxJavierBustamante58
 
HONGOS: Generalidades, estructura y clasificación
HONGOS: Generalidades, estructura y clasificaciónHONGOS: Generalidades, estructura y clasificación
HONGOS: Generalidades, estructura y clasificaciónRosarioAlonso9
 
Linea de tiempo, (la psicología anormal)
Linea de tiempo, (la psicología anormal)Linea de tiempo, (la psicología anormal)
Linea de tiempo, (la psicología anormal)PabloBriceo13
 
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptxjuansuarez760083
 
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdf
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdfTaller Sistema Nervioso Central y Sistema Nervioso Periferico.pdf
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdfCindyramos11
 
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...totalmodajuvenil24
 
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.ppt
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.pptVENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.ppt
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.pptAdriansamuelLedesmaa1
 

Último (20)

Osteología del miembro torácico - Anatomía Veterinaria
Osteología del miembro torácico - Anatomía VeterinariaOsteología del miembro torácico - Anatomía Veterinaria
Osteología del miembro torácico - Anatomía Veterinaria
 
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdf
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdfSpinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdf
Spinney, L. - El jinete pálido. 1918: la epidemia que cambió al mundo [2018].pdf
 
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptx
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptxRespuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptx
Respuesta fisiológica de C3, C4 y plantas CAM en clima cambiante.pptx
 
CuidadoCR-Hemodinamia-Edwards.pdf libro.
CuidadoCR-Hemodinamia-Edwards.pdf libro.CuidadoCR-Hemodinamia-Edwards.pdf libro.
CuidadoCR-Hemodinamia-Edwards.pdf libro.
 
terminologia medica en medicina y salud.
terminologia medica en medicina y salud.terminologia medica en medicina y salud.
terminologia medica en medicina y salud.
 
Las propiedades fisicas de los minerales .pdf
Las propiedades fisicas de los minerales .pdfLas propiedades fisicas de los minerales .pdf
Las propiedades fisicas de los minerales .pdf
 
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf
⚛️2o MAESTRO CIENCIAS FISICA CUADERNO DE TRABAJO3T.pdf · versión 1.pdf
 
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...
Jabón de Sangre de Drago: Descubre los Increíbles Beneficios de esta Antigua ...
 
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEO
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEOCASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEO
CASO CLINICO INSUFICIENCIA SUPRARRENAL EN UNA MUJER CON C NEOFORMANS MENINGEO
 
Hipertension Arterial 2024..............
Hipertension Arterial 2024..............Hipertension Arterial 2024..............
Hipertension Arterial 2024..............
 
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...
CADENA RESPIRATORIA, FOSFORILACIÓN OXIDATIVA E INTEGRACIÓN DEL METABOLISMO I ...
 
PRESENTACION DE ELECTROCARDIOGRAMA BASICO
PRESENTACION DE ELECTROCARDIOGRAMA BASICOPRESENTACION DE ELECTROCARDIOGRAMA BASICO
PRESENTACION DE ELECTROCARDIOGRAMA BASICO
 
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx
3 REHABILITACIÓN EN DISPLASIA DEL DESARROLLO DE LA CADERA.pptx
 
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptx
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptxACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptx
ACCIONES PARA UNA VACUNACION SEGURA Y EFICAZ.pptx
 
HONGOS: Generalidades, estructura y clasificación
HONGOS: Generalidades, estructura y clasificaciónHONGOS: Generalidades, estructura y clasificación
HONGOS: Generalidades, estructura y clasificación
 
Linea de tiempo, (la psicología anormal)
Linea de tiempo, (la psicología anormal)Linea de tiempo, (la psicología anormal)
Linea de tiempo, (la psicología anormal)
 
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx
1. FISIOLOGIA RESPIRATORIA APLICADA A LA VENTILACIÓN MECÁNICA.pptx
 
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdf
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdfTaller Sistema Nervioso Central y Sistema Nervioso Periferico.pdf
Taller Sistema Nervioso Central y Sistema Nervioso Periferico.pdf
 
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...
presentacion sistema solar.pptx, Los ocho planetas que componen el sistema so...
 
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.ppt
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.pptVENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.ppt
VENTILACIÓN MECÁNICA EN SITUACIONES ESPECIALES.ppt
 

Astronomía y Big Data. Estrellas en la era del Petabyte

  • 1. Astronomía y Big Data Juan Ignacio Pérez Sacristán linkedin.com/in/semanticwebarchitect
  • 2. ¿Qué es Big Data? ● Big Data son PB, PetaBytes. ● Bytes, KB, MB, GB, TB, PB, EB ● 1 foto = 1 MB ● 1.000 fotos = 1 GB ● 1.000.000 fotos = 1 TB
  • 3.
  • 4. Ejemplos de Big Data ● Al usar un buscador de Internet 10^10 páginas web ● Al escribir en redes sociales 10^12 mensajes ● Google Knowledge Vault, una Wikipedia hecha por robots 10^9 hechos
  • 5.
  • 6. Hype Cycle Ciclo de sobreexpectación ● El proceso de asimilación de las nuevas tecnologías en la sociedad casi siempre sufre un período inicial de gran emoción y crecimiento, alcanzando un máximo para después desinflarse al no cumplir las exageradas expectativas que se prometían al principio. Por último, se alcanza un estado de equilibrio cuando la sociedad convive con normalidad con dicha tecnología. ● Ejemplos: Inteligencia Artificial, Ordenadores Cuánticos, ...
  • 7.
  • 8.
  • 9. La ley de Moore ● Cada 2 años la capacidad de un ordenador (memoria y velocidad) se multiplica por 2. ● ¿El Big Data cumple esta ley?
  • 10.
  • 11. ¿Qué es Cloud Computing? ● El Cloud (Nube) son enormes datacenters donde es fácil montar un cluster, o superordenador paralelo. ● Si el Cloud es el hardware del Big Data ¿cuál es su software?
  • 12.
  • 13. ¿Qué es Data Science? ● Los Data Scientists aplican sofisticados algoritmos estadísticos y de Inteligencia Artificial (Machine Learning) para extraer conclusiones de los datos. ● Es el software del Big Data.
  • 14.
  • 15. Adquisición de Datos ● Evolución histórica de los catálogos que contienen datos astronómicos ● ¿Nos acercamos al Big Astronomy / Big Science?
  • 16.
  • 17. Sala de los Toros Cueva de Lascaux, Francia, (15.000 a.C.) Alcance: 10 estrellas Magnitud límite: 2
  • 18.
  • 19. Catálogo Estelar Babilónico La astronomía babilónica recoge observaciones de estrellas y constelaciones, durante y después de la dinastía Kassite (en torno al año 1750 a.C.) en Babilonia en una serie de catálogos estelares en escritura cuneiforme. En ellos figuran listas de constelaciones (antiguas), planetas y estrellas. Alcance: 75 estrellas Magnitud límite: 3
  • 20.
  • 21. Carta estelar de Dunhuang China, Dinastía Tang (940 a.C.) Alcance: 1.300 estrellas Magnitud límite: 6
  • 22.
  • 23. Almagesto Nombre árabe del tratado astronómico escrito en el siglo II por Claudio Ptolomeo de Alejandría, Egipto (¿plagio de Hiparco 300 años antes?). Contiene el catálogo estelar más completo de la antigüedad que fue utilizado ampliamente por los árabes y luego los europeos hasta la alta Edad media, y en el que se describen el sistema geocéntrico y el movimiento aparente de las estrellas y los planetas. Contiene más de 1.000 estrellas hasta magnitud 6, límite visual sin telescopio. Alcance: 1.022 estrellas Magnitud límite: 6
  • 24.
  • 25. Catálogo de Bayer, Uranometría Realizado por Johann Bayer en el año 1.603, incorpora la nomenclatura del tipo "alfa Orionis" => Betelgeuse Alcance: 788 estrellas Magnitud límite: 5
  • 26.
  • 27. LAL Jérôme Lalande y sus ayudantes, publicaron "Histoire Céleste Française" en 1801 desde el Observatorio de París con las posiciones de 47.390 estrellas hasta magnitud 9. Alcance: 47.390 estrellas Magnitud límite: 9
  • 28.
  • 29. SAO Smithsonian Astrophysical Observatory. Realizado en 1966, es un catalogo fotográfico. Introduce la nomenclatura SAO NNNNNN, donde NNNNNN es un número comprendido entre 1 y 258.997. Alcance: 258.997 estrellas Magnitud límite: 10
  • 30.
  • 31. Catálogo Hipparcos Creado en el año 1989 a partir de la misión astrométrica Hipparcos de la Agencia Espacial Europea (ESA). Alcance: 2,5 millones de estrellas Magnitud límite: 13
  • 32.
  • 33. GSC Hubble Space Telescope Guide Star Catalogue. Alcance: 19 millones de estrellas Magnitud límite: 16
  • 34.
  • 35. Catálogo NOMAD Naval Observatory Merged Astrometric Dataset: Derivado de otros catálogos como Hipparcos, Tycho-2, UCAC2, Yellow-Blue 6, USNO-B y 2MASS. Alcance: 1.100 millones de estrellas Magnitud límite: 18 (~ 1.5m OTA) Archivo total: 100 GB ==> Stellarium.org (resumido a 1 GB y 100M de estrellas)
  • 36.
  • 37. Catálogo IPHAS DR2 The INT Photometric H-alpha Survey of the Northern Galactic Plane Isaac Newton Telescope (INT) en la isla de La Palma, Canarias, España Alcance: 219 millones de estrellas Magnitud límite: 20 (~ 2.5m OTA) Archivo total: 2,5 TB
  • 38.
  • 39. The SDSS (1999-2005) Sloan Digital Sky Survey, Telescopio en Nuevo México de 2,5 m de apertura. Fotografió 1,3 millones de imágenes astronómicas, cubriendo 1/4 del cielo. Alcance: 360M objs, 930K galaxias, 100K cuásares Magnitud límite: 22 (~ 10m OTA) Flujo de datos: 0,2 TB/día. Archivo total: 80 TB ==> Sky-map.org, Google Sky
  • 40.
  • 41. NASA Mars Reconnaissance Orbiter La Mars Reconnaissance Orbiter (MRO) es una nave espacial, lanzada el 12 de agosto de 2005 para el avance del conocimiento de Marte. Los datos se almacenan en una grabadora de estado sólido que usa más de 700 chips de memoria de 256MB, en total su capacidad es de 160GB. Archivo total: 200 TB
  • 42.
  • 43. Dark Energy Camera, Chile La Dark Energy Camera (DECam) es uno de los sensores del Dark Energy Survey (DES). Mediante técnicas de Advanced Machine Learning (Data Science) se realizan clasificaciones automáticas de objetos astronómicos, usando los algoritmos MCMC (Markov chain Monte Carlo). Alcance: 300 millones de galaxias Flujo de datos: 0,4 TB/día. Archivo total: 1 PB
  • 44.
  • 45. CEFCA Centro de Estudios de Física del Cosmos de Aragón, Javalambre, Teruel, España. Telescopio JST/T250 de 2,55m de diámetro y cámara panorámica científica. La JPCam tiene 1.300 Megapixels, compuesta por un mosaico de 14 CCD. Alcance: 100 millones de galaxias Magnitud límite: 22 (~ 10m OTA) Tecnología: 300 cores cluster Flujo de datos: 2 TB/día. Archivo total: 2,5 PB
  • 46.
  • 47. Off-topic: Walmart Wal-Mart Stores, Inc., marcada como Walmart, es una corporación multinacional de minoristas de origen estadounidense, que opera cadenas de grandes almacenes. Archivo total: 2,5 PB
  • 48. Very Long Baseline Array (VLBA) Diez radiotelescopios con reflectores de 25 metros. Tecnología: Linux Beowulf cluster Flujo de datos: 100 TB/día. Archivo total: 10 PB
  • 49.
  • 50. Pan-STARRS El Panoramic Survey Telescope and Rapid Response System, son dos telescopios de 1.8 m tipo Ritchey-Chretien en Hawaii. Es el mayor survey operativo del mundo y su misión principal es la detección de asteroides potencialmente peligrosos. Un sensor mosaico de CCD, en total 1.400 megapixels. Magnitud límite: 24 (~ 40m OTA, como el European Extremely Large Telescope) Tecnología: PSPS Flujo de datos: 5 TB/día. Archivo total: 20 PB
  • 51.
  • 52. LSST, Chile En construcción y operativo hacia el 2020, el Large Synoptic Survey Telescope será un telescopio de 8.4 metros equipado con una cámara digital de 3.200 Megapixels. La cámara digital más grande del mundo tomará 800 imágenes cada noche. Alcance: 4.000 millones de galaxias Magnitud límite: 24 (~ 40m OTA, como el European Extremely Large Telescope) Flujo de datos: 10 TB/día. Archivo total: 60 PB
  • 53.
  • 54. Off-topic: CERN, LHC Large Hadron Collider: 150 millones de sensores ofreciendo datos 40 millones de veces por segundo. Experimento ATLAS, Higgs boson Tecnología: MongoDB/CouchDB Flujo de datos: 100 TB/día. Archivo total: 140 PB
  • 55. Square Kilometer Array (SKA) Proyecto de radiotelescopio ubicado en Australia y Sudáfrica, con 3.000 antenas haciendo interferometría, operativo en el 2024. "Massive Processing: 10^9 top range PCs" (como 1.000 Googles) Flujo de datos: 10 EB(exabytes)/día, aunque la mayoría se descarta... Archivo total: 200 PB (todo lo impreso en el mundo)
  • 56.
  • 57. Off-topic: Facebook Tecnología: Apache Hadoop/MapReduce Flujo de datos: 500 TB/día. Archivo total: 300 PB
  • 58. Off-topic: Google Tecnología: BigTable, Mesa Flujo de datos: 25 PB/día. Archivo total: 2 EB (exabyte, 10^18 bytes)
  • 59. Off-topic: Internet Flujo de datos: 5 EB/día. Archivo total: 250 EB
  • 60. Off-topic: Información digital en todo el mundo Archivo total: 1 ZB (zettabyte, 10^21 bytes)
  • 61. Universo Información que contiene el Universo entero según un cálculo de Seth Lloyd, investigador de Complex Systems en el MIT. Archivo total: 10^91 bytes
  • 62. Procesamiento de Datos ● ¿Cómo son los datos astronómicos? ● ¿Cómo se almacenan? ● ¿Qué podemos hacer con ellos?
  • 63. Ficheros FITS ● Flexible Image Transport System ● Cabeceras ASCII de metadatos: ubicación, condiciones ambientales, instrumentación, etc. ● Caben imágenes (visible, infrarrojos, rayos X), espectros electromagnéticos, listas de fotones, cubos de datos, incluso tablas de datos.
  • 64.
  • 65. Soluciones de Archivo En Big Data / Cloud se usan sistemas distribuidos de archivo: ● Google File System (GFS) ● Hadoop Distributed File System (HDFS), Yahoo ● Amazon S3 (Simple Storage Service) ● Windows Azure Storage
  • 66.
  • 67. Soluciones de Procesamiento ● ¿Cómo sumar imágenes? ● ¿Cómo reducir/transformar datos? ● ¿Cómo ordenar los objetos detectados?
  • 68. Coaddition mediante MapReduce ● MapReduce es multiplicar una orden en el cluster. ● La solución de código abierto más extendida de MapReduce es Hadoop. ● Amazon EC2 ofrece un servicio de Hadoop.
  • 69. Coaddition mediante MapReduce Ejemplo de co-addition: Región del cielo: SDSS Stripe 82, R bandpass. Tras sumar 79 exposiciones el ratio S/N (signal/noise) mejora en un factor 9, y se detectan nuevos objetos.
  • 70. Selección de imágenes: Apache Pig Con Pig Latin, al igual que usa Yahoo para gestionar su enorme cantidad de datos, es posible ejecutar operaciones de Hadoop con un lenguaje de alto nivel, similar a SQL.
  • 71.
  • 72. Reducción de datos ● Imágenes FITS ● magnitudes, variabilidad, espectro ● curva de luz, corrimiento al rojo, líneas de emisión
  • 73. Clasificación de objetos ● Técnicas de Advanced Machine Learning (Data Science) ● Por ejemplo, la DECam usa MCMC (Markov chain Monte Carlo) para diferenciar galaxias
  • 74. Support Vector Machines (SVM) ● Algoritmo de clasificación que encuentra el “hiperborde” entre distintos tipos de datos. ● Reconocimiento de habla y escritura, visión artificial,... ● Mediante lenguaje R y librerías CRAN función svm ( install.packages('e1071') ) ● Es el método que mejor funciona para discernir estrellas de la secuencia principal, de enanas blancas y de cuásares, respecto a otros como LDA, k-Nearest-neighbor, Regression Trees. ● ¿Cómo hacer esto con Big Data? ... Existen librerías de código abierto que implementan Support Vector Machines (SVM) paralelizado en GPUs, sistemas multinúcleo en CPU y también sistemas distribuidos tipo Cloud.
  • 75. The SVM must be trained, just as Artificial Neural Networks. It maps training data in the "input space" into a high dimensional "feature space". It determines a linear decision boundary in the feature space by constructing the "optimal separating hyperplane" distinguishing the classes. This allows the SVM to achieve a nonlinear boundary in the input space. The "support vectors" are those points in the input space which best define the boundary between the classes. Work on SVMs began in the 1960s but recent developments in the 1990s have made SVMs much more useful for application to real-world problems.
  • 76. Plataformas comerciales Cloud ● Google Compute Engine ● Amazon Elastic Compute Cloud (EC2) ● Microsoft Azure ● Rackspace ● Salesforce ● IBM
  • 77.
  • 78. Creating A Galactic Plane Atlas ● Ejemplo de Big Data en Astronomía ● Amazon EC2 ● Un cluster de máquinas Unix ● Equivalente a 30 años de ejecución en CPU. ● "Creating A Galactic Plane Atlas With Amazon Web Services" por G. Bruce Berriman, Ewa Deelman, John Good, Gideon Juve, Jamie Kinney, Ann Merrihew, Mats Rynge.
  • 79. Galaxy Zoo Supernovae ● Ejemplo de Big Data en Astronomía ● Amazon EC2 y Amazon S3 como almacenamiento ● "Galaxy Zoo Supernovae", A. M. Smith, et all. ● Se han descubierto asteroides, supernovas y estrellas variables.
  • 80. LSST ● Ejemplo de Big Data en Astronomía ● Google Exacycle ● "Simulating a Dynamic Universe with the Large Synoptic Sky Survey" por Jeff Gardner, University of Washington, Seattle, WA
  • 81. Unificando el Big Data astronómico Los Observatorios Virtuales son centros abiertos de datos donde se aglutinan las observaciones realizadas en distintos observatorios a lo largo del planeta. ● International Virtual Observatory Alliance (IVOA) ivoa.net ● The European Virtual Observatory Euro-VO euro-vo.org ● Spanish Virtual Observatory svo.cab.inta-csic.es
  • 82. Citizen Science, eScience Ciencia Ciudadana: investigación científica llevada a cabo por una suma de colaboradores, en su totalidad o en parte por científicos, profesionales junto a gente común. ● Galaxy Zoo: Creado en el 2007 con el objeto de clasificar 900.000 galaxias, explorando visualmente los últimos surveys disponibles. ● Stardust@home: Se estudian el polvo recogido del Cometa Wild2 por la sonda espacial Stardust. Aquél que realice un descubrimiento co-firmará los artículos científicos del proyecto Stardust@home. ● SETI@home: científicos utilizan los ordenadores de voluntarios conectados a Internet para la búsqueda de inteligencia extraterrestre: setiathome.berkeley.edu ● Otros: asteroids@home, cosmology@home, einstein@home, milkyway@home, SETIlive, … ● Off-topic: Mención especial a ibercivis.es, proyecto aragonés de ciencia ciudadana, desarrollado en el BIFI.
  • 83. Pregunta Abierta ● ¿Cómo serán los telescopios de aficionados del futuro? ● ¿Se comercializará en el año 2020 el C14 series Big Data? ● ¿Qué sorprendentes funcionalidades incluirá? Juan Ignacio Pérez Sacristán linkedin.com/in/semanticwebarchitect
  • 84. Bibliografía * Big Data en la Astronomía: Una copia digital del universo, Sara Zambrano, blog.nul-unu.com/2013/10/08/big-data-en-la-astronomia-una-copia-digital-del-universo/ * The Observatorio Astrofísico de Javalambre: current status and future developments, A.J. Cenarro, M. Moles, D. Cristóbal-Hornillos, et all. sea-astronomia.es/drupal/sites/default/files/archivos/proceedings10/instrumentacion/ORALES/cenarroaj.pdf * Large Scale Data Processing and Astronomy: Mashups, Widgets, and Custom Configurable Data Applications, Andrew Connolly escience.washington.edu/get-help-now/astronomy-large-scale-data-processing * Astronomical Image Processing with Hadoop, Keith Wiley escience.washington.edu/get-help-now/astronomical-image-processing-hadoop * Big data challenges in astronomy, Juande Santander-Vela slideshare.net/juandesant/10-astronomy-bigdatachallenges
  • 85. Bibliografía * From Big Bang to Big Data, wordlessTech wordlesstech.com/2012/04/04/from-big-bang-to-big-data/ * Analytics Astronomy: Unlocking the Physics of the Web, Kris Bishop exchanges.wiley.com/blog/2013/06/06/analytics-astronomy-unlocking-the-physics-of-the-web/ * Putting Astronomy's Head in the Cloud, CluE ssg.astro.washington.edu/clue.shtml?clue/CluE1 * Wiley, Keith, et al. "Astronomy in the cloud: using mapreduce for image co-addition." Astronomy 123.901 (2011): 366-380. * Loebman, Sarah, et al. "Analyzing massive astrophysical datasets: Can Pig/Hadoop or a relational DBMS help?." Cluster Computing and Workshops, 2009. CLUSTER'09. IEEE International Conference on. IEEE, 2009. * Ekanayake, Jaliya, Shrideep Pallickara, and Geoffrey Fox. "Mapreduce for data intensive scientific analyses." eScience, 2008. eScience'08. IEEE Fourth International Conference on. IEEE, 2008.
  • 86. Bibliografía * Tim Adams, Galaxy Zoo and the New Dawn of Citizen Science, The Guardian, Mar. 17, 2012 guardian.co.uk/science/2012/mar/18/galaxy-zoo-crowdsourcing-citizen-scientists * Space telescopes and human genomes: How researchers share petabyte data sets, Sean Gallagher arstechnica.com/information-technology/2013/04/the-troubles-with-storing-and-sharing-the-universe-and-our-dna/ * 219 million stars: a detailed catalogue of the visible Milky Way ras.org.uk/news-and-press/2507-219-million-stars * Prolific NASA Mars Orbiter Passes Big Data Milestone jpl.nasa.gov/news/news.php?release=2013-324 * Students tackle astronomically big data challenges in Chile iacs.seas.harvard.edu/news/students-tackle-astronomically-big-data-challenges-chile
  • 87. Bibliografía * Google's fact-checking bots build vast knowledge bank, 20 August 2014, Hal Hodson newscientist.com/article/mg22329832.700-googles-factchecking-bots-build-vast-knowledge-bank.html * How to Manage Exabytes of Distributed Data?, Rich Brueckner insidehpc.com/2014/03/manage-exabytes-distributed-data/ * NASA uses big data to confirm 715 strange new exoplanets geek.com/science/nasa-uses-big-data-to-confirm-715-strange-new-exoplanets-1586061/ * Astronomy and Big Data: A Data Clustering Approach to Identifying Uncertain Galaxy Morphology by Kieran Jay Edwards and Mohamed Medhat Gaber ISBN: 331906598X, 2014
  • 88. Bibliografía * Advances in Machine Learning and Data Mining for Astronomy by Michael J. Way, Jeffrey D. Scargle, Kamal M. Ali and Ashok N. Srivastava * Machine Learning Algorithm Cheat Sheet lauradhamilton.com/machine-learning-algorithm-cheat-sheet * Sakr, S., Liu, A., & Fayoumi, A. G. (2013). The family of MapReduce and large-scale data processing systems. ACM Computing Surveys (CSUR), 46(1), 11. * Scientists show what 100M computing hours on Google’s cloud can do gigaom.com/2012/12/17/scientists-show-what-100m-computing-hours-on-googles-cloud-can-do/ googleresearch.blogspot.com.es/2012/12/millions-of-core-hours-awarded-to.html

Notas del editor

  1. Astronomía y Big Data Sinopsis: Desde el año 1800 a.c. con el catálogo estelar babilónico, hasta nuestros días con el Sloan Digital Sky Survey (SDSS), el volumen de datos astronómicos acumulado ha crecido hasta el punto de representar un problema informático, al superar las limitaciones de capacidad de los más modernos ordenadores. A este fenómeno se le conoce como "Big Data". Con el objeto de poder gestionar tanta información astrónomos profesionales, e incluso algunos aficionados, están empezando a usar herramientas desarrolladas en los mayores centros de datos del planeta, como Google o Facebook. En la charla "Astronomía y Big Data" se analizará esta escalada de datos en el mundo astronómico, algunas de las soluciones más innovadoras y también se repasarán los proyectos de Big Data astronómico al alcance del astrónomo amateur.
  2. Otros wide-field surveys: Two Micron All Sky Survey (2MASS), Dark Energy Survey (DES), Carnegie Supernova Project (CSP), Palomar Transient Factory (PTF), Large Sky Area Multi-Object Fibre Spectroscopic Telescope (LAMOST), ...