SlideShare ist ein Scribd-Unternehmen logo
1 von 74
Big Data, Almacenes de Datos Empresariales
(EDW) y Windows Azure (SQL Database)
como Plataforma BI
Jose Redondo
CL SQL PASS Venezuela | DPA SolidQ
jredondo@solidq.com | redondoj@gmail.com
@redondoj
Expositor
 Jose Redondo
 Chapter Leader SQL PASS Venezuela – Caracas
Chapter
 DPA SolidQ
 MCP – MCTS – MS SQL Server; MTA – DAF
 SQL Server MVP
AGENDA









El Ecosistema Hadoop
Servicio & Servidores HDInsight
Big Data en la nube
MapReduce (JavaScript & .NET)
Hive = Nutshell
Big Data & BI
Parallel Data Warehouse
PolyBase
EL ECOSISTEMA HADOOP
El Ecosistema Hadoop
Características del Big Data: 3 Vertientes
Variedad

Velocidad

Volumen
El Ecosistema Hadoop

Como entender las 3 vertientes (“V”)?
El Ecosistema Hadoop
El Ecosistema Hadoop
2002:

Motor de búsqueda de código abierto Apache Nutch es creado por Doug
Cutting

2003:

Google publica sus paginas en GFS (Google Distributed File System)

2004:

Nutch Distributed Files System (NDFS) es desarrollado

2004:

Google publica un documento sobre MapReduce

2005:

MapReduce es implementado en NDFS

2006:

Doug Cutting se une a Yahoo! e inician el Subproyecto Apache Hadoop

2008:

Hadoop fue generado bajo un Alto Nivel de Estatus en Proyecto Apache
…

Los índice de búsqueda en Yahoo! se ejecutan en 10.000 nodos en cluster

…

Hadoop rompe el record de ordenamiento de 1TB: 209s en 910 nodos

…

El diario norteamericano New York Times convierte 4TB de archivos en
PDF‟s en 24H en 100 nodos

En la actualidad: Hadoop se ha convertido en sinónimo para el Procesamiento del Big Data
El Ecosistema Hadoop
Task tracker

Task tracker

MapReduce
Layer

Job tracker

Name node
HDFS Layer

Data node

Data node
El Ecosistema Hadoop
Comparativo entre RDBMS & Hadoop
RDBMS Tradicionales

MapReduce

Volumen de datos

Terabytes

Petabytes - Exabytes

Accesos

Interactivo & Por lotes

Por lotes

Actualizaciones

Lectura / Escritura siempre

Escritura una vez
Escritura siempre

Estructuras

Esquema Estático

Esquema Dinámico

Integridad

Alta (ACID)

Baja (BASE*)

Escalabilidad

No linear

Linear

DBA Ratio

1:40

1:3000

Base * = Basically Available. Soft state. Eventual consistency
El Ecosistema Hadoop
Hadoop simplificado
Reportes BI

RBDMS

Pig (Flujo de datos)
Zookeeper

Herramientas ETL

Hive (SQL)

Sqoop

MapReduce (Job Scheduling / Execution System)

HDFS
(Hadoop Distributed File System)
El Ecosistema Hadoop
Una muestra gratis…
HCatalog

Mahout

R

Cascad
-ing

Pig

Flume

Sqoop

Avro

Ambari

Hive

Zookeeper

HBase / Cassandra /
Couch / MongoDB

Oozle

HBase (Column DB)

Hadoop = MapReduce + HDFS

Hortonworks

HStreaming

Karmasphere

Splunk

Partners

...
Cloudera

Hadapt

MapR

Datameer
El Ecosistema Hadoop
Pero hay mas: Mahout es una maquina de aprendizaje
 Librería de Conocimiento escalable que se soporta
en la infraestructura Hadoop
 Casos de uso:
 Minería de datos
 Clustering
 Clasificación

 Algoritmos:
K-means Clustering, Naïve Bayes,
Decision Tree, Neural network,
Hierarchical Clustering,
Positive Matrix Factorization entre otros…
El Ecosistema Hadoop
R para sistemas estadísticos
 Entorno computacional
estadístico abierto y escalable
 Basado en el Lenguaje S
 Usado por “Especialistas de
datos” para explorar y analizar
datos y generar entornos
gráficos (Reportes por ejemplo)
 Un buen lenguaje de
programación desarrollado
 En la actualidad hay muchos
“Paquetes” disponible que
soportan „R‟
El Ecosistema Hadoop

Pregunto:
… Esto no es EMPRESARIAL, cierto…
Realmente no…
SERVICIO & SERVIDORES
HDINSIGHT
Servicio & Servidores HDInsight
Big Data en las empresas deberían…
Tener lugar en la infraestructura IT actual

Fácil de administrar

Confiabilidad en el conjunto de habilidades
existente

Costos manejables
Servicio & Servidores HDInsight
Porqué Apache Hadoop en Plataforma Windows?
•

Según IDC, Windows Server cubrió la cuota de mercado del 78% en 2012
• Hadoop fue construido tradicionalmente para servidores Linux por lo
que hay un gran número de organizaciones marginadas

•

De acuerdo con el estudio de Barclays CIO en 2012, Big Data supera en
escenarios de virtualización como el # 1 en tendencia a conducir iniciativas
de gasto
• El crecimiento de datos no estructurados es superior al 80% año/año
en las grandes empresas

•

Apache Hadoop es la plataforma de datos de Big Data para el
procesamiento de grandes cantidades de datos no estructurados
• Como complemento de las tecnologías Microsoft existentes
• Hay una gran comunidad sin explotar de los desarrolladores de
Windows y socios del ecosistema

•

Una fuerte alianza Microsoft-Hortonworks y 18 meses de desarrollo hacen
de este un paso natural
Servicio & Servidores HDInsight
Distribución Empresarial de Hadoop
OS

Cloud

VM

Appliance

Hortonworks Data Platform
(HDP)
________________________
• Hadoop diseñado para las
Empresas
• La “Completa realidad”:
Distribución Open Source
• Ecosistema diseñado para
la interoperabilidad
Servicio & Servidores HDInsight
HDInsight
 Big Data @Microsoft
 Microsoft HDInsight Server on Windows
Server
 Windows Azure HDInsight Service (Cloud)

 Escenarios Empresariales Hadoop
 Sencillez y Administrabilidad con Integración
Windows AD
 Monitoreo (System Center)
 Integrado con Microsoft Business Intelligence,
JavaScript, HiveODBC, .NET
 …
 Puesta en marcha en minutos con HDInsight
Services

Hadoop optimizado para
Windows
________________________
Servicio & Servidores HDInsight
Microsoft Big Data Solution
BIG DATA EN LA NUBE
Big Data en la nube
Windows Azure: Big Data Flexible…
Big Data en la nube
Windows Azure HDInsight Service
Big Data en la nube

Hadoop en Azure
Big Data en la nube
Utilizando el almacenamiento Blob de HDInsight
•
•
•

El cluster HDInsight está enlazado a una cuenta de almacenamiento blob
"predeterminada" y los contenedores en clúster al mismo tiempo
Mediante el contenedor "por defecto" no exige afrontar acceso especial ("/"
== carpeta raíz, etc)
Acceso a cuentas de almacenamiento blob adicionales o contenedores:
asv[s]://<container>@<account>.blob.core.windows.net/<path>

•

Cuentas de almacenamiento deben ser registrados en site-config.xml:
<property>
<name>fs.azure.account.key.accountname</name>
<value>enterthekeyvaluehere</value>
</property>
Big Data en la nube
Transportando datos con AzCopy
• Utilidad para mover datos desde / hasta Azure Blob Storage (Ej.:
Robocopy)
• 50MB/s de ratio de transferencia en Centro de Datos
Línea de Comando:
AzCopy c:blobs https://<account>.blob.core.windows.net/mycontainer/ /destkey: <key> /S

Sistema de Archivos:
C:blobsa.txt
C:blobsb.txt
C:blobsdir1c.txt
C:blobsdir1dir2d.txt

Almacenamiento Blob:
Contenedor

Nombre Blob

mycontainer

a.txt

mycontainer

b.txt

mycontanier

dir1c.txt

mycontainer

dir1dir2d.txt
Big Data en la nube

Introducción a HDInsight
Big Data en la nube
Map/Reduce
Big Data en la nube
Map/Reduce con combinaciones
MAPREDUCE
(JAVASCRIPT & .NET)
MapReduce (JavaScript & .NET)
Refinando código…
MapReduce (JavaScript & .NET)

Buen código para manipular grandes
volúmenes de datos
MapReduce (JavaScript & .NET)
Mapeando en C# (Clásico)
MapReduce (JavaScript & .NET)
Reducido en C# (Clásico)
MapReduce (JavaScript & .NET)

Map Reduce con C#
MapReduce (JavaScript & .NET)
.NET Job Submission Framework (Map)
MapReduce (JavaScript & .NET)
.NET Job Submission Framework (Reduce)
HIVE = NUTSHELL
Hive = Nutshell

?
 Hadoop es fantástico para el almacenamiento y
procesamiento de grandes cantidades de datos
 (pero) Los Jobs en Map/Reduce son objetos de bajo
nivel
 (mas) Las herramientas BI confian en los origenes de
datos relacionales y multidimensionales y en
lenguajes declarativos como SQL – MDX - DAX
Hive = Nutshell
El Proyecto Hive
 Hive fue iniciado por Facebook (2008)
 Objetivos:
 Incrementar a los usuarios empresariales a las consultas en
clústeres Hadoop con herramientas estándar & SQL

 Genero el famoso documento VLDB en la conferencia
del 2009
 En 2009 alrededor de 700TB se ejecutaban con Hive en
Facebook, llegando a generar 5000 quieres por día
sobre un escenario de 100 usuarios
Hive es una Bodega de Datos para Hadoop!!!
(un Sistema para administrar datos estructurados al ser construido sobre Hadoop)
Hive = Nutshell
Arquitectura Hive
 Lenguaje de consulta: HiveQL
 Subconjunto de SQL

 Usa Map/Reduce para ejecutarse
 Reglas basadas en optimización
Interfaz de línea de
comando

Interfaz
web

JDBC

ODBC

Servidores a la
medida
Metastore

Driver (Compila, Optimiza y Ejecuta)
Hive = Nutshell
Conceptos Hive
 Lo que conocemos:
 Bases de datos – Tablas – Columnas & Registros
 Tablas = Archivo & Directorio
 Almacenamiento = ORC (Registro columnar
optimizado), Textfile, RDFile, etc
 Tipos de datos = String, Integer, Boolean, etc…
 Tipos especiales = Arreglos, Geodésicos, UDT, etc…
 Particiones = Subdirectorios
 Índices = Subconjunto de datos
 HiveQL = SELECT – FROM – WHERE entre otros
 Puede ser embebido en un script
Hive = Nutshell
Ejemplo HiveQL
Hive = Nutshell

Trabajando con Hive
BIG DATA & BI
Big Data & BI
El Flujo de Trabajo del Big Data
Big Data & BI
HDInsight en acción: Administrando Big Data
Big Data & BI
Enriqueciendo Big Data en PowerPivot
Big Data & BI
El Poder del Big Data con PowerView = Insights
Big Data & BI

BI en HDInsight
Big Data & BI
El mundo real del Big Data



Yahoo! = 180 PB > 40000 server (Poliestructurados)
Gran cluster Hadoop: 4500 nodos
 (2x4 CPUs, 4x1 TB Discos, 16 GB RAM)



Impresiones aplicables:
 DBs Multidimensional (Cubo OLAP): 207 Medidas - 24 Dimensiones - 247 Atributos
 Clientes: MS & Tableau: < 6s ad hoc en tiempos de consultas
Big Data & BI
Ejemplos de la vida real (Sensor Data Analytics)
PARALLEL DATA WAREHOUSE
Parallel Data Warehouse
Conceptos
Parallel Data Warehouse
Parallel Data Warehouse
Objetivos desarrollados
10x
Perf

¼ Rack
por 6PB

½ el
Costo

Arquitectura de Hardware
Host 1

 2 – 56 nodos computables
 Nodos estandarizados únicos en
256GB

 Computar & Nodos de
Almacenamiento son VMs
 Administración simple
 Abstracción de hardware
 Cargas de trabaja diferentes

 Almacenamiento Columnar
duplicado

Host 2
Host 3
JBOD
Host 4

SQL Server 2012 PDW
 Up- & downscale

 Alta compresión
 Actualizable para cargas
incrementales
Parallel Data Warehouse
Escalabilidad dinámica
Parallel Data Warehouse
xVelocity ColumnStore como almacenamiento primario

Mejor IO & Cacheo

Optimización de la memoria

Modo Lote

•

•
•

•
•

•
•

Almacenamiento columnar
independiente
Fácil eliminación de segmentos
Lectura de fácil ejecución

•

Nuevo Memory Broker
Segmentos son cargados
cuando se necesitan
…y permanecer el mayor tiempo
posible

•

Máximo Paralelismo
Capacidad de 1000 valores por
Kernel
Tiempo de CPU es reducido por
ratio de 7 a 40
Parallel Data Warehouse

In Memory ColumnStore Index
Parallel Data Warehouse
Ratio de comprensión de ejemplo
Parallel Data Warehouse
ColumnStore: La Próxima Generación
• ColumnStore se transforma en una
estructura de datos primario (Clustered
Index)
• No necesita una tabla base
• Permite actualizaciones y eliminaciones
(Almacenamiento temporal de registros)
• Fácil Administración de Datos
• Mejoras:
• Soporta (los razonable) todos los
tipos de datos
• Soporta mas operaciones de
consultas
• Estadísticas en tablas particionadas
Parallel Data Warehouse
Microsoft BI Stack Connectivity
Parallel Data Warehouse
Monitoreando escenarios

• Interfaz de usuario o Vistas administradas
(DMVs)
• System Center Management Packs para
PDW
Parallel Data Warehouse
Mejoras con T-SQL
• T-SQL incorpora el
incremento de la
compatibilidad:
• SQL Server Data Tools
• Microsoft BI Tools
• Herramientas de
terceros como Tableau
POLYBASE
PolyBase
Integración Hadoop – Big Data: Microsoft PolyBase



El motor de consulta T-SQL para RDBMSN&
Hadoop
Optimizador basado en costos de recursos.
Decide acción en:





Moviendo datos HDFS dentro del almacén RDBMS
Operaciones traducidas en Map/Reduce – Jobs

Conexión entre HDFS para transportar datos
paralelizados
PolyBase
Integración Hadoop

Tablas Externas
____________________________
• Las tablas externas son
mapeadas como archivos HDFS
• Los campos en el archivo son
definidos como columnas en la
tabla externa de PDW
• Las características del archivo
son también provistas durante la
definición
• Este escenario se ejecuta para
HDInsight, Hortonworks HDP &
Cloudera
PolyBase
Creando una tabla externa
Herramientas familiares:
• SSMS
• SQL Server Data Tools
PolyBase
Es realmente sencillo ejecutar queries
•
•
•

Aquí: El movimiento de la data
externa es
ExternalRoundRobinMove
Las lecturas de los encabezados
HDFS serán ejecutadas en cada
nodo de datos
(Por ejemplo: 10 nodos a 8 threads)
PolyBase
BI & Una Solución Big Data con SQL Server PDW v2
PolyBase
Breakthrough en el Procesamiento de Datos
Preguntas & Respuestas
Big Data, Almacenes de Datos Empresariales
(EDW) y Windows Azure (SQL Database)
como Plataforma BI
Jose Redondo – SQL Server MVP
Correos: redondoj@gmail.com
jredondo@solidq.com
Twitter: @redondoj
Blog:
redondoj.wordpress.com

Weitere ähnliche Inhalte

Was ist angesagt?

Bases de Datos Analiticas-Columnares
Bases de Datos Analiticas-ColumnaresBases de Datos Analiticas-Columnares
Bases de Datos Analiticas-ColumnaresStratebi
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014Enrique Puig
 
Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Ruben Pertusa Lopez
 
Introduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesIntroduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesEduardo Castro
 
Business Intelligence en Azure
Business Intelligence en AzureBusiness Intelligence en Azure
Business Intelligence en AzureiT Synergy
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudRaul Martin Sarachaga Diaz
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008Will Flores Soto
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
13 14 keynote dando sentido al internet de las cosas, infobright
13 14 keynote dando sentido al internet de las cosas, infobright13 14 keynote dando sentido al internet de las cosas, infobright
13 14 keynote dando sentido al internet de las cosas, infobrightSoftware Guru
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Joseph Lopez
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIsBig Data Spain
 
SQL 2016 Column Store Index
SQL 2016 Column Store IndexSQL 2016 Column Store Index
SQL 2016 Column Store IndexEduardo Castro
 

Was ist angesagt? (19)

Bases de Datos Analiticas-Columnares
Bases de Datos Analiticas-ColumnaresBases de Datos Analiticas-Columnares
Bases de Datos Analiticas-Columnares
 
Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014
Novedades en el manejo de Grandes volúmenes de datos con SQL Server 2014
 
Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014
 
Introduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesIntroduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch Databases
 
Hadoop
HadoopHadoop
Hadoop
 
Business Intelligence en Azure
Business Intelligence en AzureBusiness Intelligence en Azure
Business Intelligence en Azure
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the Cloud
 
SQL Azure Datawarehouse
SQL Azure DatawarehouseSQL Azure Datawarehouse
SQL Azure Datawarehouse
 
Explorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data FactoryExplorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data Factory
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
13 14 keynote dando sentido al internet de las cosas, infobright
13 14 keynote dando sentido al internet de las cosas, infobright13 14 keynote dando sentido al internet de las cosas, infobright
13 14 keynote dando sentido al internet de las cosas, infobright
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
SQL 2016 Column Store Index
SQL 2016 Column Store IndexSQL 2016 Column Store Index
SQL 2016 Column Store Index
 

Andere mochten auch

Generando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big DataGenerando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big DataJoseph Lopez
 
Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?Joseph Lopez
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Joseph Lopez
 
G te c sesion3b- mapreduce
G te c sesion3b- mapreduceG te c sesion3b- mapreduce
G te c sesion3b- mapreduceVictoria López
 
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPMONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPJorge E. López de Vergara Méndez
 
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION II
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION IITECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION II
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION IIChristian Garcia Gamio
 
BI y Data Warehouse - Conociendo orígenes
BI y Data Warehouse - Conociendo orígenesBI y Data Warehouse - Conociendo orígenes
BI y Data Warehouse - Conociendo orígenesJoseph Lopez
 
Programación orientada a objetos
Programación orientada a objetosProgramación orientada a objetos
Programación orientada a objetosNanda Moran
 
Comparacion Entre Rmi Y Api De Sockets
Comparacion Entre Rmi Y Api De SocketsComparacion Entre Rmi Y Api De Sockets
Comparacion Entre Rmi Y Api De Socketsmallita
 
Log -Analytics with Apache-Flume Elasticsearch HDFS Kibana
Log -Analytics with Apache-Flume  Elasticsearch HDFS KibanaLog -Analytics with Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics with Apache-Flume Elasticsearch HDFS KibanaFelix Rodriguez
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementaciónDiego Krauthamer
 
Configuración y casos de uso para AlwaysON availability groups readable secon...
Configuración y casos de uso para AlwaysON availability groups readable secon...Configuración y casos de uso para AlwaysON availability groups readable secon...
Configuración y casos de uso para AlwaysON availability groups readable secon...SpanishPASSVC
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopRestorando
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopDavid Albela Pérez
 
Polybase
PolybasePolybase
PolybaseSolidQ
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datosAntonio Rodriguez
 

Andere mochten auch (20)

Generando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big DataGenerando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big Data
 
Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
 
G te c sesion3b- mapreduce
G te c sesion3b- mapreduceG te c sesion3b- mapreduce
G te c sesion3b- mapreduce
 
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPMONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
 
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION II
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION IITECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION II
TECNOLOGIA DETRAS DE LAS REDES SOCIALES(FACEBOOK) - LENGUAJE DE PROGRAMACION II
 
BI y Data Warehouse - Conociendo orígenes
BI y Data Warehouse - Conociendo orígenesBI y Data Warehouse - Conociendo orígenes
BI y Data Warehouse - Conociendo orígenes
 
Programación orientada a objetos
Programación orientada a objetosProgramación orientada a objetos
Programación orientada a objetos
 
Comparacion Entre Rmi Y Api De Sockets
Comparacion Entre Rmi Y Api De SocketsComparacion Entre Rmi Y Api De Sockets
Comparacion Entre Rmi Y Api De Sockets
 
Log -Analytics with Apache-Flume Elasticsearch HDFS Kibana
Log -Analytics with Apache-Flume  Elasticsearch HDFS KibanaLog -Analytics with Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics with Apache-Flume Elasticsearch HDFS Kibana
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementación
 
Configuración y casos de uso para AlwaysON availability groups readable secon...
Configuración y casos de uso para AlwaysON availability groups readable secon...Configuración y casos de uso para AlwaysON availability groups readable secon...
Configuración y casos de uso para AlwaysON availability groups readable secon...
 
Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1
 
Hadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadasHadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadas
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshop
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
 
Polybase
PolybasePolybase
Polybase
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datos
 

Ähnlich wie Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Database) como Plataforma BI

CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosJohn Bulla
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ
 
Análisis de datos con HD Insight
Análisis de datos con HD InsightAnálisis de datos con HD Insight
Análisis de datos con HD InsightEduardo Castro
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Miguel Pastor
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL ServerEduardo Castro
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataSmash Tech
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVABEEVA_es
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataSpanishPASSVC
 
Motores de bases de datos open source
Motores de bases de datos open sourceMotores de bases de datos open source
Motores de bases de datos open sourceeduardojose55
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datosBBVA API Market
 
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0Jeremi Sixto Perales
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
Sfd 2013 pentaho
Sfd 2013 pentahoSfd 2013 pentaho
Sfd 2013 pentahoFinger Cash
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) Luis Fernando Aguas Bucheli
 

Ähnlich wie Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Database) como Plataforma BI (20)

CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datos
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datos
 
Análisis de datos con HD Insight
Análisis de datos con HD InsightAnálisis de datos con HD Insight
Análisis de datos con HD Insight
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open Data
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVA
 
Introducción a hadoop
Introducción a hadoopIntroducción a hadoop
Introducción a hadoop
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
Big Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open SourceBig Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open Source
 
Motores de bases de datos open source
Motores de bases de datos open sourceMotores de bases de datos open source
Motores de bases de datos open source
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datos
 
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
Sfd 2013 pentaho
Sfd 2013 pentahoSfd 2013 pentaho
Sfd 2013 pentaho
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
 
Big Data
Big DataBig Data
Big Data
 

Mehr von Joseph Lopez

Entorno de datos Microsoft Cloud
Entorno de datos Microsoft CloudEntorno de datos Microsoft Cloud
Entorno de datos Microsoft CloudJoseph Lopez
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data EnvironmentJoseph Lopez
 
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineAplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineJoseph Lopez
 
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...Joseph Lopez
 
Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016Joseph Lopez
 
Aplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas HibridosAplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas HibridosJoseph Lopez
 
Performance Tuning en Azure SQL Database
Performance Tuning en Azure SQL DatabasePerformance Tuning en Azure SQL Database
Performance Tuning en Azure SQL DatabaseJoseph Lopez
 
Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12Joseph Lopez
 
DBA para SharePoint
DBA para SharePointDBA para SharePoint
DBA para SharePointJoseph Lopez
 
In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016Joseph Lopez
 
Introduccion a Power BI
Introduccion a Power BIIntroduccion a Power BI
Introduccion a Power BIJoseph Lopez
 
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...Joseph Lopez
 
Configurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business IntelligenceConfigurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business IntelligenceJoseph Lopez
 
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014Joseph Lopez
 
MS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTPMS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTPJoseph Lopez
 
SQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosSQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosJoseph Lopez
 
MS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresMS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresJoseph Lopez
 
Diseño de aplicaciones de bases de datos SQL Azure
Diseño de aplicaciones de bases de datos SQL AzureDiseño de aplicaciones de bases de datos SQL Azure
Diseño de aplicaciones de bases de datos SQL AzureJoseph Lopez
 

Mehr von Joseph Lopez (18)

Entorno de datos Microsoft Cloud
Entorno de datos Microsoft CloudEntorno de datos Microsoft Cloud
Entorno de datos Microsoft Cloud
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data Environment
 
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineAplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
 
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
 
Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016
 
Aplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas HibridosAplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas Hibridos
 
Performance Tuning en Azure SQL Database
Performance Tuning en Azure SQL DatabasePerformance Tuning en Azure SQL Database
Performance Tuning en Azure SQL Database
 
Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12
 
DBA para SharePoint
DBA para SharePointDBA para SharePoint
DBA para SharePoint
 
In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016
 
Introduccion a Power BI
Introduccion a Power BIIntroduccion a Power BI
Introduccion a Power BI
 
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
 
Configurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business IntelligenceConfigurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business Intelligence
 
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
 
MS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTPMS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTP
 
SQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosSQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de Datos
 
MS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresMS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladores
 
Diseño de aplicaciones de bases de datos SQL Azure
Diseño de aplicaciones de bases de datos SQL AzureDiseño de aplicaciones de bases de datos SQL Azure
Diseño de aplicaciones de bases de datos SQL Azure
 

Kürzlich hochgeladen

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilJuanGallardo438714
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxlosdiosesmanzaneros
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Kürzlich hochgeladen (15)

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Database) como Plataforma BI

  • 1. Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Database) como Plataforma BI Jose Redondo CL SQL PASS Venezuela | DPA SolidQ jredondo@solidq.com | redondoj@gmail.com @redondoj
  • 2. Expositor  Jose Redondo  Chapter Leader SQL PASS Venezuela – Caracas Chapter  DPA SolidQ  MCP – MCTS – MS SQL Server; MTA – DAF  SQL Server MVP
  • 3. AGENDA         El Ecosistema Hadoop Servicio & Servidores HDInsight Big Data en la nube MapReduce (JavaScript & .NET) Hive = Nutshell Big Data & BI Parallel Data Warehouse PolyBase
  • 5. El Ecosistema Hadoop Características del Big Data: 3 Vertientes Variedad Velocidad Volumen
  • 6. El Ecosistema Hadoop Como entender las 3 vertientes (“V”)?
  • 8. El Ecosistema Hadoop 2002: Motor de búsqueda de código abierto Apache Nutch es creado por Doug Cutting 2003: Google publica sus paginas en GFS (Google Distributed File System) 2004: Nutch Distributed Files System (NDFS) es desarrollado 2004: Google publica un documento sobre MapReduce 2005: MapReduce es implementado en NDFS 2006: Doug Cutting se une a Yahoo! e inician el Subproyecto Apache Hadoop 2008: Hadoop fue generado bajo un Alto Nivel de Estatus en Proyecto Apache … Los índice de búsqueda en Yahoo! se ejecutan en 10.000 nodos en cluster … Hadoop rompe el record de ordenamiento de 1TB: 209s en 910 nodos … El diario norteamericano New York Times convierte 4TB de archivos en PDF‟s en 24H en 100 nodos En la actualidad: Hadoop se ha convertido en sinónimo para el Procesamiento del Big Data
  • 9. El Ecosistema Hadoop Task tracker Task tracker MapReduce Layer Job tracker Name node HDFS Layer Data node Data node
  • 10. El Ecosistema Hadoop Comparativo entre RDBMS & Hadoop RDBMS Tradicionales MapReduce Volumen de datos Terabytes Petabytes - Exabytes Accesos Interactivo & Por lotes Por lotes Actualizaciones Lectura / Escritura siempre Escritura una vez Escritura siempre Estructuras Esquema Estático Esquema Dinámico Integridad Alta (ACID) Baja (BASE*) Escalabilidad No linear Linear DBA Ratio 1:40 1:3000 Base * = Basically Available. Soft state. Eventual consistency
  • 11. El Ecosistema Hadoop Hadoop simplificado Reportes BI RBDMS Pig (Flujo de datos) Zookeeper Herramientas ETL Hive (SQL) Sqoop MapReduce (Job Scheduling / Execution System) HDFS (Hadoop Distributed File System)
  • 12. El Ecosistema Hadoop Una muestra gratis… HCatalog Mahout R Cascad -ing Pig Flume Sqoop Avro Ambari Hive Zookeeper HBase / Cassandra / Couch / MongoDB Oozle HBase (Column DB) Hadoop = MapReduce + HDFS Hortonworks HStreaming Karmasphere Splunk Partners ... Cloudera Hadapt MapR Datameer
  • 13. El Ecosistema Hadoop Pero hay mas: Mahout es una maquina de aprendizaje  Librería de Conocimiento escalable que se soporta en la infraestructura Hadoop  Casos de uso:  Minería de datos  Clustering  Clasificación  Algoritmos: K-means Clustering, Naïve Bayes, Decision Tree, Neural network, Hierarchical Clustering, Positive Matrix Factorization entre otros…
  • 14. El Ecosistema Hadoop R para sistemas estadísticos  Entorno computacional estadístico abierto y escalable  Basado en el Lenguaje S  Usado por “Especialistas de datos” para explorar y analizar datos y generar entornos gráficos (Reportes por ejemplo)  Un buen lenguaje de programación desarrollado  En la actualidad hay muchos “Paquetes” disponible que soportan „R‟
  • 15. El Ecosistema Hadoop Pregunto: … Esto no es EMPRESARIAL, cierto… Realmente no…
  • 17. Servicio & Servidores HDInsight Big Data en las empresas deberían… Tener lugar en la infraestructura IT actual Fácil de administrar Confiabilidad en el conjunto de habilidades existente Costos manejables
  • 18. Servicio & Servidores HDInsight Porqué Apache Hadoop en Plataforma Windows? • Según IDC, Windows Server cubrió la cuota de mercado del 78% en 2012 • Hadoop fue construido tradicionalmente para servidores Linux por lo que hay un gran número de organizaciones marginadas • De acuerdo con el estudio de Barclays CIO en 2012, Big Data supera en escenarios de virtualización como el # 1 en tendencia a conducir iniciativas de gasto • El crecimiento de datos no estructurados es superior al 80% año/año en las grandes empresas • Apache Hadoop es la plataforma de datos de Big Data para el procesamiento de grandes cantidades de datos no estructurados • Como complemento de las tecnologías Microsoft existentes • Hay una gran comunidad sin explotar de los desarrolladores de Windows y socios del ecosistema • Una fuerte alianza Microsoft-Hortonworks y 18 meses de desarrollo hacen de este un paso natural
  • 19. Servicio & Servidores HDInsight Distribución Empresarial de Hadoop OS Cloud VM Appliance Hortonworks Data Platform (HDP) ________________________ • Hadoop diseñado para las Empresas • La “Completa realidad”: Distribución Open Source • Ecosistema diseñado para la interoperabilidad
  • 20. Servicio & Servidores HDInsight HDInsight  Big Data @Microsoft  Microsoft HDInsight Server on Windows Server  Windows Azure HDInsight Service (Cloud)  Escenarios Empresariales Hadoop  Sencillez y Administrabilidad con Integración Windows AD  Monitoreo (System Center)  Integrado con Microsoft Business Intelligence, JavaScript, HiveODBC, .NET  …  Puesta en marcha en minutos con HDInsight Services Hadoop optimizado para Windows ________________________
  • 21. Servicio & Servidores HDInsight Microsoft Big Data Solution
  • 22. BIG DATA EN LA NUBE
  • 23. Big Data en la nube Windows Azure: Big Data Flexible…
  • 24. Big Data en la nube Windows Azure HDInsight Service
  • 25. Big Data en la nube Hadoop en Azure
  • 26. Big Data en la nube Utilizando el almacenamiento Blob de HDInsight • • • El cluster HDInsight está enlazado a una cuenta de almacenamiento blob "predeterminada" y los contenedores en clúster al mismo tiempo Mediante el contenedor "por defecto" no exige afrontar acceso especial ("/" == carpeta raíz, etc) Acceso a cuentas de almacenamiento blob adicionales o contenedores: asv[s]://<container>@<account>.blob.core.windows.net/<path> • Cuentas de almacenamiento deben ser registrados en site-config.xml: <property> <name>fs.azure.account.key.accountname</name> <value>enterthekeyvaluehere</value> </property>
  • 27. Big Data en la nube Transportando datos con AzCopy • Utilidad para mover datos desde / hasta Azure Blob Storage (Ej.: Robocopy) • 50MB/s de ratio de transferencia en Centro de Datos Línea de Comando: AzCopy c:blobs https://<account>.blob.core.windows.net/mycontainer/ /destkey: <key> /S Sistema de Archivos: C:blobsa.txt C:blobsb.txt C:blobsdir1c.txt C:blobsdir1dir2d.txt Almacenamiento Blob: Contenedor Nombre Blob mycontainer a.txt mycontainer b.txt mycontanier dir1c.txt mycontainer dir1dir2d.txt
  • 28. Big Data en la nube Introducción a HDInsight
  • 29. Big Data en la nube Map/Reduce
  • 30. Big Data en la nube Map/Reduce con combinaciones
  • 32. MapReduce (JavaScript & .NET) Refinando código…
  • 33. MapReduce (JavaScript & .NET) Buen código para manipular grandes volúmenes de datos
  • 34. MapReduce (JavaScript & .NET) Mapeando en C# (Clásico)
  • 35. MapReduce (JavaScript & .NET) Reducido en C# (Clásico)
  • 36. MapReduce (JavaScript & .NET) Map Reduce con C#
  • 37. MapReduce (JavaScript & .NET) .NET Job Submission Framework (Map)
  • 38. MapReduce (JavaScript & .NET) .NET Job Submission Framework (Reduce)
  • 40. Hive = Nutshell ?  Hadoop es fantástico para el almacenamiento y procesamiento de grandes cantidades de datos  (pero) Los Jobs en Map/Reduce son objetos de bajo nivel  (mas) Las herramientas BI confian en los origenes de datos relacionales y multidimensionales y en lenguajes declarativos como SQL – MDX - DAX
  • 41. Hive = Nutshell El Proyecto Hive  Hive fue iniciado por Facebook (2008)  Objetivos:  Incrementar a los usuarios empresariales a las consultas en clústeres Hadoop con herramientas estándar & SQL  Genero el famoso documento VLDB en la conferencia del 2009  En 2009 alrededor de 700TB se ejecutaban con Hive en Facebook, llegando a generar 5000 quieres por día sobre un escenario de 100 usuarios Hive es una Bodega de Datos para Hadoop!!! (un Sistema para administrar datos estructurados al ser construido sobre Hadoop)
  • 42. Hive = Nutshell Arquitectura Hive  Lenguaje de consulta: HiveQL  Subconjunto de SQL  Usa Map/Reduce para ejecutarse  Reglas basadas en optimización Interfaz de línea de comando Interfaz web JDBC ODBC Servidores a la medida Metastore Driver (Compila, Optimiza y Ejecuta)
  • 43. Hive = Nutshell Conceptos Hive  Lo que conocemos:  Bases de datos – Tablas – Columnas & Registros  Tablas = Archivo & Directorio  Almacenamiento = ORC (Registro columnar optimizado), Textfile, RDFile, etc  Tipos de datos = String, Integer, Boolean, etc…  Tipos especiales = Arreglos, Geodésicos, UDT, etc…  Particiones = Subdirectorios  Índices = Subconjunto de datos  HiveQL = SELECT – FROM – WHERE entre otros  Puede ser embebido en un script
  • 47. Big Data & BI El Flujo de Trabajo del Big Data
  • 48. Big Data & BI HDInsight en acción: Administrando Big Data
  • 49. Big Data & BI Enriqueciendo Big Data en PowerPivot
  • 50. Big Data & BI El Poder del Big Data con PowerView = Insights
  • 51. Big Data & BI BI en HDInsight
  • 52. Big Data & BI El mundo real del Big Data   Yahoo! = 180 PB > 40000 server (Poliestructurados) Gran cluster Hadoop: 4500 nodos  (2x4 CPUs, 4x1 TB Discos, 16 GB RAM)  Impresiones aplicables:  DBs Multidimensional (Cubo OLAP): 207 Medidas - 24 Dimensiones - 247 Atributos  Clientes: MS & Tableau: < 6s ad hoc en tiempos de consultas
  • 53. Big Data & BI Ejemplos de la vida real (Sensor Data Analytics)
  • 57. Parallel Data Warehouse Objetivos desarrollados 10x Perf ¼ Rack por 6PB ½ el Costo Arquitectura de Hardware Host 1  2 – 56 nodos computables  Nodos estandarizados únicos en 256GB  Computar & Nodos de Almacenamiento son VMs  Administración simple  Abstracción de hardware  Cargas de trabaja diferentes  Almacenamiento Columnar duplicado Host 2 Host 3 JBOD Host 4 SQL Server 2012 PDW  Up- & downscale  Alta compresión  Actualizable para cargas incrementales
  • 59. Parallel Data Warehouse xVelocity ColumnStore como almacenamiento primario Mejor IO & Cacheo Optimización de la memoria Modo Lote • • • • • • • Almacenamiento columnar independiente Fácil eliminación de segmentos Lectura de fácil ejecución • Nuevo Memory Broker Segmentos son cargados cuando se necesitan …y permanecer el mayor tiempo posible • Máximo Paralelismo Capacidad de 1000 valores por Kernel Tiempo de CPU es reducido por ratio de 7 a 40
  • 60. Parallel Data Warehouse In Memory ColumnStore Index
  • 61. Parallel Data Warehouse Ratio de comprensión de ejemplo
  • 62. Parallel Data Warehouse ColumnStore: La Próxima Generación • ColumnStore se transforma en una estructura de datos primario (Clustered Index) • No necesita una tabla base • Permite actualizaciones y eliminaciones (Almacenamiento temporal de registros) • Fácil Administración de Datos • Mejoras: • Soporta (los razonable) todos los tipos de datos • Soporta mas operaciones de consultas • Estadísticas en tablas particionadas
  • 63. Parallel Data Warehouse Microsoft BI Stack Connectivity
  • 64. Parallel Data Warehouse Monitoreando escenarios • Interfaz de usuario o Vistas administradas (DMVs) • System Center Management Packs para PDW
  • 65. Parallel Data Warehouse Mejoras con T-SQL • T-SQL incorpora el incremento de la compatibilidad: • SQL Server Data Tools • Microsoft BI Tools • Herramientas de terceros como Tableau
  • 67. PolyBase Integración Hadoop – Big Data: Microsoft PolyBase   El motor de consulta T-SQL para RDBMSN& Hadoop Optimizador basado en costos de recursos. Decide acción en:    Moviendo datos HDFS dentro del almacén RDBMS Operaciones traducidas en Map/Reduce – Jobs Conexión entre HDFS para transportar datos paralelizados
  • 68. PolyBase Integración Hadoop Tablas Externas ____________________________ • Las tablas externas son mapeadas como archivos HDFS • Los campos en el archivo son definidos como columnas en la tabla externa de PDW • Las características del archivo son también provistas durante la definición • Este escenario se ejecuta para HDInsight, Hortonworks HDP & Cloudera
  • 69. PolyBase Creando una tabla externa Herramientas familiares: • SSMS • SQL Server Data Tools
  • 70. PolyBase Es realmente sencillo ejecutar queries • • • Aquí: El movimiento de la data externa es ExternalRoundRobinMove Las lecturas de los encabezados HDFS serán ejecutadas en cada nodo de datos (Por ejemplo: 10 nodos a 8 threads)
  • 71. PolyBase BI & Una Solución Big Data con SQL Server PDW v2
  • 72. PolyBase Breakthrough en el Procesamiento de Datos
  • 74. Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Database) como Plataforma BI Jose Redondo – SQL Server MVP Correos: redondoj@gmail.com jredondo@solidq.com Twitter: @redondoj Blog: redondoj.wordpress.com