SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Conociendo los servicios adicionales en BigData
26 de Agosto 2015 (12 pm GMT -5)
Freddy Angarita
Resumen:
Todos han empezado a usar y a conocer Hadoop y HDInsight, en
parte los lenguajes usados para su consumo, pero poco se hablado
de los servicios complementarios que pueden enriquecer la
experiencia BigData, conozca estos servicios y su aplicación.
Está por comenzar:
Moderador: Kenneth Ureña
Próximos Eventos
09 de Setiembre
Warner Chaves
SQL Server Rápido y Furioso
02 de Setiembre
Alejandro Cordero
SQL Monitoring
16 de Setiembre
Javier Villegas
SQL como un servicio en la nube
Distributed Storage (HDFS)
Query
(Hive)
Distributed Processing
(MapReduce)
DataIntegration
(ODBC/SQOOP/REST)
EventPipeline
(EventHub/
Flume)
Legend
Red =
Core Hadoop
Blue =
Data processing
Gray= Microsoft
integration
points and
value adds
Orange =
Data Movement
Green =
Packages
HDInsight and Hadoop ecosystem
YARN
Similar a Base de Datos
• HBASE
• Base de datos no relacional
• Escrita en Java
• Usa HDFS como Sistema de archivos
• Escenario más usado: Encontrar pequeños bloques datos en grandes volúmenes de datos
• Ejemplo: Los 20 elementos más costosos entre 5 mil millones de objetos
• Facebook lo usa para su plataforma de mensajería
• HCatalog
• Capa de administración de almacenamiento para Hadoop
• Su idea es tener buscar una representación de datos relacionales en Hadoop
3
Lenguajes
• Pig
• Plataforma para la creación de Jobs Map-Reduce
• Piglatin similar a TSql
• Puede ser extendido usando varios lenguajes, incluyendo Javascript
• Creado por Yahoo luego pasa a la fundación Apache en 2006.
• Hive
• Ayuda a proveer capacidades BI sobre Hadoop
• Lenguaje HiveQL similar a TSql
• Scala
• Nuevo lenguaje para ejecutar instrucciones in-memory
• Usa Spark
4
Conexión
• Polybase
• Permite a los usuarios de SqlServer PDW ejecutar consultas contra datos almacenados en Hadop
• Es possible hacer un JOIN con datos almacenados en HADOOP
• Hive ODBC
• Es un driver ODBC para conectar HADOOP con productos Microsoft
• Excel
• PowerPivot
• SharePoint
• Sqoop
• Enviar y recibir grandes volúmenes de información desde y hacia bases de datos relacionales
• REST – WebHDFS
• Cualquier producto puede conectarse con HADOOP usando el API Rest (Móviles, Web..)
5
Minería de Datos
• Mahout
• Contiene una seria de algoritmos de minería de datos para análisis predictivo y descriptivo sobre
información almacenada en Hadoop
• Rhadoop
• Implementación especial de R
• R
• Es possible instalar R en las máquinas virtuales de HADOOP, como resultado, podemos interactuar
con HADOOP para hacer análisis estadístico avanzado usando R
6
WorkFlow
• Oozie
• Permite la definición y ejecución de Workflows
• Usa MapReduce y Jobs PIG
• Flume
• Colección, agregación y movimiento de grandes volúmenes de datos
• Especializado en el procesamiento de LOGs
7
DEMO
8
Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
10
11
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
Sigan Participando!
• Obtén tu membresía gratuita en sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Conociendo los servicios adicionales en
BigData
26 de Agosto de 2015
Freddy Angarita
Títulos y reconocimientos.
Moderador: Kenneth Ureña
SQL Server Rápido y Furioso
02 de Setiembre (12 pm GMT -5)
Alejandro Cordero
Resúmen:
En esta sesión analizaremos experiencias de la vida real como consultor
en trabajos de mejora de rendimiento. Veremos mejores prácticas para la
configuración de SQL Server, tips para un mejor T-SQL y un ejercicio de
como monitorear mi servidor de base de datos con Performance
Counters, un SQL Server Express y un Excel con Power Pivot.
Próximo Evento

Weitere ähnliche Inhalte

Was ist angesagt?

Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
Antoni Riveros
 

Was ist angesagt? (20)

DocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft AzureDocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft Azure
 
Que es azure sql datawarehouse
Que es azure sql datawarehouseQue es azure sql datawarehouse
Que es azure sql datawarehouse
 
Sgbd aplicaciones web2
Sgbd aplicaciones web2Sgbd aplicaciones web2
Sgbd aplicaciones web2
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
 
Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter,...
 
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
SGBD Y TECNOLOGIAS USADAS POR APLICACIONES WEB 2.0
 
SGBD de Facebook, Twitter, YouTube, Google y Uber
SGBD de Facebook, Twitter, YouTube, Google y UberSGBD de Facebook, Twitter, YouTube, Google y Uber
SGBD de Facebook, Twitter, YouTube, Google y Uber
 
SISTEMA GESTOR DE BASE DE DATOS Y TECNOLOGIAS QUE USAN LAS HERRAMIENTAS WEB 2.0
SISTEMA GESTOR DE BASE DE DATOS Y TECNOLOGIAS QUE USAN LAS HERRAMIENTAS WEB 2.0 SISTEMA GESTOR DE BASE DE DATOS Y TECNOLOGIAS QUE USAN LAS HERRAMIENTAS WEB 2.0
SISTEMA GESTOR DE BASE DE DATOS Y TECNOLOGIAS QUE USAN LAS HERRAMIENTAS WEB 2.0
 
Primeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid MeetupPrimeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid Meetup
 
Inteligencia de Negocios con Microsoft
Inteligencia de Negocios con MicrosoftInteligencia de Negocios con Microsoft
Inteligencia de Negocios con Microsoft
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Procesamiento masivo de datos en MongoDB
Procesamiento masivo de datos en MongoDBProcesamiento masivo de datos en MongoDB
Procesamiento masivo de datos en MongoDB
 
Taller: Limpieza y preparación de datos con Optimus y Apache Spark
Taller: Limpieza y preparación de datos con Optimus y Apache SparkTaller: Limpieza y preparación de datos con Optimus y Apache Spark
Taller: Limpieza y preparación de datos con Optimus y Apache Spark
 
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
 
Innovación Amazon
Innovación AmazonInnovación Amazon
Innovación Amazon
 
Machine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuidoMachine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuido
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL Server
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataIntroducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
 

Andere mochten auch

Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
Lucidworks
 
Info qiy foundation digital me - dappre-eng-aug17
Info qiy foundation   digital me - dappre-eng-aug17Info qiy foundation   digital me - dappre-eng-aug17
Info qiy foundation digital me - dappre-eng-aug17
BigDataExpo
 

Andere mochten auch (20)

Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
Events Processing and Data Analysis with Lucidworks Fusion: Presented by Kira...
 
Big Data Expo 2015 - Trillium software Big Data and the Data Quality
Big Data Expo 2015 - Trillium software Big Data and the Data QualityBig Data Expo 2015 - Trillium software Big Data and the Data Quality
Big Data Expo 2015 - Trillium software Big Data and the Data Quality
 
Bol.com
Bol.comBol.com
Bol.com
 
Challenges and outlook with Big Data
Challenges and outlook with Big Data Challenges and outlook with Big Data
Challenges and outlook with Big Data
 
Cloud Camp: Infrastructure as a service advance workloads
Cloud Camp: Infrastructure as a service advance workloadsCloud Camp: Infrastructure as a service advance workloads
Cloud Camp: Infrastructure as a service advance workloads
 
Microsoft Big Data Expo
Microsoft Big Data ExpoMicrosoft Big Data Expo
Microsoft Big Data Expo
 
Trends at JavaOne 2016: Microservices, Docker and Cloud-Native Middleware
Trends at JavaOne 2016: Microservices, Docker and Cloud-Native MiddlewareTrends at JavaOne 2016: Microservices, Docker and Cloud-Native Middleware
Trends at JavaOne 2016: Microservices, Docker and Cloud-Native Middleware
 
NTT SIC marketplace slide deck at Tokyo Summit
NTT SIC marketplace slide deck at Tokyo SummitNTT SIC marketplace slide deck at Tokyo Summit
NTT SIC marketplace slide deck at Tokyo Summit
 
Info qiy foundation digital me - dappre-eng-aug17
Info qiy foundation   digital me - dappre-eng-aug17Info qiy foundation   digital me - dappre-eng-aug17
Info qiy foundation digital me - dappre-eng-aug17
 
Status Quo on the automation support in SOA Suite OGhTech17
Status Quo on the automation support in SOA Suite OGhTech17Status Quo on the automation support in SOA Suite OGhTech17
Status Quo on the automation support in SOA Suite OGhTech17
 
Becoming the master of disaster... with asr
Becoming the master of disaster... with asrBecoming the master of disaster... with asr
Becoming the master of disaster... with asr
 
BMC Engage 2015: IT Asset Management - An essential pillar for the digital en...
BMC Engage 2015: IT Asset Management - An essential pillar for the digital en...BMC Engage 2015: IT Asset Management - An essential pillar for the digital en...
BMC Engage 2015: IT Asset Management - An essential pillar for the digital en...
 
Chapter 3 Computer Crimes
Chapter 3 Computer  CrimesChapter 3 Computer  Crimes
Chapter 3 Computer Crimes
 
De Persgroep Big Data Expo
De Persgroep Big Data ExpoDe Persgroep Big Data Expo
De Persgroep Big Data Expo
 
Poor mans spy vs spy using open source tools to detect attackers
Poor mans spy vs spy using open source tools to detect attackersPoor mans spy vs spy using open source tools to detect attackers
Poor mans spy vs spy using open source tools to detect attackers
 
Oracle cloud, private, public and hybrid
Oracle cloud, private, public and hybridOracle cloud, private, public and hybrid
Oracle cloud, private, public and hybrid
 
Water resources
Water resourcesWater resources
Water resources
 
Oracle Cloud Café IoT 12-APR-2016
Oracle Cloud Café IoT 12-APR-2016Oracle Cloud Café IoT 12-APR-2016
Oracle Cloud Café IoT 12-APR-2016
 
Big Data Expo 2015 - Data Science Center Eindhove
Big Data Expo 2015 - Data Science Center EindhoveBig Data Expo 2015 - Data Science Center Eindhove
Big Data Expo 2015 - Data Science Center Eindhove
 
Opensource Search Engines
Opensource Search EnginesOpensource Search Engines
Opensource Search Engines
 

Ähnlich wie Conociendo los servicios adicionales en big data

Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datos
Antonio Rodriguez
 

Ähnlich wie Conociendo los servicios adicionales en big data (20)

Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementación
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Big Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open SourceBig Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open Source
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Polybase
PolybasePolybase
Polybase
 
Open analytics. data analytics con hadoop
Open analytics. data analytics con hadoopOpen analytics. data analytics con hadoop
Open analytics. data analytics con hadoop
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con Hadoop
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datos
 
Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datos
 
Análisis de datos con HD Insight
Análisis de datos con HD InsightAnálisis de datos con HD Insight
Análisis de datos con HD Insight
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
 
Introducción a Hadoop
Introducción a HadoopIntroducción a Hadoop
Introducción a Hadoop
 
Herramientas para computación distribuida. De Hadoop a Spark
Herramientas para computación distribuida. De Hadoop a SparkHerramientas para computación distribuida. De Hadoop a Spark
Herramientas para computación distribuida. De Hadoop a Spark
 
01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016
 
Visualización de Big Data con Power View
Visualización de Big Data con Power ViewVisualización de Big Data con Power View
Visualización de Big Data con Power View
 
BigData
BigDataBigData
BigData
 

Mehr von SpanishPASSVC

Mehr von SpanishPASSVC (20)

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nube
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IO
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones Aprendidas
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación Transaccional
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecución
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreo
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizados
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datos
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine Learning
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partes
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatos
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BI
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan Alvarado
 

Kürzlich hochgeladen

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Kürzlich hochgeladen (11)

Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 

Conociendo los servicios adicionales en big data

  • 1. Conociendo los servicios adicionales en BigData 26 de Agosto 2015 (12 pm GMT -5) Freddy Angarita Resumen: Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación. Está por comenzar: Moderador: Kenneth Ureña Próximos Eventos 09 de Setiembre Warner Chaves SQL Server Rápido y Furioso 02 de Setiembre Alejandro Cordero SQL Monitoring 16 de Setiembre Javier Villegas SQL como un servicio en la nube
  • 2. Distributed Storage (HDFS) Query (Hive) Distributed Processing (MapReduce) DataIntegration (ODBC/SQOOP/REST) EventPipeline (EventHub/ Flume) Legend Red = Core Hadoop Blue = Data processing Gray= Microsoft integration points and value adds Orange = Data Movement Green = Packages HDInsight and Hadoop ecosystem YARN
  • 3. Similar a Base de Datos • HBASE • Base de datos no relacional • Escrita en Java • Usa HDFS como Sistema de archivos • Escenario más usado: Encontrar pequeños bloques datos en grandes volúmenes de datos • Ejemplo: Los 20 elementos más costosos entre 5 mil millones de objetos • Facebook lo usa para su plataforma de mensajería • HCatalog • Capa de administración de almacenamiento para Hadoop • Su idea es tener buscar una representación de datos relacionales en Hadoop 3
  • 4. Lenguajes • Pig • Plataforma para la creación de Jobs Map-Reduce • Piglatin similar a TSql • Puede ser extendido usando varios lenguajes, incluyendo Javascript • Creado por Yahoo luego pasa a la fundación Apache en 2006. • Hive • Ayuda a proveer capacidades BI sobre Hadoop • Lenguaje HiveQL similar a TSql • Scala • Nuevo lenguaje para ejecutar instrucciones in-memory • Usa Spark 4
  • 5. Conexión • Polybase • Permite a los usuarios de SqlServer PDW ejecutar consultas contra datos almacenados en Hadop • Es possible hacer un JOIN con datos almacenados en HADOOP • Hive ODBC • Es un driver ODBC para conectar HADOOP con productos Microsoft • Excel • PowerPivot • SharePoint • Sqoop • Enviar y recibir grandes volúmenes de información desde y hacia bases de datos relacionales • REST – WebHDFS • Cualquier producto puede conectarse con HADOOP usando el API Rest (Móviles, Web..) 5
  • 6. Minería de Datos • Mahout • Contiene una seria de algoritmos de minería de datos para análisis predictivo y descriptivo sobre información almacenada en Hadoop • Rhadoop • Implementación especial de R • R • Es possible instalar R en las máquinas virtuales de HADOOP, como resultado, podemos interactuar con HADOOP para hacer análisis estadístico avanzado usando R 6
  • 7. WorkFlow • Oozie • Permite la definición y ejecución de Workflows • Usa MapReduce y Jobs PIG • Flume • Colección, agregación y movimiento de grandes volúmenes de datos • Especializado en el procesamiento de LOGs 7
  • 9. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 10. 10
  • 11. 11 Oportunidades de Voluntariado PASS no pudiera existir sin personas apasionadas y dedicadas de todas partes del mundo que dan de su tiempo como voluntarios. Se un voluntario ahora!! Para identificar oportunidades locales visita volunteer.sqlpass.org Recuerda actualizar tu perfil en las secciones de “MyVolunteering” y MyPASS para mas detalles.
  • 12. Sigan Participando! • Obtén tu membresía gratuita en sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 13. Conociendo los servicios adicionales en BigData 26 de Agosto de 2015 Freddy Angarita Títulos y reconocimientos. Moderador: Kenneth Ureña
  • 14. SQL Server Rápido y Furioso 02 de Setiembre (12 pm GMT -5) Alejandro Cordero Resúmen: En esta sesión analizaremos experiencias de la vida real como consultor en trabajos de mejora de rendimiento. Veremos mejores prácticas para la configuración de SQL Server, tips para un mejor T-SQL y un ejercicio de como monitorear mi servidor de base de datos con Performance Counters, un SQL Server Express y un Excel con Power Pivot. Próximo Evento

Hinweis der Redaktion

  1. HBase is non relational database written in Java. It uses HDFS as its file system. This database is used in scenarios where we need to store sparse data (small information found within large data; e.g., finding 50 largest items in 2 billion objects). Facebook’s messaging platform uses HBase database. Pig is a high level platform for creating map-reduce jobs for Hadoop. It uses a language called PigLatin which is very “similar” to SQL. It can be extended further to be used from other programming languages like JavaScript. Developed by Yahoo and then moved to Apache S/W foundation in 2006. Hive is developed by Facebook and it helps in providing BI capabilities on top of Hadoop. We can analyze Hadoop’s HDFS data using Hive’s querying language called HiveQL which is also similar to SQL in syntax. HCatalog is a storage management layer for Hadoop. Basically it helps presenting HDFS data in relational format. Polybase allows SQL Server PDW users to execute queries against data stored in Hadoop’s HDFS. So, as an example, users can fire queries that join data between HDFS and PDW tables! Mahout is a set of machine learning algorithms that can use Hadoop for processing. Oozie is a server-based Workflow Engine specialized in running workflow jobs with actions that run Hadoop MapReduce and Pig jobs. Flume is used to collect, aggregate and move large amount of log data. Sqoop is used to transfer data between relational and Hadoop. Microsoft uses Sqoop based connector to move data between SQL Server and Hadoop. Hive ODBC driver is used to connect different Microsoft products to connect to Hive which in turn provide connectivity with Hadoop. Products like Excel, Power Pivot, SharePoint Insights, SSRS, SSAS, etc. REST Products can connect to Hadoop’s HDFS using REST APIs as well. A common requirement for this scenario is from small devices or from apps running outside a Hadoop cluster where Hadoop’s native programming is not available. This REST connectivity is possible through implementation of WebHDFS. Microsoft’s HDInsight clusters can be managed using System Center management pack for HDInsight Speaking Points: Biggest buzzword in Big Data right now is Hadoop It can mean many things, but always includes HDFS and MapReduce HDInsight Red = in product now Blue = planned for product Green = ecosystem can connect now Purple = Samples available Orange = ecosystem planned Flume, HBase are not available in the first release of HDInsight Service As of 3/15, we don’t have an on-premises solution, thus AD integration is not yet available. System center integration will come later as well. The Green boxes are packages in the ecosystem that have not been included in the service, but should work out of the box by downloading them.