Cos'è Hadoop? Facciamo chiarezza su di lui e sulle comuni distribuzioni di Hadoop.
Valutando le necessità di business è quindi possibile definire un'architettura generica per la gestione dei Big Data.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
2016-02-24 - Architetture per i Big Data
1. Roma - 24 Febbraio 2016
Alberto Paro, BNova Technical Advisor
Architetture per i Big Data
2. Alberto Paro
Laureato in Ingegneria Informatica (POLIMI)
Technical Advisor per BNova
Autore di due libri su ElasticSearch + 6 Tech review
Lavoro principalmente in Scala e su tecnologie BD
(Akka, Spray.io, Playframework, Apache Spark) e NoSQL
(Cassandra, ElasticSearch e MongoDB)
Evangelist linguaggio Scala e Scala.JS
3. Apache Hadoop
Distribuzioni Hadoop
Batch vs Streaming
Architettura Standard
4. Hadoop – Sfatiamo i miti
Hadoop è formato da una pluralità di prodotti
Hadoop è si un opensource, ma disponibile attraverso i
vendors
Hadoop è un ecosistema di prodotti, non un singolo
prodotto
HDFS è un File System, non è un Database Management
System (DBMS)
Hive e famiglia somigliano a SQL, non lo sono
5. Hadoop – Sfatiamo i miti
Hadoop e MapReduce sono correlati ma non hanno
bisogno l’uno dell’altro
MapReduce fornisce un sistema di controllo per gli
Analytics, non gli Analytics di per sé
Hadoop è utile per trattare dati di varia natura, non solo il
volume dei dati
Hadoop completa il Data Warehouse, raramente lo
sostituisce
Hadoop abilita diversi tipi di Analytics, non solo i Web
Analytics
6. Distribuzioni Hadoop – Perchè?
Integrazione tra componenti Hadoop di diverse versioni
Ottimizzazione delle configurazioni
Sistemi di deploy semplificati
Sistemi di monitoring
Supporto tecnico
Stabilità della soluzione => Riduzione del TCO