2. CHE COSA
SONO I
BIG DATA
?
Tecnologie e metodologie
di analisi di dati massivi
per scoprire il legame tra
fenomeni diversi
e prevedere quelli futuri
7. Small Data Big Data
IPOTESI TEORICHE
CAMPIONAMENTO
CASUALE
CAUSALITA’-
REGRESSIONI
UTILIZZO PRIMARIO
CONOSCENZA OPERATIVA
INTERA
POPOLAZIONE
RELAZIONE-
CORRELAZIONI
UTILIZZO SECONDARIO
11. ● Giovane e promettente ufficiale della marina americana.
● Incidente in diligenza 1839: frattura del femore; claudicante.
● Capo del Depot of Chart and Instruments.
● Vecchi comandanti: conoscenze tramandate di generazione in
generazione.
● No rotte lineari, ma a zig e zag: l’oceano è imprevedibile-
● Intuizione di Matthew: venti regolari; maree regolari, ma sconosciute
nel loro insieme.
● Vecchi giornali di bordo compilati dalla marina in tutti i loro viaggi.
● Dati sul vento, sulle correnti e sulle condizioni metereologiche in
determinati posti e date.
● Suddivisione dell’atlantico in blocchi di 5 gradi di longitudine e
latitudine + mese (Dimensioni).
● Misure: temperatura, velocità e direzione del vento, velocità e direzione
delle onde.
12.
13. Vecchia rotta New
York Rio de Janeiro:
sud est; sud ovest, pari
a 3 attraversamenti
dell’Atlantico;
Nuova rotta: diritti a
sud
19. L’azienda che si occupava della manutenzione iniziò a registrare
rigorosamente gli interventi effettuati durante l’anno sui tombini esplosi,
uniti ai dati sui tombini stessi (quanto vecchi, in che zona). Studiando
questi big data, fu possibile elaborare un modello matematico che
prevedeva in tempo reale con una buonissima probabilità quali tombini
fossero in procinto di esplodere, risolvendo il problema alla radice ed
evitando possibili danni a persone e cose. Una vera e propria predizione
statistica del futuro, che definiamo “maintenance predittivo”
(manutenzione basata su delle previsioni).
Esplosione di tombini a new York
20. SMALL DATA: Utilizzo primario
Definizione
obiettivo
Progettazione
infrastruttura
Progettazione
Data Mart
Campionamento
popolazione
Rilevazione
Dati
Analisi
dati