Big Data - Scenario and Networking impact di Alberto Degradi durante la giornata Mobile Focus svoltasi il 30 maggio 2014 a Torino nell'ambito del Digital Festival
Alberto Degradi - Conferenza Plenaria Mobile Revolution State of the art
1.
2. Big Data
Scenario and Networking Impact
Cisco Italy
Alberto Degradi
Senior Manager
adegradi@cisco.com
@albertodegradi
3. Network as the Platform
Cambiamenti in atto ed Innovazione
CRESCITA &
INNOVAZION
E
NUOVE
ESPERIENZE
NUOVI
MODELLI DI
BUSINESS
GLOBALIZZA
ZIONE
SECURITY &
PRIVACY
Transizioni Tecnologiche
BYOD APPs EconomyCLOUD
BIG DATA
ANALYTICS
SENSORS &
DEVICES
Transizioni di Business
4. C’è un altro fattore determinante nei cambiamenti…
6. Dati generati da nuovi ambiti
IoT
Plant Field
Information Technology (IT)
Campus BranchData
Center
Campus BranchData
Center
Prima…
7. Dati generati da nuovi ambiti
IoT
Operational Technology (OT)
Plant Field
Ora…
8. Dati generati da nuovi ambiti
IoT
Operational Technology (OT)
Plant Field
Ora…
L’Internet delle Cose Cambierà ogni Cosa
Ogni Azienda sarà un’Azienda Tecnologica
9. I Dati non si riposano mai
684.478 nuovi contenuti condivisi
> 100.000 messaggi
Sapete che ogni minuto in rete?
204.166.667 messaggi spediti
48 ore di nuovi video
Fonte: DOMO
> 2M di ricerche
10. Big Data – Importanza dei Dati
ü Big Data, come possiamo
definirla
§ “Un cambio di paradigma che ha
le potenzialità di “cambiare
l’industria e non solo”
§ Voluminosa quantità di dati, non
strutturati o semi-strutturati
§ Si Riferisce a dati
provenienti da:
§ Impresa privata
§ Aziende Pubbliche
§ Machine-generated/Sensori
§ Social Media
11. Big Data - Caratteristiche
Caratteristiche che definiscono Big Data:
Volume
Velocità
Varietà
Valore
12. Analytics
Algoritmi per estrarre intuizioni, suggerimenti e azioni dai dati grezzi
• Software
• Casi d’impiego verticali
• Utilizzare lo stack di Dati
• Dati non strutturati o semi
strutturati
• Processing parallelo e
distribuito
• Scale out
• Commodity hw, OS sw
Big Data
Tecnologie in evoluzione per la
gestione economica dei dati non
strutturati in modo non convenzionale
Volume
Velocità
Varietà
Valore
Definizione Cisco di Big Data & Analytics
• Relazionali o object data
modeling
• Consistenza &
completezza
• Scale up
• Enterprise hw, sw
proprietari
Data Management Tradizionale
Banca dati e file system per la
gestione coerente di dati strutturati
DatacenterVideoCollab /
Web
Mobile Network Healthcare Financial InsurancePublic
Sector
IoT
14. La rilevanza del Big data riserva all’IT
una sedia al tavolo del Business
• Big data incontra sempre
un key business driver
• Big data non risolve un
problema puramente
tecnologico
• I progetti Big data
saranno guidati sia dai
CFO sia dai CIO
15. Sicurezza come principale ostaclo
Ricerca Internazionale di Cisco: Cisco Connected World Technology
Report
Mancanza di
personale preparato
Troppi modi di
accedere ai Dati
Mancanza
del budget
Troppi Dati
32% 21% 20% 20%
010100101010
101001010101
010101010101
010100110101
101010011001
010101
01010010101
01010010101
01010101010
10011010110
10100110010
10101010011
16. 01010010101010100101
Big Data: molto potenziale ma il valore
strategico è ancora sfuggente
4 su 5(86%) analizzano
i dati oggi
1 su 4(28%)
estrae valore strategico
Ma solo
Ricerca Interazionale di Cisco: Cisco Connected World Technology
Report
17. Data
management
InfrastructureAnalytics&BI
Traditional
data
management
Variety
Corporate Development Technology Group - 2012
RDBMS
(traditional)
Visualization
& reporting
Servers
echnology landscape evolves based on 3Vs
Storage
Networking
Velocity
CEP,
automation
HPC &
specialized hw
HA / HP
Storage
Streaming
databases
Real-time
Big Data /
analytics
BI, BPM,
integration
Volume
NoSQL
NewSQL
Commodity
servers
Data mining
& analytics
Hadoop
IT automation
/ DevOps
Vertically integr.
vendors
18. Come le Soluzioni Cisco indirizzano e sfide
del Big Data
• Many ports to connect
machines
• Buffering for high, variable
loads
• Impact of virtualization
Performance & Cost
• Cloud DC-like approach
Spine/Leaf architecture
Nexus & Cisco unified
fabric
Virtual chassis
• SDN / OpenFlow
• Big Data Whole Offer:
Nexus + UCS + EMC /
Cloudera
• Partner for DC mgmt, e.g.
Puppet
• Virtualize for testing,
variable loads
• Nexus’ leading port density &
buffer capacity
• Congestion protocols
• Focus on network hw,
controllers, enterprise
solutions
Cisco Response
• Setup & operations
headache - 1000s of
servers & ports
• Many tools to provision,
monitor…
ManagementArchitecture
• DC 3-tiered hierarchy
suboptimal
• Scale out - start small &
grow
19. Big Data e Infrastruttura
Non solo blade servers (local storage non sufficiente)
Ambiente Non virtualizzato (hypervisor aggiunge
overhead)
Ambiente non oversubscribed (traffico est-ovest
significativo)
Preferibilmente non SAN/NAS
19
Spostare il
computing
con lo
storage
19
20. Big Data DC
Uso sperimentale del Big Data
Su un DC tradizionale
Bene per uno Small clusters
Purpose built for Big Data
Big Data è riconosciuto
come un valore
Le Performance contano
Large o medium clusters
IT Infrastructure
Big
Data
VMwar
e
WEBSAP
standard IT servers
General Purpose IT Data
Center
commodity
servers
Big Data
Dedicated “Pod” for Big
Data
24. UCS Rack-Mount
Servers
UCS Blade
Servers
Big Data Common
Platform Architecture
NoSQL Database
SAN/NAS Arrays
Enterprise
Applications
Estendere UCS Enterprise Application
Ecosystem al Big Data
25. Big Data Solution Packs
High Performance
UCS-EZ-BD-HP
High Capacity
UCS-EZ-BD-HC
Cisco UCS e Nexus Common Platform Architecture
Certificazione Nexus
• Cloudera Hadoop Certified Technology
• Cloudera Hadoop Solution Brief
• Hortonworks Reference architecture
• Presented at 2012 Hadoop Summit
Multi-month network and
compute analysis testing
(In conjunction with Cloudera)
• Network/Compute Considerations Whitepaper
• Presented Analysis at Hadoop World
• Couchbase solution brief
26. Open Approach to Architectures and Applications
Power of the Ecosystem
VBLOCKFLEXPO
D
HDS UCP
Cisco Unified
Management
Business Apps Databases
Analytics and
Big data
Cloud Apps
Collaboration
Applications
Desktop
Virtualization
VSPEX
Cisco
UCS
Cisco
Nexus
HANA
& BWA
Cisco Servers with Intel® Xeon® processors
28. La Conoscenza Umana sta Moltiplicandosi …
Nel secondo millennio la conoscenza umana
raddoppiava ogni 100 anni
Ora la somma totale della conoscenza umana
raddoppia ogni 2 – 3 anni
70% delle informazioni conosciute appartiene
al periodo di Internet
Più conosciamo e più velocemente creiamo
nuova conoscenza
Sorgente: Thomas Fuller, Knowledge Doubling
Curve