SlideShare ist ein Scribd-Unternehmen logo
1 von 62
Downloaden Sie, um offline zu lesen
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Fabrizio Celli - Solutions Architect
Federico D’Alessio - Solutions Architect
Leonardo Fenu - Solutions Architect
16 Ottobre 2019
Soluzioni flessibili per il collezionamento, la conservazione e
l'analisi di dati di qualsiasi tipo e dimensione: ’’Data Lake’’
I dati sono un asset strategico per ogni organizzazione
The world’s most
valuable resource is
no longer oil, but data.*
*Copyright: The Economist, 2017, David Parkins
“
”
I Clienti vogliono ottenere più valore dai propri dati
Hanno una crescita
esponenziale
Nuove sorgenti Sono sempre più
diversificati
Sono utilizzati da
molte persone
Sono analizzati da
molte applicazioni
* IDC, Data Age 2025: The Evolution of Data to Life-Critical Don’t Focus on Big Data, Focus on the Data That’s Big, April 2017.
Data
every 5 years
Ci sono più dati di
quanto si possa pensare
15
years
live for
Data platforms need to
1,000x
scale
>10x
grows
Attuale modello di processamento dei datiSiloedApps
$$$
ETL JOB ETL JOB ETL JOB
Primary DWH Secondary DWH Datamarts
Data propagation Delay
Complex – Long DataModel Update
Data Filtering / Data Duplication
$$
$$
$$
$$
$$
$$
Always running infrastructure
$$
$$
$$
Un nuovo approccio per ottenere valore dai propri dati
 Un unico data store scalabile e conveniente
 Per conservare i propri dati in modo sicuro e in formati standard
 Per analizzare i propri dati in modi diversi
Il Data Lake
Cloud Data Lake
Infrastructure
Decoupled Storage
& Compute Resources
Security & Governance
Data
Migration
Streaming
Services
Data
Warehouse
Big Data
Processing
Serverless Data
Processing
Real-time
Analytics
Operational
Analytics
Predictive
AnalyticsETL & Catalog
Data Management
Un Data Lake è un repository
centralizzato che permette di
conservare e analizzare tutti i dati,
strutturati e non strutturati, di qualsiasi
dimensione, nel loro formato nativo
Perché scegliere AWS per realizzare un Data Lake ed
effettuare l’Analisi dei Dati ?
Il più completo
set di servizi
Data Movement
Analytics
+ 11 more
Redshift
EMR (Spark
& Hadoop)
Athena
Elasticsearch
Service
Kinesis Data
Analytics
Glue (Spark
& Python)
S3/Glacier GlueLake
Formation
Visualization, Engagement, & Machine Learning
QuickSight SageMaker Comprehend Lex Polly Rekognition Translate Transcribe
Database Migration Service | Snowball | Snowmobile | Kinesis Data Firehose | Kinesis Data Streams | Managed Streaming for Kafka
Data Lake Infrastructure & Management
Pinpoint
Il più completo
Il più ampio e dettagliato portfolio “purpose-built for builders”
Perché scegliere AWS per realizzare un Data Lake ed
effettuare l’Analisi dei Dati ?
Il più completo
set di servizi
Il più sicuro
Il più sicuro
Servizi per la security e la governance
Compliance
AWS Artifact
Amazon Inspector
Amazon Cloud HSM
Amazon Cognito
AWS CloudTrail
Security
Amazon GuardDuty
AWS Shield
AWS WAF
Amazon Macie
VPC
Encryption
AWS Certification Manager
AWS Key Management
Service
Encryption at rest
Encryption in transit
Bring your own keys, HSM
support
Identity
AWS IAM
AWS SSO
Amazon Cloud Directory
AWS Directory Service
AWS Organizations
I nostri clienti hanno bisogno di livelli multipli di sicurezza, identity e access
management, encryption e compliance per mettere in sicurezza i loro Data Lake
Il più sicuro: il maggior numero di certificazioni
CSA
Cloud Security
Alliance Controls
ISO 9001
Global Quality
Standard
ISO 27001
Security Management
Controls
ISO 27017
Cloud Specific
Controls
ISO 27018
Personal Data
Protection
PCI DSS Level 1
Payment Card
Standards
SOC 1
Audit Controls
Report
SOC 2
Security, Availability, &
Confidentiality Report
SOC 3
General Controls
Report
Global United States
CJIS
Criminal Justice
Information Services
DoD SRG
DoD Data
Processing
FedRAMP
Government Data
Standards
FERPA
Educational
Privacy Act
FIPS
Government Security
Standards
FISMA
Federal Information
Security Management
GxP
Quality Guidelines
and Regulations
ISO FFIEC
Financial Institutions
Regulation
HIPPA
Protected Health
Information
ITAR
International Arms
Regulations
MPAA
Protected Media
Content
NIST
National Institute of
Standards and Technology
SEC Rule 17a-4(f)
Financial Data
Standards
VPAT/Section 508
Accountability
Standards
Asia Pacific
FISC [Japan]
Financial Industry
Information Systems
IRAP [Australia]
Australian Security
Standards
K-ISMS [Korea]
Korean Information
Security
MTCS Tier 3 [Singapore]
Multi-Tier Cloud
Security Standard
My Number Act [Japan]
Personal Information
Protection
Europe
C5 [Germany]
Operational Security
Attestation
Cyber Essentials
Plus [UK]
Cyber Threat
Protection
G-Cloud [UK]
UK Government
Standards
IT-Grundschutz
[Germany]
Baseline Protection
Methodology
X P
G
Perché scegliere AWS per realizzare un Data Lake ed
effettuare l’Analisi dei Dati ?
Il più completo
set di servizi
Il più sicuro Il più
conveniente
Il più conveniente
La compomente compute è disaccoppiata da quella storage e
fornisce servizi di analytics in modalità ”Pay As You Go”
Storage
S3 tiers &
intelligent tiering
From $0.023 per
GB/mo to as low as
$0.004 per GB/mo
Compute
Spot & reserved
instances
Save up to 90% off
on-demand prices
EMR
Autoscaling
57% less than
on-premises
per IDC report
Redshift
Less than 1/10th of
the cost of
traditional, on-
premises solutions
Athena &
QuickSight
Serverless pay
only for what is used
Pricing per session for
visualization
Perché scegliere AWS per realizzare un Data Lake ed
effettuare l’Analisi dei Dati ?
Il più completo
set di servizi
Il più sicuro Il più
conveniente
Il più diffuso
Largamente Utilizzato
AWS ospita decine di migliaia di data lake
Il maggior numero di partner per completare l’offerta AWS
IL DATA LAKE AWS
PER L’EVOLUZIONE DIGITALE DI SIAE
Ottobre, 2019
La sfida che guida la trasformazione
Perché AWS
Processamento di una
grande mole di dati
Accuratezza e qualità
dei dati di output
Efficienza nel processo di
matching
Piattaforma multi-tenant
Incrementare
Cash Flow
Migliorare
Servizio
Migliorare
Efficienza
Garantire
Velocità
Maggiore
Flessibilità
Garantire
Modularità
Requisiti di BusinessRequisiti Tecnici
SIAE
La soluzione di Data Lake su AWS
Amazon S3 WEB APPLICATION RDS
CLUSTER EMR
CLUSTER EC2
Ad ogni opera contenuta nei file DSR, viene associato un set codice + metadati per identificarla e renderla
processabile
DSP
Storage Processing Analysis/Monitoring
DSP1
DSP2
DSP3
DSPn
DSPs
Reports
Amazon
SQS
I vari step di processo gestiti su AWS
Acquisizione dei flussi delle
utilizzazioni dai vari DSP
• Riconoscimento opere
utilizzate
• Valorizzazione economica
secondo le licenze
Claim delle quote tutelate
Incassati i diritti d’autore dal
DSP, valorizzazione
economica delle utilizzazioni
agli aventi diritto
N° DSR
(DSPs
Reports)
N° File
Outuput
SIAE+Partner
Documentation
System
DSP
N°
Invoice
Reports
Amazon EMR Amazon EMR Amazon EC2 Amazon EC2 Amazon EC2
Amazon S3 Amazon S3 Amazon S3
Amazon RDS Amazon RDS Amazon RDS
Framework tecnologico
Business Process Monitoring Simulation
DSR Flow
Management
DSP Contract
Management
Multi tenant
Management
Pricing Rules
Management
Live Datalake
Historic
Datalake
Logsfile
storage
KB Machine
Learning
Pricing
Claimin
g
Invoicing &
Cash Payment
Post/Back
Claiming
DSR
Management
Automatic
Matching
Manual Matching
IntegrationLayer
Business
Intelligence
Distribution
External
Documentatio
n System
External ERP
System
External CRM
System
External
Settlement
System
Machine
Learning
Amazon S3
Amazon EMR
Amazon EC2
Amazon RDS
I benefici introdotti da una soluzione AWS
Aumento %
di machting
64
%
72%90%
Aumento dei
report processati
Riduzione del 90% dei
conflitti con i DSP
SISTEMA LEGACY
Le utilizzazioni gestite oggi con AWS
LICENZE MULTI-TERRITORIALI
What’s next? Un’architettura digitale convergente
Portali
Front-End
Microservice Layer
Storage Big Data
Processing
SQL AccessRule Engine Event
Broker
Kafka
Integration Layer
Security
DataGovernance
Administration/Monitoring
Hadoop Distribuited File System
BI/Reporting
SIAE Legacy Systems
What’s next? Nuovi accordi e collaborazioni
LICENZE MULTI-TERRITORIALI E MULTI-MANDANTI LICENZE ITALIANE: Multimediale, Broadcasting, TV&Radio ed
Eventi Live
What’s next? La Roadmap funzionale
ALTRE MANDANTI
MULTIMEDIA LOCALEBROADCASTING
TV & RADIO
1
2
3
4UPGRADE
ALTRI REPERTORI SIAE
(Cinema, Teatro, Lirica, Opere
Letterarie e Arti Figurative)
6
EVENTI LIVE
5
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Fabrizio Celli - Solutions Architect
Federico D’Alessio - Solutions Architect
Leonardo Fenu - Solutions Architect
Come creare un Data Lake con
AWS Lake Formation
Come creare un Data Lake
Passaggi per la creazione di un Data Lake
Move data2 Cleanse, prep,
and catalog data
3
Configure and enforce security
and compliance policies4
Make data available
for analytics5
Setup storage1
AWS Lake Formation
Crea, metti in sicurezza e gestisci un data lake in giorni
Build a data lake in days,
not months
Build and deploy a fully managed
data lake with a few clicks
Enforce security policies
across multiple services
Centrally define security,
governance, and auditing policies in
one place and enforce those policies
for all users and all applications
Combine different
analytics approaches
Empower analyst and data scientist
productivity, giving them self-
service discovery and safe access to
all data from a single catalog
Creiamo un Data Lake in 3 passi
Creiamo un Data Lake in 3 passi
Creiamo un Data Lake in 3 passi
Creiamo un Data Lake in 3 passi
Creiamo un Data Lake in 3 passi
Creiamo un Data Lake in 3 passi
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati strutturata
Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
Implementiamo la sicurezza per i nostri dati
Implementiamo la sicurezza per i nostri dati
Interroghiamo il nostro Data Lake con Amazon Athena
Utilizziamo Amazon QuickSight per effettuare delle analisi
cellifab@
dalesf@
lfenu@
Grazie
Nella Prossima Sessione
Strumenti per l'analisi avanzata dei dati con tecniche descrittive,
predittive e prescrittive: Machine Learning

Weitere ähnliche Inhalte

Was ist angesagt?

Distribuisci software migliori più velocemente con DevOps
Distribuisci software migliori più velocemente con DevOpsDistribuisci software migliori più velocemente con DevOps
Distribuisci software migliori più velocemente con DevOpsAmazon Web Services
 
AWS 101: Guida rapida alle soluzioni AWS
AWS 101: Guida rapida alle soluzioni AWSAWS 101: Guida rapida alle soluzioni AWS
AWS 101: Guida rapida alle soluzioni AWSAmazon Web Services
 
Azure Web Apps: portare il tuo sito sul cloud
Azure Web Apps: portare il tuo sito sul cloudAzure Web Apps: portare il tuo sito sul cloud
Azure Web Apps: portare il tuo sito sul cloudDavide Benvegnù
 
Introduzione a Microsoft Azure
Introduzione a Microsoft AzureIntroduzione a Microsoft Azure
Introduzione a Microsoft AzureRoberto Albano
 
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...Amazon Web Services
 
AWS (Amazon Web Services) - Trevisan Davide
AWS (Amazon Web Services) - Trevisan DavideAWS (Amazon Web Services) - Trevisan Davide
AWS (Amazon Web Services) - Trevisan DavideDavide Trevisan
 
Microsoft Application Insights
Microsoft Application InsightsMicrosoft Application Insights
Microsoft Application InsightsRoberto Albano
 
Multi Cloud essentials
Multi Cloud essentialsMulti Cloud essentials
Multi Cloud essentialsantimo musone
 
Il Cloud Computing
Il Cloud ComputingIl Cloud Computing
Il Cloud Computingzambe92
 
Google Cloud Computing & Project Work
Google Cloud Computing & Project WorkGoogle Cloud Computing & Project Work
Google Cloud Computing & Project WorkFabio Dainese
 
2011.06.30 scenari applicativi per il cloud computing
2011.06.30   scenari applicativi per il cloud computing2011.06.30   scenari applicativi per il cloud computing
2011.06.30 scenari applicativi per il cloud computingMarco Parenzan
 
Smau padova 2013 stefano dindo
Smau padova 2013 stefano dindoSmau padova 2013 stefano dindo
Smau padova 2013 stefano dindoSMAU
 

Was ist angesagt? (18)

Distribuisci software migliori più velocemente con DevOps
Distribuisci software migliori più velocemente con DevOpsDistribuisci software migliori più velocemente con DevOps
Distribuisci software migliori più velocemente con DevOps
 
AWS 101: Guida rapida alle soluzioni AWS
AWS 101: Guida rapida alle soluzioni AWSAWS 101: Guida rapida alle soluzioni AWS
AWS 101: Guida rapida alle soluzioni AWS
 
Laboratori virtuali
Laboratori virtualiLaboratori virtuali
Laboratori virtuali
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Azure Web Apps: portare il tuo sito sul cloud
Azure Web Apps: portare il tuo sito sul cloudAzure Web Apps: portare il tuo sito sul cloud
Azure Web Apps: portare il tuo sito sul cloud
 
Amazon Web Services
Amazon Web ServicesAmazon Web Services
Amazon Web Services
 
Introduzione a Microsoft Azure
Introduzione a Microsoft AzureIntroduzione a Microsoft Azure
Introduzione a Microsoft Azure
 
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...
Viaggio attraverso il cloud - Consigli e best practices per iniziare con il c...
 
AWS (Amazon Web Services) - Trevisan Davide
AWS (Amazon Web Services) - Trevisan DavideAWS (Amazon Web Services) - Trevisan Davide
AWS (Amazon Web Services) - Trevisan Davide
 
Microsoft Application Insights
Microsoft Application InsightsMicrosoft Application Insights
Microsoft Application Insights
 
Multi Cloud essentials
Multi Cloud essentialsMulti Cloud essentials
Multi Cloud essentials
 
Azure Logic Apps
Azure Logic AppsAzure Logic Apps
Azure Logic Apps
 
Il Cloud Computing
Il Cloud ComputingIl Cloud Computing
Il Cloud Computing
 
Google Cloud Computing & Project Work
Google Cloud Computing & Project WorkGoogle Cloud Computing & Project Work
Google Cloud Computing & Project Work
 
2011.06.30 scenari applicativi per il cloud computing
2011.06.30   scenari applicativi per il cloud computing2011.06.30   scenari applicativi per il cloud computing
2011.06.30 scenari applicativi per il cloud computing
 
Il Cloud a Km.0
Il Cloud a Km.0Il Cloud a Km.0
Il Cloud a Km.0
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Smau padova 2013 stefano dindo
Smau padova 2013 stefano dindoSmau padova 2013 stefano dindo
Smau padova 2013 stefano dindo
 

Ähnlich wie Data Lake

Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSAmazon Web Services
 
Team Netuse & IBM - Il Cloud Native rende agile il tuo business.
Team Netuse & IBM -  Il Cloud Native rende agile il tuo business.Team Netuse & IBM -  Il Cloud Native rende agile il tuo business.
Team Netuse & IBM - Il Cloud Native rende agile il tuo business.Team Netuse srl
 
2015.04.23 Azure Community Bootcamp 2015 Keynote Italy
2015.04.23 Azure Community Bootcamp 2015 Keynote Italy2015.04.23 Azure Community Bootcamp 2015 Keynote Italy
2015.04.23 Azure Community Bootcamp 2015 Keynote ItalyMarco Parenzan
 
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...Marco Parenzan
 
Luca De Vincenti, Microsoft - SMAU Bologna 2017
Luca De Vincenti, Microsoft - SMAU Bologna 2017Luca De Vincenti, Microsoft - SMAU Bologna 2017
Luca De Vincenti, Microsoft - SMAU Bologna 2017SMAU
 
Smau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSmau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSMAU
 
Smau milano 2012 fabrizio amarilli architettura
Smau milano 2012 fabrizio amarilli architetturaSmau milano 2012 fabrizio amarilli architettura
Smau milano 2012 fabrizio amarilli architetturaSMAU
 
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Denodo
 
I Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaI Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaSoluzioni Futura
 
I Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaI Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaValerio Versace
 
Cloud e innovazione
Cloud e innovazioneCloud e innovazione
Cloud e innovazioneXPeppers
 
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...Jürgen Ambrosi
 
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiare
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiareAdobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiare
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiareManuela Moroncini
 
Strategie d'Integrazione dei dati per un mondo ibrido e multicloud
Strategie d'Integrazione dei dati per un mondo ibrido e multicloudStrategie d'Integrazione dei dati per un mondo ibrido e multicloud
Strategie d'Integrazione dei dati per un mondo ibrido e multicloudDenodo
 
Tutto il Cloud di Seeweb
Tutto il Cloud di SeewebTutto il Cloud di Seeweb
Tutto il Cloud di Seewebseeweb
 
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Denodo
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Denodo
 
Microsoft Azure - Passaggio al Cloud
Microsoft Azure - Passaggio al CloudMicrosoft Azure - Passaggio al Cloud
Microsoft Azure - Passaggio al CloudRoberto Stefanetti
 
Aws (amazon web services) - Slide
Aws (amazon web services) - SlideAws (amazon web services) - Slide
Aws (amazon web services) - Slidealessioemireni
 

Ähnlich wie Data Lake (20)

Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
 
Team Netuse & IBM - Il Cloud Native rende agile il tuo business.
Team Netuse & IBM -  Il Cloud Native rende agile il tuo business.Team Netuse & IBM -  Il Cloud Native rende agile il tuo business.
Team Netuse & IBM - Il Cloud Native rende agile il tuo business.
 
2015.04.23 Azure Community Bootcamp 2015 Keynote Italy
2015.04.23 Azure Community Bootcamp 2015 Keynote Italy2015.04.23 Azure Community Bootcamp 2015 Keynote Italy
2015.04.23 Azure Community Bootcamp 2015 Keynote Italy
 
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...
2015.01.09 - Principi del Cloud Computing e migrazione delle applicazioni mod...
 
Luca De Vincenti, Microsoft - SMAU Bologna 2017
Luca De Vincenti, Microsoft - SMAU Bologna 2017Luca De Vincenti, Microsoft - SMAU Bologna 2017
Luca De Vincenti, Microsoft - SMAU Bologna 2017
 
Smau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSmau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazione
 
Smau milano 2012 fabrizio amarilli architettura
Smau milano 2012 fabrizio amarilli architetturaSmau milano 2012 fabrizio amarilli architettura
Smau milano 2012 fabrizio amarilli architettura
 
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
 
I Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaI Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni Futura
 
I Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni FuturaI Love Cloud by Soluzioni Futura
I Love Cloud by Soluzioni Futura
 
Evento stage it-v1
Evento stage it-v1Evento stage it-v1
Evento stage it-v1
 
Cloud e innovazione
Cloud e innovazioneCloud e innovazione
Cloud e innovazione
 
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...
1° Seminario CRUI - GARR: Una Cloud federata per università e ricerca, come u...
 
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiare
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiareAdobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiare
Adobe: Stefano Longo, Web 2.0: come le imprese se ne possono avvantaggiare
 
Strategie d'Integrazione dei dati per un mondo ibrido e multicloud
Strategie d'Integrazione dei dati per un mondo ibrido e multicloudStrategie d'Integrazione dei dati per un mondo ibrido e multicloud
Strategie d'Integrazione dei dati per un mondo ibrido e multicloud
 
Tutto il Cloud di Seeweb
Tutto il Cloud di SeewebTutto il Cloud di Seeweb
Tutto il Cloud di Seeweb
 
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?
 
Microsoft Azure - Passaggio al Cloud
Microsoft Azure - Passaggio al CloudMicrosoft Azure - Passaggio al Cloud
Microsoft Azure - Passaggio al Cloud
 
Aws (amazon web services) - Slide
Aws (amazon web services) - SlideAws (amazon web services) - Slide
Aws (amazon web services) - Slide
 

Mehr von Amazon Web Services

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Amazon Web Services
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Amazon Web Services
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateAmazon Web Services
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSAmazon Web Services
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Amazon Web Services
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Amazon Web Services
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...Amazon Web Services
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsAmazon Web Services
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareAmazon Web Services
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSAmazon Web Services
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAmazon Web Services
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWSAmazon Web Services
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckAmazon Web Services
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without serversAmazon Web Services
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...Amazon Web Services
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceAmazon Web Services
 
Come costruire un'architettura Serverless nel Cloud AWS
Come costruire un'architettura Serverless nel Cloud AWSCome costruire un'architettura Serverless nel Cloud AWS
Come costruire un'architettura Serverless nel Cloud AWSAmazon Web Services
 

Mehr von Amazon Web Services (20)

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS Fargate
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWS
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot
 
Open banking as a service
Open banking as a serviceOpen banking as a service
Open banking as a service
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
 
Computer Vision con AWS
Computer Vision con AWSComputer Vision con AWS
Computer Vision con AWS
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatare
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e web
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWS
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch Deck
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without servers
 
Fundraising Essentials
Fundraising EssentialsFundraising Essentials
Fundraising Essentials
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container Service
 
Come costruire un'architettura Serverless nel Cloud AWS
Come costruire un'architettura Serverless nel Cloud AWSCome costruire un'architettura Serverless nel Cloud AWS
Come costruire un'architettura Serverless nel Cloud AWS
 

Data Lake

  • 1.
  • 2. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Fabrizio Celli - Solutions Architect Federico D’Alessio - Solutions Architect Leonardo Fenu - Solutions Architect 16 Ottobre 2019 Soluzioni flessibili per il collezionamento, la conservazione e l'analisi di dati di qualsiasi tipo e dimensione: ’’Data Lake’’
  • 3. I dati sono un asset strategico per ogni organizzazione The world’s most valuable resource is no longer oil, but data.* *Copyright: The Economist, 2017, David Parkins “ ”
  • 4. I Clienti vogliono ottenere più valore dai propri dati Hanno una crescita esponenziale Nuove sorgenti Sono sempre più diversificati Sono utilizzati da molte persone Sono analizzati da molte applicazioni
  • 5. * IDC, Data Age 2025: The Evolution of Data to Life-Critical Don’t Focus on Big Data, Focus on the Data That’s Big, April 2017. Data every 5 years Ci sono più dati di quanto si possa pensare 15 years live for Data platforms need to 1,000x scale >10x grows
  • 6. Attuale modello di processamento dei datiSiloedApps $$$ ETL JOB ETL JOB ETL JOB Primary DWH Secondary DWH Datamarts Data propagation Delay Complex – Long DataModel Update Data Filtering / Data Duplication $$ $$ $$ $$ $$ $$ Always running infrastructure $$ $$ $$
  • 7. Un nuovo approccio per ottenere valore dai propri dati  Un unico data store scalabile e conveniente  Per conservare i propri dati in modo sicuro e in formati standard  Per analizzare i propri dati in modi diversi
  • 8. Il Data Lake Cloud Data Lake Infrastructure Decoupled Storage & Compute Resources Security & Governance Data Migration Streaming Services Data Warehouse Big Data Processing Serverless Data Processing Real-time Analytics Operational Analytics Predictive AnalyticsETL & Catalog Data Management Un Data Lake è un repository centralizzato che permette di conservare e analizzare tutti i dati, strutturati e non strutturati, di qualsiasi dimensione, nel loro formato nativo
  • 9. Perché scegliere AWS per realizzare un Data Lake ed effettuare l’Analisi dei Dati ? Il più completo set di servizi
  • 10. Data Movement Analytics + 11 more Redshift EMR (Spark & Hadoop) Athena Elasticsearch Service Kinesis Data Analytics Glue (Spark & Python) S3/Glacier GlueLake Formation Visualization, Engagement, & Machine Learning QuickSight SageMaker Comprehend Lex Polly Rekognition Translate Transcribe Database Migration Service | Snowball | Snowmobile | Kinesis Data Firehose | Kinesis Data Streams | Managed Streaming for Kafka Data Lake Infrastructure & Management Pinpoint Il più completo Il più ampio e dettagliato portfolio “purpose-built for builders”
  • 11. Perché scegliere AWS per realizzare un Data Lake ed effettuare l’Analisi dei Dati ? Il più completo set di servizi Il più sicuro
  • 12. Il più sicuro Servizi per la security e la governance Compliance AWS Artifact Amazon Inspector Amazon Cloud HSM Amazon Cognito AWS CloudTrail Security Amazon GuardDuty AWS Shield AWS WAF Amazon Macie VPC Encryption AWS Certification Manager AWS Key Management Service Encryption at rest Encryption in transit Bring your own keys, HSM support Identity AWS IAM AWS SSO Amazon Cloud Directory AWS Directory Service AWS Organizations I nostri clienti hanno bisogno di livelli multipli di sicurezza, identity e access management, encryption e compliance per mettere in sicurezza i loro Data Lake
  • 13. Il più sicuro: il maggior numero di certificazioni CSA Cloud Security Alliance Controls ISO 9001 Global Quality Standard ISO 27001 Security Management Controls ISO 27017 Cloud Specific Controls ISO 27018 Personal Data Protection PCI DSS Level 1 Payment Card Standards SOC 1 Audit Controls Report SOC 2 Security, Availability, & Confidentiality Report SOC 3 General Controls Report Global United States CJIS Criminal Justice Information Services DoD SRG DoD Data Processing FedRAMP Government Data Standards FERPA Educational Privacy Act FIPS Government Security Standards FISMA Federal Information Security Management GxP Quality Guidelines and Regulations ISO FFIEC Financial Institutions Regulation HIPPA Protected Health Information ITAR International Arms Regulations MPAA Protected Media Content NIST National Institute of Standards and Technology SEC Rule 17a-4(f) Financial Data Standards VPAT/Section 508 Accountability Standards Asia Pacific FISC [Japan] Financial Industry Information Systems IRAP [Australia] Australian Security Standards K-ISMS [Korea] Korean Information Security MTCS Tier 3 [Singapore] Multi-Tier Cloud Security Standard My Number Act [Japan] Personal Information Protection Europe C5 [Germany] Operational Security Attestation Cyber Essentials Plus [UK] Cyber Threat Protection G-Cloud [UK] UK Government Standards IT-Grundschutz [Germany] Baseline Protection Methodology X P G
  • 14. Perché scegliere AWS per realizzare un Data Lake ed effettuare l’Analisi dei Dati ? Il più completo set di servizi Il più sicuro Il più conveniente
  • 15. Il più conveniente La compomente compute è disaccoppiata da quella storage e fornisce servizi di analytics in modalità ”Pay As You Go” Storage S3 tiers & intelligent tiering From $0.023 per GB/mo to as low as $0.004 per GB/mo Compute Spot & reserved instances Save up to 90% off on-demand prices EMR Autoscaling 57% less than on-premises per IDC report Redshift Less than 1/10th of the cost of traditional, on- premises solutions Athena & QuickSight Serverless pay only for what is used Pricing per session for visualization
  • 16. Perché scegliere AWS per realizzare un Data Lake ed effettuare l’Analisi dei Dati ? Il più completo set di servizi Il più sicuro Il più conveniente Il più diffuso
  • 17. Largamente Utilizzato AWS ospita decine di migliaia di data lake
  • 18. Il maggior numero di partner per completare l’offerta AWS
  • 19. IL DATA LAKE AWS PER L’EVOLUZIONE DIGITALE DI SIAE Ottobre, 2019
  • 20. La sfida che guida la trasformazione
  • 21. Perché AWS Processamento di una grande mole di dati Accuratezza e qualità dei dati di output Efficienza nel processo di matching Piattaforma multi-tenant Incrementare Cash Flow Migliorare Servizio Migliorare Efficienza Garantire Velocità Maggiore Flessibilità Garantire Modularità Requisiti di BusinessRequisiti Tecnici
  • 22. SIAE La soluzione di Data Lake su AWS Amazon S3 WEB APPLICATION RDS CLUSTER EMR CLUSTER EC2 Ad ogni opera contenuta nei file DSR, viene associato un set codice + metadati per identificarla e renderla processabile DSP Storage Processing Analysis/Monitoring DSP1 DSP2 DSP3 DSPn DSPs Reports Amazon SQS
  • 23. I vari step di processo gestiti su AWS Acquisizione dei flussi delle utilizzazioni dai vari DSP • Riconoscimento opere utilizzate • Valorizzazione economica secondo le licenze Claim delle quote tutelate Incassati i diritti d’autore dal DSP, valorizzazione economica delle utilizzazioni agli aventi diritto N° DSR (DSPs Reports) N° File Outuput SIAE+Partner Documentation System DSP N° Invoice Reports Amazon EMR Amazon EMR Amazon EC2 Amazon EC2 Amazon EC2 Amazon S3 Amazon S3 Amazon S3 Amazon RDS Amazon RDS Amazon RDS
  • 24. Framework tecnologico Business Process Monitoring Simulation DSR Flow Management DSP Contract Management Multi tenant Management Pricing Rules Management Live Datalake Historic Datalake Logsfile storage KB Machine Learning Pricing Claimin g Invoicing & Cash Payment Post/Back Claiming DSR Management Automatic Matching Manual Matching IntegrationLayer Business Intelligence Distribution External Documentatio n System External ERP System External CRM System External Settlement System Machine Learning Amazon S3 Amazon EMR Amazon EC2 Amazon RDS
  • 25. I benefici introdotti da una soluzione AWS Aumento % di machting 64 % 72%90% Aumento dei report processati Riduzione del 90% dei conflitti con i DSP SISTEMA LEGACY
  • 26. Le utilizzazioni gestite oggi con AWS LICENZE MULTI-TERRITORIALI
  • 27. What’s next? Un’architettura digitale convergente Portali Front-End Microservice Layer Storage Big Data Processing SQL AccessRule Engine Event Broker Kafka Integration Layer Security DataGovernance Administration/Monitoring Hadoop Distribuited File System BI/Reporting SIAE Legacy Systems
  • 28. What’s next? Nuovi accordi e collaborazioni LICENZE MULTI-TERRITORIALI E MULTI-MANDANTI LICENZE ITALIANE: Multimediale, Broadcasting, TV&Radio ed Eventi Live
  • 29. What’s next? La Roadmap funzionale ALTRE MANDANTI MULTIMEDIA LOCALEBROADCASTING TV & RADIO 1 2 3 4UPGRADE ALTRI REPERTORI SIAE (Cinema, Teatro, Lirica, Opere Letterarie e Arti Figurative) 6 EVENTI LIVE 5
  • 30. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Fabrizio Celli - Solutions Architect Federico D’Alessio - Solutions Architect Leonardo Fenu - Solutions Architect Come creare un Data Lake con AWS Lake Formation
  • 31. Come creare un Data Lake Passaggi per la creazione di un Data Lake Move data2 Cleanse, prep, and catalog data 3 Configure and enforce security and compliance policies4 Make data available for analytics5 Setup storage1
  • 32. AWS Lake Formation Crea, metti in sicurezza e gestisci un data lake in giorni Build a data lake in days, not months Build and deploy a fully managed data lake with a few clicks Enforce security policies across multiple services Centrally define security, governance, and auditing policies in one place and enforce those policies for all users and all applications Combine different analytics approaches Empower analyst and data scientist productivity, giving them self- service discovery and safe access to all data from a single catalog
  • 33. Creiamo un Data Lake in 3 passi
  • 34. Creiamo un Data Lake in 3 passi
  • 35. Creiamo un Data Lake in 3 passi
  • 36. Creiamo un Data Lake in 3 passi
  • 37. Creiamo un Data Lake in 3 passi
  • 38. Creiamo un Data Lake in 3 passi
  • 39. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 40. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 41. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 42. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 43. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 44. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 45. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 46. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 47. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 48. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 49. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 50. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 51. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 52. Effettuiamo la Data Ingestion da una fonte dati strutturata
  • 53. Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
  • 54. Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
  • 55. Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
  • 56. Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
  • 57. Effettuiamo la Data Ingestion da una fonte dati semi-strutturata
  • 58. Implementiamo la sicurezza per i nostri dati
  • 59. Implementiamo la sicurezza per i nostri dati
  • 60. Interroghiamo il nostro Data Lake con Amazon Athena
  • 61. Utilizziamo Amazon QuickSight per effettuare delle analisi
  • 62. cellifab@ dalesf@ lfenu@ Grazie Nella Prossima Sessione Strumenti per l'analisi avanzata dei dati con tecniche descrittive, predittive e prescrittive: Machine Learning