SlideShare a Scribd company logo
1 of 39
Download to read offline
Big	
  Data
28.01.2013
Immo	
  Salo
Eufris
Eufris
• Peruste'u	
  vuonna	
  2006
• Koulutus-­‐	
  ja	
  konsultoin/palveluita,	
  erikoistunut	
  
  pilvipalveluihin
• Yri7äjä:	
  Immo	
  Salo
   • Kirjat
       • “Cloud	
  compu/ng	
  -­‐	
  palvelut	
  verkossa”,	
  WSOYPro	
  2010
       • “Hyötyä	
  pilvipalveluista”,	
  Docendo	
  2012
       • “Big	
  Data”,	
  Docendo	
  2013	
  (tulossa)


www.eufris.fi
www.bigdata.fi
Big	
  Data:	
  hype	
  nousee!
Google	
  Trends




  Web 2.0           Big data
  Social media
  Cloud computing
Big	
  Data:	
  mitä	
  se	
  on?
Big	
  Data-­‐määritelmiä
"Big data technologies describe a new generation of technologies and
architectures, designed to economically extract value from very large
volumes of a wide variety of data, by enabling high-velocity capture,
discovery, and/or analysis"
IDC



"Big Data is a technology that helps extract value from the digital universe.”
IDC



"Techniques and technologies that make handling data at extreme scale
economical."
Forrester
Gartnerin	
  top	
  10	
  
strategista	
  teknologiaa	
  2012
1. Media	
  Tablets	
  and	
  Beyond
2. Mobile-­‐Centric	
  Applica/ons	
  and	
  Interfaces
3. Contextual	
  and	
  Social	
  User	
  Experience
4. Internet	
  of	
  Things
5. App	
  Stores	
  and	
  Marketplaces
6. Next-­‐Genera/on	
  Analy/cs
7. Big	
  Data
8. In-­‐Memory	
  Compu/ng
9. Extreme	
  Low-­‐Energy	
  Servers
10.Cloud	
  Compu/ng
Gartnerin	
  top	
  10	
  
strategista	
  teknologiaa	
  2013
1. Mobile	
  Devices	
  Ba7les
2. Mobile	
  Applica/ons	
  and	
  HTML5
3. Personal	
  Cloud
4. Internet	
  of	
  Things
5. Hybrid	
  IT	
  and	
  Cloud	
  Compu/ng
6. Strategic	
  Big	
  Data
7. Ac/onable	
  Analy/cs
8. Mainstream	
  In-­‐Memory	
  Compu/ng
9. Integrated	
  Ecosystems
10.	
  Enterprise	
  App	
  Stores
Big	
  Data:	
  datan	
  määrä	
  kasvaa
Pari	
  yleistä	
  kuvaa




 2012       2015           2020
Mistä	
  dataa	
  oikein	
  tulee?




                                     Kuvat: ipcmax.com, polar.fi, facebook.com, twitter.com, apple.com, nokia.com
Vaihtoehtoja	
  on	
  paljon
KäyFökokemuksia




Haasteellisinta big datassa on päästä alkuun.
Osaajapula	
  uhkaa
 “There will be a shortage of talent necessary for
 organizations to take advantage of big data. By 2018,
 the United States alone could face a shortage of
 140,000 to 190,000 people with deep analytical skills
 as well as 1.5 million managers and analysts with the
 know-how to use the analysis of big data to make
 effective decisions.”
 Lähde: McKinsey
Big	
  Data:	
  viitekehyksiä
Big	
  Datan	
  ABC
• Analy/cs	
  (analy2ikka)
  • Data	
  pitää	
  jalostaa	
  informaa2oksi,	
  2edoksi	
  ja	
  ymmärrykseksi.	
  Visualisoin2,	
  
      konkre2soin2,	
  ennusteiden	
  tekeminen,	
  tunnuslukujen	
  laskeminen,	
  korrelaa2oiden	
  
      hakeminen...



• Bandwidth	
  (2etoliikenne)
  • Suurten	
  2etomäärien	
  liiku=elu	
  on	
  yhä	
  useammin	
  pullonkaula.	
  Lähtökohtainen	
  päätös	
  
      siitä,	
  missä	
  2etoja	
  säilytetään	
  ja	
  missä	
  niitä	
  prosessoidaan	
  on	
  yhtä	
  merki=ävä	
  kuin	
  
      käytetyt	
  teknologiat	
  ja	
  analyysin	
  hyödyntämiskohteet.



• Content	
  (sisältö)
  • Edelleen	
  suuri	
  osa	
  2edosta	
  säilytetään,	
  mu=a	
  jätetään	
  käy=ämä=ä	
  tai	
  vielä	
  
      pahempaa:	
  heitetään	
  hukkaan	
  ilman	
  ensimmäistäkään	
  analyysia.


                                                                                                                            Lähde: Netapp.com
Big	
  Datan	
  kolme	
  V-­‐kirjainta	
  (3V)
• Variety	
  (vaihtelevuus)
   • Dataa	
  on	
  strukturoitua	
  ja	
  strukturoimatonta.	
  Molempia	
  pitää	
  pystyä	
  hyödyntämään.



• Velocity	
  (vauh2)
   • Datan	
  määrä	
  kasvaa	
  vauhdilla	
  ja	
  sitä	
  tulee	
  lukema=omista	
  lähteistä.	
  Lähes	
  
       reaaliaikaisen	
  analyysi	
  tavoi=eena.



• Volume	
  (voluumi)
   • Data	
  pitää	
  pystyä	
  analysoimaan	
  ja	
  säily=ämään	
  myöhempää	
  käy=öä	
  varten.




                                                                                                                Lähde: Netapp.com
Big	
  Data:	
  Hadoop
Google	
  Trends:	
  Hadoop




               Onko huomiarvon huippu saavutettu?
Indeed	
  Trends:	
  Hadoop	
  työpaikat




           Työpaikkojen tarjonta nousee nopeasti!
Computerworld.com 24.01.2013
Hadoop
• Avoimen	
  lähdekoodin	
  Apache-­‐projek/,	
  joka	
  on	
  ehkä	
  
  tunnetuin	
  yksi7äinen	
  tuotenimi	
  Big	
  Data-­‐tarjoomista
• Tarkoite7u	
  suurten	
  datamäärien	
  hajaute7uun	
  prosessoin/in
• Asennetaan	
  palvelinklusteriin,	
  joka	
  on	
  vikasietoinen	
  eli	
  
  yksi7äisen	
  palvelimen	
  vikaantuminen	
  ei	
  hai7aa


• Kolme	
  alaprojek/a
  1. Hadoop	
  Common
  2. Hadoop	
  Distributed	
  Filesystem
  3. Hadoop	
  MapReduce
Hadoop	
  MapReduce
                                   DATA
                      Node	
  1.            Node	
  2.

                    “raakadata”            “raakadata”



                        Map                  Map

                    “välitulokset”        “välitulokset”


  Sort and shuffle

                    Reduce                 Reduce

                      HDFS                   HDFS


                     Node	
  1.             Node	
  2.
Hadoop:	
  arkkitehtuuri

                 Master         Master

              Task tracker   Task tracker



              Job tracker
MapReduce
  HDFS        Name node



               Data node     Data node
Mihin	
  Hadoop	
  parhaiten	
  sopii?
• Hadoop on klusteriarkkitehtuurin toteuttava ohjelmisto

• Käyttökelpoinen kun...
  • Nopeus on valttia
  • Tarvitaan skaalautuvuutta!
  • Vikasietoisuus on arvokasta
  • Analysoitavaa dataa on paljon
  • Laitteistoriippumattomuus(?) kiinnostaa
  • Nopeasti kehittyvä ekosysteemi koetaan hyödylliseksi
Hadoopin	
  sisarprojekRt
• HBase
• Hive
• Pig
• Zookeeper


Mitkä ihmeen sisarprojektit? Pelkkä Hadoop on sopimaton moniin
käyttötarkoituksiin ja hyödyntää huonosti olemassa olevaa
osaamista. Sisarprojektit parantavat hallittavuutta, lisäävät
toiminnallisuuksia ja helpottavat käyttöä.
Ketkä	
  käyFävät	
  Hadoopia?
• Facebook
• Walmart
• eBay
• Yahoo

• Hadoop ei millään tavalla ole sidottu suurten yritysten
 käyttöön!

• http://wiki.apache.org/hadoop/PoweredBy
Esimerkki:	
  Facebook
   • Kaksi	
  isoa	
  klusteria:
      • 1	
  100	
  kone7a	
  (8	
  800	
  suori*nta,	
  12	
  PT	
  tallennus*laa)
      • 300	
  kone7a	
  (2	
  400	
  suori*nta,	
  3	
  PT	
  tallennus*laa)



  Facebookilla	
  on	
  n.	
  miljardi	
  käy'äjää.
Hadoop-­‐ekosysteemi
• Moni startup-yritys on rakentanut liiketoimintansa Hadoopin
 ympärille
  • Cloudera
  • Hortonworks
  • MapR

• Hadoop on mukana suuressa osassa big data -tuotteita ja
 palveluita
  • Oracle Big Data Appliance (Cloudera)
  • Teradata Aster Big Analytics Appliance (Hortonworks)
  • IBM InfoSphere BigInsights (Cloudera)
  • Microsoft Azure Hadoop (HDInsight) (Hortonworks)
  • Amazon Web Services EMR (MapR)
Big	
  Data	
  pilvipalveluna
Pilvipalvelut	
  ja	
  big	
  data




Kaksi ilmiötä, yksi tarina?
Hadoop-­‐pilvipalveluiden	
  käyFö
Edut                                       Riskit
  •   Ei investointeja                      •   Tietoturva
  •   Nopea käyttöönotto                    •   Luottamus
  •   Valmis konfiguraatio                   •   SLA
  •   Mahdolliset rajapinnat muihin         •   Latenssi
      palveluihin (esim. S3-tuki)           •   Mahdollisuus palveluehto- ja muihin
  •   Mahdollisuus käyttää                      sopimuksellisiin muutoksiin
      analysointivoimaa myös muuhun kuin    •   Palvelukatkokset ja muut tekniset
      organisaation omaan dataan                ongelmat
  •   Mahdolliset lisäarvoa tuottavat       •   Rajoitettu kustomoitavuus
      lisäpalvelut
Oma	
  Hadoop-­‐klusteri	
  pilvipalveluna
• Välimuoto pilvipalveluna tarjottavalle klusterille (AWS EMR
 tai Microsoft Windows Azure)
  • Rakennetaan oma klusteri pilvipalveluna saatavilla oleville
    palvelimille


  Edut                                 Riskit
    • Kts. edellinen kalvo               • Kts. edellinen kalvo



  Haasteena konfigurointi ja ylläpito
  (kuten omassakin klusterissa, mutta pahempi)
Google	
  Cloud	
  ja	
  Big	
  Data
Google	
  BigQuery
• “Google	
  BigQuery	
  is	
  a	
  web	
  service	
  that	
  lets	
  you	
  do	
  interac2ve	
  analysis	
  of	
  massive	
  datasets
    —up	
  to	
  billions	
  of	
  rows.	
  Scalable	
  and	
  easy	
  to	
  use,	
  BigQuery	
  lets	
  developers	
  and	
  businesses	
  
    tap	
  into	
  powerful	
  data	
  analy2cs	
  on	
  demand.”


    Tarjolla
     • Selainkäy7ölii7ymä
                 • Browser	
  Tool
     • Komentorivityökalu
                 • bq	
  command-­‐line	
  tool
     • API
Google	
  BigQuery	
  esimerkki
Mihin	
  Eufris	
  on	
  erikoistunut?
     • Pilvipalvelut
         • Amazon	
  Web	
  Services
         • Google	
  Cloud
         • Salesforce.com
     • Big	
  Data
         • Hadoop
KIITOS!

More Related Content

What's hot

Big data esitys, 14.11.2013, Ivorio Oy
Big data  esitys, 14.11.2013, Ivorio OyBig data  esitys, 14.11.2013, Ivorio Oy
Big data esitys, 14.11.2013, Ivorio Oyivoriofinland
 
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...ivoriofinland
 
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Digitalmikkeli
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorioivoriofinland
 
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014ivoriofinland
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...ivoriofinland
 
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo Salo
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo SaloCloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo Salo
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo SaloImmo Salo
 
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...ivoriofinland
 
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanTalent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanLoihde Advisory
 

What's hot (10)

Big data esitys, 14.11.2013, Ivorio Oy
Big data  esitys, 14.11.2013, Ivorio OyBig data  esitys, 14.11.2013, Ivorio Oy
Big data esitys, 14.11.2013, Ivorio Oy
 
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
Tietoyhteiskuntasektorin huippuseminaari 8.10.2013 Helsingissä, aiheena "Osaa...
 
Pilvipalvelut 25.4.2016 Jyväskylän kirjasto
Pilvipalvelut 25.4.2016 Jyväskylän kirjastoPilvipalvelut 25.4.2016 Jyväskylän kirjasto
Pilvipalvelut 25.4.2016 Jyväskylän kirjasto
 
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorio
 
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
 
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo Salo
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo SaloCloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo Salo
Cloud computing - palvelut verkossa, Espoo 27.11.2013, Eufris Oy, Immo Salo
 
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
Ivorion esitys Hitachin tilaisuudessa 27.11.2013 Helsingin Casinolla, aiheena...
 
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaanTalent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan
 

Similar to Big Data -esitys, Arcada ammattikorkeakoulu

Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläivoriofinland
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Mika Aho
 
Pilvipalveluiden perusteita, luento 25.4.2016
Pilvipalveluiden perusteita, luento 25.4.2016Pilvipalveluiden perusteita, luento 25.4.2016
Pilvipalveluiden perusteita, luento 25.4.2016Riku E. Järvinen
 
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Management Institute of Finland MIF
 
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihinforumvirium
 
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Bilot
 
Edge Computing 0204020, Telia Inmics-Nebula
Edge Computing 0204020, Telia Inmics-NebulaEdge Computing 0204020, Telia Inmics-Nebula
Edge Computing 0204020, Telia Inmics-NebulaTelia Inmics-Nebula
 
KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013Kari Lehtomaa
 
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminen
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminenYhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminen
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminenFinceptum Oy
 
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Lari Hotari
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master DatanLoihde Advisory
 
AgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenAgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenDigia Plc
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen dataFloApps
 
Julkinen Data Business mallit
Julkinen Data Business mallitJulkinen Data Business mallit
Julkinen Data Business mallitFloApps
 
Tietoturvaa it kehitykselle 12 2012
Tietoturvaa it kehitykselle 12 2012Tietoturvaa it kehitykselle 12 2012
Tietoturvaa it kehitykselle 12 2012Tomppa Järvinen
 
Pilvet ja Office 365 8.12.14
Pilvet ja Office 365 8.12.14Pilvet ja Office 365 8.12.14
Pilvet ja Office 365 8.12.14Matleena Laakso
 
Svenska.yle.fi:n linkitetty semanttinen data
Svenska.yle.fi:n linkitetty semanttinen dataSvenska.yle.fi:n linkitetty semanttinen data
Svenska.yle.fi:n linkitetty semanttinen dataMicke Hindsberg
 
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...Tieturi Oy
 

Similar to Big Data -esitys, Arcada ammattikorkeakoulu (20)

Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:llä
 
Hadoop
HadoopHadoop
Hadoop
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
 
Pilvipalveluiden perusteita, luento 25.4.2016
Pilvipalveluiden perusteita, luento 25.4.2016Pilvipalveluiden perusteita, luento 25.4.2016
Pilvipalveluiden perusteita, luento 25.4.2016
 
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
 
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin
6Aika: Datalähtöistä liiketoimintaa kuutoskaupunkeihin
 
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
 
Big data -strategia
Big data  -strategiaBig data  -strategia
Big data -strategia
 
Edge Computing 0204020, Telia Inmics-Nebula
Edge Computing 0204020, Telia Inmics-NebulaEdge Computing 0204020, Telia Inmics-Nebula
Edge Computing 0204020, Telia Inmics-Nebula
 
KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013
 
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminen
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminenYhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminen
Yhä lisääntyvän tietoturvainformaation tehokas hallinta ja hyödyntäminen
 
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master Datan
 
AgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenAgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti Vartiainen
 
Business models Julkinen data
Business models Julkinen dataBusiness models Julkinen data
Business models Julkinen data
 
Julkinen Data Business mallit
Julkinen Data Business mallitJulkinen Data Business mallit
Julkinen Data Business mallit
 
Tietoturvaa it kehitykselle 12 2012
Tietoturvaa it kehitykselle 12 2012Tietoturvaa it kehitykselle 12 2012
Tietoturvaa it kehitykselle 12 2012
 
Pilvet ja Office 365 8.12.14
Pilvet ja Office 365 8.12.14Pilvet ja Office 365 8.12.14
Pilvet ja Office 365 8.12.14
 
Svenska.yle.fi:n linkitetty semanttinen data
Svenska.yle.fi:n linkitetty semanttinen dataSvenska.yle.fi:n linkitetty semanttinen data
Svenska.yle.fi:n linkitetty semanttinen data
 
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...
Mobiiliaamiainen 8.11.2012: Arto Santala, Android - Jäätelöleivästä hyytelöpa...
 

More from Immo Salo

Webinar: Quantum Revolution Is Here (2022)
Webinar: Quantum Revolution Is Here (2022)Webinar: Quantum Revolution Is Here (2022)
Webinar: Quantum Revolution Is Here (2022)Immo Salo
 
Webinaari: Kvanttivallankumous 03.02.2021
Webinaari: Kvanttivallankumous 03.02.2021Webinaari: Kvanttivallankumous 03.02.2021
Webinaari: Kvanttivallankumous 03.02.2021Immo Salo
 
Smart machines -esitys Tampereella 02/2016
Smart machines -esitys Tampereella 02/2016Smart machines -esitys Tampereella 02/2016
Smart machines -esitys Tampereella 02/2016Immo Salo
 
Smart Machines -presentation May 2015
Smart Machines -presentation May 2015Smart Machines -presentation May 2015
Smart Machines -presentation May 2015Immo Salo
 
Smart machines -presentation, April 2015
Smart machines  -presentation, April 2015Smart machines  -presentation, April 2015
Smart machines -presentation, April 2015Immo Salo
 
Try out Hadoop
Try out HadoopTry out Hadoop
Try out HadoopImmo Salo
 
Smart machines -presentation, Feb 2015
Smart machines -presentation, Feb 2015Smart machines -presentation, Feb 2015
Smart machines -presentation, Feb 2015Immo Salo
 
Smart machines -presentation, January 2015
Smart machines -presentation, January 2015Smart machines -presentation, January 2015
Smart machines -presentation, January 2015Immo Salo
 
Smart Machines -presentation, Dec 2014
Smart Machines -presentation, Dec 2014Smart Machines -presentation, Dec 2014
Smart Machines -presentation, Dec 2014Immo Salo
 
Smart machines -presentation, November 2014
Smart machines -presentation, November 2014Smart machines -presentation, November 2014
Smart machines -presentation, November 2014Immo Salo
 
Smart machines presentation, Oct 2014
Smart machines presentation, Oct 2014Smart machines presentation, Oct 2014
Smart machines presentation, Oct 2014Immo Salo
 
Smart machines, Strategic Technology Trend of 2015
Smart machines, Strategic Technology Trend of 2015Smart machines, Strategic Technology Trend of 2015
Smart machines, Strategic Technology Trend of 2015Immo Salo
 
Smart Machines Oct 2014
Smart Machines Oct 2014Smart Machines Oct 2014
Smart Machines Oct 2014Immo Salo
 
Smart machines - The most disruptive change in the history of IT?
Smart machines - The most disruptive change in the history of IT?Smart machines - The most disruptive change in the history of IT?
Smart machines - The most disruptive change in the history of IT?Immo Salo
 
Smart machines - The Next Hype
Smart machines - The Next HypeSmart machines - The Next Hype
Smart machines - The Next HypeImmo Salo
 
Smart machines - The Hype of 2015
Smart machines - The Hype of 2015Smart machines - The Hype of 2015
Smart machines - The Hype of 2015Immo Salo
 
Smart machines - THe Future Is Here
Smart machines - THe Future Is HereSmart machines - THe Future Is Here
Smart machines - THe Future Is HereImmo Salo
 
Smart Machines Sep 2014
Smart Machines Sep 2014Smart Machines Sep 2014
Smart Machines Sep 2014Immo Salo
 
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo Salo
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo SaloPilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo Salo
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo SaloImmo Salo
 

More from Immo Salo (20)

Webinar: Quantum Revolution Is Here (2022)
Webinar: Quantum Revolution Is Here (2022)Webinar: Quantum Revolution Is Here (2022)
Webinar: Quantum Revolution Is Here (2022)
 
Webinaari: Kvanttivallankumous 03.02.2021
Webinaari: Kvanttivallankumous 03.02.2021Webinaari: Kvanttivallankumous 03.02.2021
Webinaari: Kvanttivallankumous 03.02.2021
 
Smart machines -esitys Tampereella 02/2016
Smart machines -esitys Tampereella 02/2016Smart machines -esitys Tampereella 02/2016
Smart machines -esitys Tampereella 02/2016
 
Smart Machines -presentation May 2015
Smart Machines -presentation May 2015Smart Machines -presentation May 2015
Smart Machines -presentation May 2015
 
Smart machines -presentation, April 2015
Smart machines  -presentation, April 2015Smart machines  -presentation, April 2015
Smart machines -presentation, April 2015
 
Try out Hadoop
Try out HadoopTry out Hadoop
Try out Hadoop
 
Smart machines -presentation, Feb 2015
Smart machines -presentation, Feb 2015Smart machines -presentation, Feb 2015
Smart machines -presentation, Feb 2015
 
Smart machines -presentation, January 2015
Smart machines -presentation, January 2015Smart machines -presentation, January 2015
Smart machines -presentation, January 2015
 
Smart Machines -presentation, Dec 2014
Smart Machines -presentation, Dec 2014Smart Machines -presentation, Dec 2014
Smart Machines -presentation, Dec 2014
 
Haiku Deck
Haiku DeckHaiku Deck
Haiku Deck
 
Smart machines -presentation, November 2014
Smart machines -presentation, November 2014Smart machines -presentation, November 2014
Smart machines -presentation, November 2014
 
Smart machines presentation, Oct 2014
Smart machines presentation, Oct 2014Smart machines presentation, Oct 2014
Smart machines presentation, Oct 2014
 
Smart machines, Strategic Technology Trend of 2015
Smart machines, Strategic Technology Trend of 2015Smart machines, Strategic Technology Trend of 2015
Smart machines, Strategic Technology Trend of 2015
 
Smart Machines Oct 2014
Smart Machines Oct 2014Smart Machines Oct 2014
Smart Machines Oct 2014
 
Smart machines - The most disruptive change in the history of IT?
Smart machines - The most disruptive change in the history of IT?Smart machines - The most disruptive change in the history of IT?
Smart machines - The most disruptive change in the history of IT?
 
Smart machines - The Next Hype
Smart machines - The Next HypeSmart machines - The Next Hype
Smart machines - The Next Hype
 
Smart machines - The Hype of 2015
Smart machines - The Hype of 2015Smart machines - The Hype of 2015
Smart machines - The Hype of 2015
 
Smart machines - THe Future Is Here
Smart machines - THe Future Is HereSmart machines - THe Future Is Here
Smart machines - THe Future Is Here
 
Smart Machines Sep 2014
Smart Machines Sep 2014Smart Machines Sep 2014
Smart Machines Sep 2014
 
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo Salo
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo SaloPilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo Salo
Pilvipalvelut tietoisku, Helsinki 21.11.2013, Eufris Oy, Immo Salo
 

Big Data -esitys, Arcada ammattikorkeakoulu

  • 2. Eufris • Peruste'u  vuonna  2006 • Koulutus-­‐  ja  konsultoin/palveluita,  erikoistunut   pilvipalveluihin • Yri7äjä:  Immo  Salo • Kirjat • “Cloud  compu/ng  -­‐  palvelut  verkossa”,  WSOYPro  2010 • “Hyötyä  pilvipalveluista”,  Docendo  2012 • “Big  Data”,  Docendo  2013  (tulossa) www.eufris.fi www.bigdata.fi
  • 3. Big  Data:  hype  nousee!
  • 4. Google  Trends Web 2.0 Big data Social media Cloud computing
  • 5.
  • 6. Big  Data:  mitä  se  on?
  • 7. Big  Data-­‐määritelmiä "Big data technologies describe a new generation of technologies and architectures, designed to economically extract value from very large volumes of a wide variety of data, by enabling high-velocity capture, discovery, and/or analysis" IDC "Big Data is a technology that helps extract value from the digital universe.” IDC "Techniques and technologies that make handling data at extreme scale economical." Forrester
  • 8. Gartnerin  top  10   strategista  teknologiaa  2012 1. Media  Tablets  and  Beyond 2. Mobile-­‐Centric  Applica/ons  and  Interfaces 3. Contextual  and  Social  User  Experience 4. Internet  of  Things 5. App  Stores  and  Marketplaces 6. Next-­‐Genera/on  Analy/cs 7. Big  Data 8. In-­‐Memory  Compu/ng 9. Extreme  Low-­‐Energy  Servers 10.Cloud  Compu/ng
  • 9. Gartnerin  top  10   strategista  teknologiaa  2013 1. Mobile  Devices  Ba7les 2. Mobile  Applica/ons  and  HTML5 3. Personal  Cloud 4. Internet  of  Things 5. Hybrid  IT  and  Cloud  Compu/ng 6. Strategic  Big  Data 7. Ac/onable  Analy/cs 8. Mainstream  In-­‐Memory  Compu/ng 9. Integrated  Ecosystems 10.  Enterprise  App  Stores
  • 10. Big  Data:  datan  määrä  kasvaa
  • 11. Pari  yleistä  kuvaa 2012 2015 2020
  • 12. Mistä  dataa  oikein  tulee? Kuvat: ipcmax.com, polar.fi, facebook.com, twitter.com, apple.com, nokia.com
  • 15. Osaajapula  uhkaa “There will be a shortage of talent necessary for organizations to take advantage of big data. By 2018, the United States alone could face a shortage of 140,000 to 190,000 people with deep analytical skills as well as 1.5 million managers and analysts with the know-how to use the analysis of big data to make effective decisions.” Lähde: McKinsey
  • 17. Big  Datan  ABC • Analy/cs  (analy2ikka) • Data  pitää  jalostaa  informaa2oksi,  2edoksi  ja  ymmärrykseksi.  Visualisoin2,   konkre2soin2,  ennusteiden  tekeminen,  tunnuslukujen  laskeminen,  korrelaa2oiden   hakeminen... • Bandwidth  (2etoliikenne) • Suurten  2etomäärien  liiku=elu  on  yhä  useammin  pullonkaula.  Lähtökohtainen  päätös   siitä,  missä  2etoja  säilytetään  ja  missä  niitä  prosessoidaan  on  yhtä  merki=ävä  kuin   käytetyt  teknologiat  ja  analyysin  hyödyntämiskohteet. • Content  (sisältö) • Edelleen  suuri  osa  2edosta  säilytetään,  mu=a  jätetään  käy=ämä=ä  tai  vielä   pahempaa:  heitetään  hukkaan  ilman  ensimmäistäkään  analyysia. Lähde: Netapp.com
  • 18. Big  Datan  kolme  V-­‐kirjainta  (3V) • Variety  (vaihtelevuus) • Dataa  on  strukturoitua  ja  strukturoimatonta.  Molempia  pitää  pystyä  hyödyntämään. • Velocity  (vauh2) • Datan  määrä  kasvaa  vauhdilla  ja  sitä  tulee  lukema=omista  lähteistä.  Lähes   reaaliaikaisen  analyysi  tavoi=eena. • Volume  (voluumi) • Data  pitää  pystyä  analysoimaan  ja  säily=ämään  myöhempää  käy=öä  varten. Lähde: Netapp.com
  • 20. Google  Trends:  Hadoop Onko huomiarvon huippu saavutettu?
  • 21. Indeed  Trends:  Hadoop  työpaikat Työpaikkojen tarjonta nousee nopeasti!
  • 23. Hadoop • Avoimen  lähdekoodin  Apache-­‐projek/,  joka  on  ehkä   tunnetuin  yksi7äinen  tuotenimi  Big  Data-­‐tarjoomista • Tarkoite7u  suurten  datamäärien  hajaute7uun  prosessoin/in • Asennetaan  palvelinklusteriin,  joka  on  vikasietoinen  eli   yksi7äisen  palvelimen  vikaantuminen  ei  hai7aa • Kolme  alaprojek/a 1. Hadoop  Common 2. Hadoop  Distributed  Filesystem 3. Hadoop  MapReduce
  • 24. Hadoop  MapReduce DATA Node  1. Node  2. “raakadata” “raakadata” Map Map “välitulokset” “välitulokset” Sort and shuffle Reduce Reduce HDFS HDFS Node  1. Node  2.
  • 25. Hadoop:  arkkitehtuuri Master Master Task tracker Task tracker Job tracker MapReduce HDFS Name node Data node Data node
  • 26. Mihin  Hadoop  parhaiten  sopii? • Hadoop on klusteriarkkitehtuurin toteuttava ohjelmisto • Käyttökelpoinen kun... • Nopeus on valttia • Tarvitaan skaalautuvuutta! • Vikasietoisuus on arvokasta • Analysoitavaa dataa on paljon • Laitteistoriippumattomuus(?) kiinnostaa • Nopeasti kehittyvä ekosysteemi koetaan hyödylliseksi
  • 27. Hadoopin  sisarprojekRt • HBase • Hive • Pig • Zookeeper Mitkä ihmeen sisarprojektit? Pelkkä Hadoop on sopimaton moniin käyttötarkoituksiin ja hyödyntää huonosti olemassa olevaa osaamista. Sisarprojektit parantavat hallittavuutta, lisäävät toiminnallisuuksia ja helpottavat käyttöä.
  • 28. Ketkä  käyFävät  Hadoopia? • Facebook • Walmart • eBay • Yahoo • Hadoop ei millään tavalla ole sidottu suurten yritysten käyttöön! • http://wiki.apache.org/hadoop/PoweredBy
  • 29. Esimerkki:  Facebook • Kaksi  isoa  klusteria: • 1  100  kone7a  (8  800  suori*nta,  12  PT  tallennus*laa) • 300  kone7a  (2  400  suori*nta,  3  PT  tallennus*laa) Facebookilla  on  n.  miljardi  käy'äjää.
  • 30. Hadoop-­‐ekosysteemi • Moni startup-yritys on rakentanut liiketoimintansa Hadoopin ympärille • Cloudera • Hortonworks • MapR • Hadoop on mukana suuressa osassa big data -tuotteita ja palveluita • Oracle Big Data Appliance (Cloudera) • Teradata Aster Big Analytics Appliance (Hortonworks) • IBM InfoSphere BigInsights (Cloudera) • Microsoft Azure Hadoop (HDInsight) (Hortonworks) • Amazon Web Services EMR (MapR)
  • 32. Pilvipalvelut  ja  big  data Kaksi ilmiötä, yksi tarina?
  • 33. Hadoop-­‐pilvipalveluiden  käyFö Edut Riskit • Ei investointeja • Tietoturva • Nopea käyttöönotto • Luottamus • Valmis konfiguraatio • SLA • Mahdolliset rajapinnat muihin • Latenssi palveluihin (esim. S3-tuki) • Mahdollisuus palveluehto- ja muihin • Mahdollisuus käyttää sopimuksellisiin muutoksiin analysointivoimaa myös muuhun kuin • Palvelukatkokset ja muut tekniset organisaation omaan dataan ongelmat • Mahdolliset lisäarvoa tuottavat • Rajoitettu kustomoitavuus lisäpalvelut
  • 34. Oma  Hadoop-­‐klusteri  pilvipalveluna • Välimuoto pilvipalveluna tarjottavalle klusterille (AWS EMR tai Microsoft Windows Azure) • Rakennetaan oma klusteri pilvipalveluna saatavilla oleville palvelimille Edut Riskit • Kts. edellinen kalvo • Kts. edellinen kalvo Haasteena konfigurointi ja ylläpito (kuten omassakin klusterissa, mutta pahempi)
  • 35. Google  Cloud  ja  Big  Data
  • 36. Google  BigQuery • “Google  BigQuery  is  a  web  service  that  lets  you  do  interac2ve  analysis  of  massive  datasets —up  to  billions  of  rows.  Scalable  and  easy  to  use,  BigQuery  lets  developers  and  businesses   tap  into  powerful  data  analy2cs  on  demand.” Tarjolla • Selainkäy7ölii7ymä • Browser  Tool • Komentorivityökalu • bq  command-­‐line  tool • API
  • 38. Mihin  Eufris  on  erikoistunut? • Pilvipalvelut • Amazon  Web  Services • Google  Cloud • Salesforce.com • Big  Data • Hadoop