SlideShare ist ein Scribd-Unternehmen logo
1 von 21
+




    Skladišta podataka
    Data WareHouse
    By: Krunoslav Ris
    CEO @ BetaWare d.o.o. | FlyStartup
+
    Definicija

       Sam pojam "skladište podataka" (engl. Data Warehouse)
        podrazumijeva zbirku podataka izoliranih iz operativnih baza i
        spremljenih u posebne baze odnosno skladišta podataka.

       Glavna karakteristika koja određuje skladište podataka odnosi
        se na njegovu svrhu

       Prema definiciji koju je postavio William H. Inmon, skladište
        podataka predstavlja subjektni usmjeren (subject-oriented),
        integrirani (integrated), vezan na vrijeme (time-variant) i
        sadržajno nepromjenjiv (non-volatile) skup podataka, a krajnji
        cilj mu je pomoć menadžmentu pri donošenju odluka.
+
    Definicija

       Subjektni usmjerenost podataka - znači da se oni organizuju oko
        predmeta, na način da daju informacije o točno određenim predmetima u
        okviru funkcionalnih područja (npr. u okviru prodaje, nabave.) Umjesto o
        tekućim operacijama poduzeća. Suprotno tome operativne baze podataka
        organizirane oko poslovnih aplikacija, dakle usmjerene su na tekuće
        operacije (npr. obrade narudžbi, isporuka i sl..).

       Integriranost - podaci se skupljaju u bazu podataka iz različitih izvora i
        pohranjuju uvijek u istom formatu, te su konzistentni i prikazuju se na
        dosljedan način.

       Vezanost uz vrijeme - svi podaci u skladištu podataka vezani su i
        identificiraju se uz određeni vremenski period, što znači da imaju povijesni
        karakter. Za razliku od njih, u operativnim bazama podataka pohranjeni su
        samo aktualni, najsvježiji podaci. Međutim, s gledišta koncepta poslovne
        inteligencije, sveobuhvatno predviđanja budućih događaja nije moguće
        provesti bez poznavanja povijesti istih ili nekih drugih događaja. Iz toga
        toki da premda podaci u skladištu podataka odražavaju prošlost, njihova
        usmjerenost je okrenuta budućnosti.
+
    Osnove skladištenja podataka

       sustavi 70-tih godina su bili monolitni sustavi sa centraliziranim
        “mainframe” računalom-naslijedeni sustavi (engl. Legacy
        systems)
       80-tih godina dolazi do popularizacije osobnih računala
       vrhunac sustava za analizu prije pojave skladištenja podataka
        bili su sustavi za potporu odlučivanju i izvršni informacijski
        sustavi
       pojava koncepta Intraneta i korištenja web baziranih aplikacija-
        putem Intraneta podaci u skladištu podataka postaju dostupni
        svima unutar kompanije
       Skladištenje podataka je novi koncept koji se pojavio sredinom
        90-tih godina 20. stoljeća
+
    Značajke skladišta podataka

       pristup podacima je najefikasniji ako su ti podaci odvojeni od
        podataka pohranjenih u operacijskim sustavima
       jedan od razloga za razdvajanje je da podaci u skladište
        podataka mogu doći i iz više izvora
       Takoder bitan razlog je da se procesi obrade transakcije i
        analize podataka bitno razlikuju odnosno da postoji razlika
        između transakcijskih (operacijskih) sustava i sustava za
        analizu
       transakcijski sustav (često se naziva i OLTP – On-Line
        Transaction Processing) pridaje najveću važnost raspoloživosti
        i brzini obrade i ne smije se dozvoliti da analiza podataka
        dovede do degradacija performansi transakcijskog sustava-
        ključni razlog razdvajanja
+
    Značajke skladišta podataka




              Razlike između OLTP i skladišta podataka
+
    Ciljevi skladištenja podataka

       Skladište podataka mora omogućiti pristup podacima bitnim za neku
        organizaciju ili kompaniju
       Podaci u skladištu podataka moraju biti konzistentni
       Podaci se u skladištu podataka mogu kombinirati na sve moguće
        načine (engl. dice and slice requirement)
       Skladište podataka nisu samo podaci, već ono mora sadržavati i skup
        alata za postavljanje upita (engl. query tools), alata za analizu i
        predstavljanje informacije
       Skladište podataka je mjesto gdje se objavljuju korišteni podaci
       Kvaliteta podataka u skladištu je pokretač poslovnog restrukturiranja
+
    Što je to OLAP ?

       Izrazom “On-Line Analytical Processing” (OLAP) označena je
        kategorija softverske tehnologije koja omogućava korisnicima
        (analitičarima, menadžerima) da steknu uvid u podatke kroz
        brz, konzistentan, interaktivan pristup različitim mogućim
        pogledima na informacije transformirane iz sirovih podataka da
        bi odrazile stvarnu dimenzionalnost poslovanja kako ga shvača
        korisnik
+
    Što je to OLAP ?
+
    Što je to OLAP ?

       OLAP je pojam koji izvorno potiče od E.F. Codda, a opisuje
        informacijski sustav za brz, konzistentan i interaktivan pristup i
        manipulaciju multidimenzionalnim podacima koji dolaze iz različitih
        izvora, a spremljeni su u skladištu podataka

       Funkcionalnost OLAP-a ostvarena je kroz mogućnost
        multidimenzionalnih analiza konsolidiranih korporativnih
        podataka koje uključuju: modeliranje korištenjem dimenzija i
        hijerarhija podataka, analize trendova kroz određena
        vremenska razdoblja, projekciju podataka kroz what-if
        scenarije, podskupove podataka, bušenje (drill down) do nižih
        nivoa detaljnosti podataka

       OLAP je obično implementiran u klijent-server okruženju
+
    Što je to OLAP ?

       OLAP postoji u dva temeljna oblika s obzirom na formu u kojoj
        su podaci spremljeni: relacijski (ROLAP-Relational On Line
        Analitycal Processing) i multidimenzionalni (MOLAP-
        Multidimensional On Line Analitycal Processing), te u
        hibridnom obliku (HOLAP-Hybrid On Line Analitycal
        Processing) koji za više nivoe sumarizacije koristi
        multidimenzionalni oblik, ali omogućuje dril-down do nižih nivoa
        sumarizacije koji su smješteni u relacijskoj tablici

       U posljednje vrijeme koristi se i izraz FASMI - Fast Analysis of
        Shared Multidimenzional Data
+
    Što je to OLAP ?
+
    Osnovni modeli skladišta podataka

       Prilikom kreiranja skladišta podataka danas u praksi
        susrećemo tri osnovna modela ili osnovne arhitekture skladišta
        podataka: dvoslojna arhitektura s jednim zajedničkim
        skladištem podataka, dvoslojna arhitektura s više nezavisnih
        lokalnih spremišta podataka (engl. Data Marts) i troslojna
        arhitektura sa zajedničkim skladištem podataka i više
        povezanih lokalnih skladišta podataka
            Dvoslojna arhitektura s jednim zajedničkim skladištem podataka
           Dvoslojna arhitektura s više nezavisnih lokalnih skladišta podataka
           Troslojna arhitektura skladišta podataka
+ Dvoslojna arhitektura s jednim zajedničkim skladištem
  podataka


     Ovaj model karakterizira jedinstveno, zajedničko centralizirano skladište
      podataka.

     Podaci se zaprimaju iz različitih izvora unutar organizacije (npr. podaci iz
      online sustava za obradu transakcija, podaci iz ranije razvijenih sustava
      koji održavaju baze podataka itd..) I vanjskih izvora podataka dostupnih
      putem interneta ili nekim drugim načinima.

     Karakteristika dvoslojne arhitekture skladišta je da ono služi većem broju
      organizacijskih jedinica poduzeća kao i pojedinačnim korisnicima. Takva
      skladišta su velikog opsega i vrlo složena, au njima se u pravilu pohranjuje
      ogromna količina podataka. Pa i sheme podataka prema kojima se vrši
      pohranjivanje podataka trebaju podržavati široku lepezu aplikacijskih
      zahtjeva. Iz navedenog je vidljivo da su troškovi održavanja takve
      arhitekture visoki i pretpostavljaju znatan angažman i vrijeme određenog
      broja i profila stručnjaka.
+ Dvoslojna arhitektura s više nezavisnih lokalnih
  skladišta podataka


     Karakteristika ove arhitekture skladišta podataka je postojanje većeg broja
      nezavisnih lokalnih spremišta podataka namijenjenih za podržavanje
      pojedinačnih aplikacija po organizacijskim jedinicama poduzeća. Rezultat
      takve arhitekture je velik broj sustava koji svaki posebno zaprimaju "svoje"
      podatke iz različitih transakcijskih baza podataka. Prednost navedenog
      modela skladišta podataka je jednostavnija izgradnja i lakše korištenje.
      Međutim takav model ima i nedostatke kao što su:
         otežana komunikacija među organizacijskim jedinicama poduzeća.
         povećanjem broja međusobno neovisnih skladišta podataka, usporedno raste i
          opterećenost samih transakcijskih sustava,
         data mart-ovi oblikovani su tako da podržavaju samo jednu aplikaciju, pa
          naknadno dodavanje novih aplikacija u određeno skladište predstavlja poteškoće,
         ograničena skalabilnost platforme i
         otežan je uvid u stvarno stanje informacija na razini poduzeća
+
    Troslojna arhitektura skladišta
    podataka
       Ovaj model sastoji se od većeg broja lokalnih skladišta podataka i
        jednog zajedničkog skladišta podataka koje je smješteno između
        skladišta podataka i različitih izvora podataka unutar i izvan
        poduzeća. Skladišta podataka oslanjaju se na centralno skladište
        podataka koje im isporučuje podatke u obliku koji daje ujednačen
        uvid u sve segmente poslovanja poduzeća.

       U odnosu na prethodna dva modela prednosti troslojne arhitekture
        su veća točnost informacija nevezano s kojeg izvora su
        zahvaćene, olakšana je komunikacija među organizacijskim
        jedinicama, smanjena je opterećenost informatičara, povećana je
        skalabilnost i proširivost platforme za pohranu podataka i na kraju
        ova arhitektura pruža mogućnost korištenja vanjskih aplikacija
        čime se omogućuje povezivanje svih subjekata u lancu vrijednosti.
+
    Troslojna arhitektura skladišta
    podataka




              Istorijski podaci
+
    Višedimenzionalni prikaz podataka

       Skladište podataka, kao što je ranije rečeno, puni se izvorima
        podataka unutar organizacije (transakcijske baze) kao i vanjskim
        izvorima podataka. Postupcima ekstrakcije, transformacije i
        punjenja kojima se zaprimaju podaci iz unutarnjih i vanjskih izvora
        dobivaju se osnovni podaci skladišta.

       Za vizualni prikaz dimenzionalnog modela podataka koristi se tzv.
        zvijezda shema (star shema) jer dijagram ima izgled zvijezde, kao
        što je prethodno navedeno - jednu središnju veliku relacijsku
        tablicu koja se naziva i tablicom činjenica (engl. fact table) i skup
        manjih tablica.

       Dimenzione tablice posjeduju određene atribute, odnosno pozicije
        dimenzija i predstavljaju mogućnosti koje prikazuju neku pojavu,
        npr.. otpremu određenog proizvoda
+
    Višedimenzionalni prikaz podataka
+
    Višedimenzionalni prikaz podataka

       Centralni dio sheme, tablica činjenica, predstavlja središnji dio
        koordinacije, koji uz osnovne podatke o šiframa relacijskih tablica
        koje su objedinjene u strukturu, može sadržavati i ostale segmente
        informacija.

       Višedimenzionalna struktura podataka pruža velike mogućnosti za
        otkrivanje mnogih detalja različitim postupcima analitičke obrade
        kao što su agregacija i detaljizacija ili svrdlanje (drill up, drill
        down, drill through), unakrsno tabeliranje (cross tabulation),
        selekcija, isijecanje, izdvajanje i kombiniranje svih dimenzija (slice
        and dice requirement), rotacija odnosno isticanje jedne dimenzije
        dok su druge u pozadini (pivoting), prognoza, modeliranje, grafički
        prikaz (charting), statistike analize (trend, klaster) itd..
+
    Zaključak

       Skladištenje podataka – Data-Warehouse je posebno projektirano tehnološko okruženje koje
        omogućuje objedinjavanje srodnih podataka u oblik pogodan za analizu čime se olakšava proces
        donošenja odluka i daje novi pristup sustavima za potporu odlučivanju. Ovaj koncept osigurava
        fleksibilan, učinkovit način raspolaganja podataka u formatu pogodnom za suvremene poslovne
        aplikacije. Postojanje skladišta podataka kao bogato informacijama integrirano okruženje orijentirano
        je ka potrebama krajnjih korisnika koji uz pomoć alata za poslovno odlučivanje mogu donositi
        pravovremene i kvalitetne poslovne odluke.

       Omogućuje stalno pronalaženje novih informacija namijenjenih menadžerima, a služe im
        prvenstveno za strateško, taktičko i operativno donošenje odluka. Uvođenjem koncepta skladištenja
        podataka, operativne baze prestaju biti opterećene složenim upitima, pa cijeli informacijski sustav
        koji se sad sastoji od dva dijela, operativnog i skladišta podataka postaje produktivniji i lakše se
        kontrolira i restrukturira.

       Metode skladištenja podataka sve više postaju integrirane u softverske pakete temeljnog
        informacijskog sustava poduzeća, novije verzije relacijskih baza podataka (kao npr.. Oracle i SQL
        server) imaju dio za Data Warehousing integriran u svom paketu kao OLAP. Menadžmentu nije
        potreban angažman analitičara za obradu ključnih pokazatelja o stanju poduzeća, već takve podatke
        klikom miša mogu dobiti obrađene iz baze podataka, te koristiti kao pomoć u donošenju poslovnih
        odluka.

       Načela upravljanja prema ciljevima (Management by Objectives) će biti podržana mogućnostima
        online pristupa bazama i skladištima podataka, kroz alate poslovne inteligencije. Koncept skladišta
        podataka usklađivanjem podataka omogućuje jedinstvenu istinu o poduzeću, što povećava
        kredibilitet informacijskog sustava.

Weitere ähnliche Inhalte

Andere mochten auch

Baze podataka - Stefan Nikolić - Silvana Ivković
Baze podataka - Stefan Nikolić - Silvana IvkovićBaze podataka - Stefan Nikolić - Silvana Ivković
Baze podataka - Stefan Nikolić - Silvana IvkovićNašaŠkola.Net
 
Baze podataka besplatno (1)
Baze podataka besplatno (1)Baze podataka besplatno (1)
Baze podataka besplatno (1)ivankraljevic
 
Uvod u baze podataka singidunum
Uvod u baze podataka singidunumUvod u baze podataka singidunum
Uvod u baze podataka singidunumMarija Starcevic
 
Kreiranje baze podataka u Access-u
Kreiranje baze podataka u Access-uKreiranje baze podataka u Access-u
Kreiranje baze podataka u Access-uDejan Pejčić
 
Funkcije baze podataka u Excel-u Micovic ljiljana
Funkcije baze podataka u Excel-u Micovic ljiljanaFunkcije baze podataka u Excel-u Micovic ljiljana
Funkcije baze podataka u Excel-u Micovic ljiljanaDejan Pejčić
 
Is Mobile the Prescription for Sustained Behavior Change?
Is Mobile the Prescription for Sustained Behavior Change?Is Mobile the Prescription for Sustained Behavior Change?
Is Mobile the Prescription for Sustained Behavior Change?HealthInnoventions
 
Pemberlakuan Standar English As Second Language (ESL)
Pemberlakuan Standar English As Second Language (ESL)Pemberlakuan Standar English As Second Language (ESL)
Pemberlakuan Standar English As Second Language (ESL)Yekti Hanani
 
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013Spreadsheets And Stories: STP & A presentation, Oct 26, 2013
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013Snow Dowd
 
India_alumni_newsletter_December2016_opt
India_alumni_newsletter_December2016_optIndia_alumni_newsletter_December2016_opt
India_alumni_newsletter_December2016_optSuneet Saxena
 

Andere mochten auch (20)

Baze podataka - Stefan Nikolić - Silvana Ivković
Baze podataka - Stefan Nikolić - Silvana IvkovićBaze podataka - Stefan Nikolić - Silvana Ivković
Baze podataka - Stefan Nikolić - Silvana Ivković
 
Baze podataka
Baze podatakaBaze podataka
Baze podataka
 
Baze podataka besplatno (1)
Baze podataka besplatno (1)Baze podataka besplatno (1)
Baze podataka besplatno (1)
 
Baze podataka i SQL - Vlatko Vlahek
Baze podataka i SQL - Vlatko VlahekBaze podataka i SQL - Vlatko Vlahek
Baze podataka i SQL - Vlatko Vlahek
 
I to je to a
I to je to aI to je to a
I to je to a
 
Uvod u baze podataka singidunum
Uvod u baze podataka singidunumUvod u baze podataka singidunum
Uvod u baze podataka singidunum
 
Baze podataka
Baze podatakaBaze podataka
Baze podataka
 
Baze podataka
Baze podatakaBaze podataka
Baze podataka
 
Baza podataka
Baza podatakaBaza podataka
Baza podataka
 
Kreiranje baze podataka u Access-u
Kreiranje baze podataka u Access-uKreiranje baze podataka u Access-u
Kreiranje baze podataka u Access-u
 
Funkcije baze podataka u Excel-u Micovic ljiljana
Funkcije baze podataka u Excel-u Micovic ljiljanaFunkcije baze podataka u Excel-u Micovic ljiljana
Funkcije baze podataka u Excel-u Micovic ljiljana
 
Mekong river part 1
Mekong river part 1Mekong river part 1
Mekong river part 1
 
Δ. Χαρά ασκ.18σελ.134
Δ. Χαρά   ασκ.18σελ.134Δ. Χαρά   ασκ.18σελ.134
Δ. Χαρά ασκ.18σελ.134
 
Is Mobile the Prescription for Sustained Behavior Change?
Is Mobile the Prescription for Sustained Behavior Change?Is Mobile the Prescription for Sustained Behavior Change?
Is Mobile the Prescription for Sustained Behavior Change?
 
Current event
Current eventCurrent event
Current event
 
Pemberlakuan Standar English As Second Language (ESL)
Pemberlakuan Standar English As Second Language (ESL)Pemberlakuan Standar English As Second Language (ESL)
Pemberlakuan Standar English As Second Language (ESL)
 
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013Spreadsheets And Stories: STP & A presentation, Oct 26, 2013
Spreadsheets And Stories: STP & A presentation, Oct 26, 2013
 
India_alumni_newsletter_December2016_opt
India_alumni_newsletter_December2016_optIndia_alumni_newsletter_December2016_opt
India_alumni_newsletter_December2016_opt
 
Cертификация на Pmp в Уфе 02.02.2015
Cертификация на Pmp в Уфе 02.02.2015Cертификация на Pmp в Уфе 02.02.2015
Cертификация на Pmp в Уфе 02.02.2015
 
Factor de reduccion
Factor de reduccionFactor de reduccion
Factor de reduccion
 

Ähnlich wie Data WareHose

Algoritmi i strukture_podataka_2016-05_v01
Algoritmi i strukture_podataka_2016-05_v01Algoritmi i strukture_podataka_2016-05_v01
Algoritmi i strukture_podataka_2016-05_v01Leonardo Miljko
 
Mihovil Rister nerelacijaka sadašnjost, budućnost i primjene rev 1.4
Mihovil Rister  nerelacijaka sadašnjost, budućnost i primjene rev 1.4Mihovil Rister  nerelacijaka sadašnjost, budućnost i primjene rev 1.4
Mihovil Rister nerelacijaka sadašnjost, budućnost i primjene rev 1.4Mihovil Rister
 
White paper - Privatnost i sigurnost podataka u HT Cloudu
White paper - Privatnost i sigurnost podataka u HT ClouduWhite paper - Privatnost i sigurnost podataka u HT Cloudu
White paper - Privatnost i sigurnost podataka u HT ClouduHrvatski Telekom
 
White paper - Migracija IT rješenja u Cloud Hrvatskog Telekoma
White paper - Migracija IT rješenja u Cloud Hrvatskog TelekomaWhite paper - Migracija IT rješenja u Cloud Hrvatskog Telekoma
White paper - Migracija IT rješenja u Cloud Hrvatskog TelekomaHrvatski Telekom
 
Razvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustavaRazvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustavaSlaven Brumec
 
Case study - Unapređenje IT sustava maloprodaje u Varteksu
Case study - Unapređenje IT sustava maloprodaje u VarteksuCase study - Unapređenje IT sustava maloprodaje u Varteksu
Case study - Unapređenje IT sustava maloprodaje u VarteksuHrvatski Telekom
 
The optimization model of investments in IT infrastructure availability usin...
The optimization model of  investments in IT infrastructure availability usin...The optimization model of  investments in IT infrastructure availability usin...
The optimization model of investments in IT infrastructure availability usin...Semir Ibrahimovic
 
Auditing of user activity through NoSQL database
Auditing of user activity through NoSQL databaseAuditing of user activity through NoSQL database
Auditing of user activity through NoSQL databaseKristijan Duvnjak
 
White paper - Cloud Server, Cloud Data centar i njhova primjena
White paper - Cloud Server, Cloud Data centar i njhova primjenaWhite paper - Cloud Server, Cloud Data centar i njhova primjena
White paper - Cloud Server, Cloud Data centar i njhova primjenaHrvatski Telekom
 
Cloud computing: zašto i kako?
Cloud computing: zašto i kako?Cloud computing: zašto i kako?
Cloud computing: zašto i kako?Tomislav Lulic
 
(Windays 13) Microsoft Big Data Platform
(Windays 13) Microsoft Big Data Platform(Windays 13) Microsoft Big Data Platform
(Windays 13) Microsoft Big Data PlatformLuka Lovosevic
 
Upotreba i kreiranje baze podataka
Upotreba i kreiranje baze podatakaUpotreba i kreiranje baze podataka
Upotreba i kreiranje baze podatakaKristinaGoranovi
 
Analiza softverske imovine koju koristite - prvi korak migraciji u Cloud
Analiza softverske imovine koju koristite - prvi korak migraciji u CloudAnaliza softverske imovine koju koristite - prvi korak migraciji u Cloud
Analiza softverske imovine koju koristite - prvi korak migraciji u CloudTomislav Lulic
 
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...Goran Krmpotić
 
Microsoft Community sastanak - Vođenje softverske imovine
Microsoft Community sastanak - Vođenje softverske imovineMicrosoft Community sastanak - Vođenje softverske imovine
Microsoft Community sastanak - Vođenje softverske imovineTomislav Lulic
 

Ähnlich wie Data WareHose (20)

Algoritmi i strukture_podataka_2016-05_v01
Algoritmi i strukture_podataka_2016-05_v01Algoritmi i strukture_podataka_2016-05_v01
Algoritmi i strukture_podataka_2016-05_v01
 
Mihovil Rister nerelacijaka sadašnjost, budućnost i primjene rev 1.4
Mihovil Rister  nerelacijaka sadašnjost, budućnost i primjene rev 1.4Mihovil Rister  nerelacijaka sadašnjost, budućnost i primjene rev 1.4
Mihovil Rister nerelacijaka sadašnjost, budućnost i primjene rev 1.4
 
Javantura Zagreb 2014 - Alfresco-Neo4j integracija - Damir Murat
Javantura Zagreb 2014 - Alfresco-Neo4j integracija - Damir MuratJavantura Zagreb 2014 - Alfresco-Neo4j integracija - Damir Murat
Javantura Zagreb 2014 - Alfresco-Neo4j integracija - Damir Murat
 
White paper - Privatnost i sigurnost podataka u HT Cloudu
White paper - Privatnost i sigurnost podataka u HT ClouduWhite paper - Privatnost i sigurnost podataka u HT Cloudu
White paper - Privatnost i sigurnost podataka u HT Cloudu
 
White paper - Migracija IT rješenja u Cloud Hrvatskog Telekoma
White paper - Migracija IT rješenja u Cloud Hrvatskog TelekomaWhite paper - Migracija IT rješenja u Cloud Hrvatskog Telekoma
White paper - Migracija IT rješenja u Cloud Hrvatskog Telekoma
 
Razvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustavaRazvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustava
 
Informacijski sustavi - Maja Petras i Antonia Oršolić
Informacijski sustavi - Maja Petras i Antonia OršolićInformacijski sustavi - Maja Petras i Antonia Oršolić
Informacijski sustavi - Maja Petras i Antonia Oršolić
 
Case study - Unapređenje IT sustava maloprodaje u Varteksu
Case study - Unapređenje IT sustava maloprodaje u VarteksuCase study - Unapređenje IT sustava maloprodaje u Varteksu
Case study - Unapređenje IT sustava maloprodaje u Varteksu
 
The optimization model of investments in IT infrastructure availability usin...
The optimization model of  investments in IT infrastructure availability usin...The optimization model of  investments in IT infrastructure availability usin...
The optimization model of investments in IT infrastructure availability usin...
 
Auditing of user activity through NoSQL database
Auditing of user activity through NoSQL databaseAuditing of user activity through NoSQL database
Auditing of user activity through NoSQL database
 
JavaCro'14 - Auditing of user activity through NoSQL database – Kristijan Duv...
JavaCro'14 - Auditing of user activity through NoSQL database – Kristijan Duv...JavaCro'14 - Auditing of user activity through NoSQL database – Kristijan Duv...
JavaCro'14 - Auditing of user activity through NoSQL database – Kristijan Duv...
 
White paper - Cloud Server, Cloud Data centar i njhova primjena
White paper - Cloud Server, Cloud Data centar i njhova primjenaWhite paper - Cloud Server, Cloud Data centar i njhova primjena
White paper - Cloud Server, Cloud Data centar i njhova primjena
 
Cloud computing: zašto i kako?
Cloud computing: zašto i kako?Cloud computing: zašto i kako?
Cloud computing: zašto i kako?
 
(Windays 13) Microsoft Big Data Platform
(Windays 13) Microsoft Big Data Platform(Windays 13) Microsoft Big Data Platform
(Windays 13) Microsoft Big Data Platform
 
Upotreba i kreiranje baze podataka
Upotreba i kreiranje baze podatakaUpotreba i kreiranje baze podataka
Upotreba i kreiranje baze podataka
 
Analiza softverske imovine koju koristite - prvi korak migraciji u Cloud
Analiza softverske imovine koju koristite - prvi korak migraciji u CloudAnaliza softverske imovine koju koristite - prvi korak migraciji u Cloud
Analiza softverske imovine koju koristite - prvi korak migraciji u Cloud
 
JavaCro'14 - Log as basis for distributed systems – Vjeran Marčinko
JavaCro'14 - Log as basis for distributed systems – Vjeran MarčinkoJavaCro'14 - Log as basis for distributed systems – Vjeran Marčinko
JavaCro'14 - Log as basis for distributed systems – Vjeran Marčinko
 
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...
Goran Krmpotić_Suvremeni sustavi za kadrovsku evidenciju, evidenciju radnog v...
 
Microsoft Community sastanak - Vođenje softverske imovine
Microsoft Community sastanak - Vođenje softverske imovineMicrosoft Community sastanak - Vođenje softverske imovine
Microsoft Community sastanak - Vođenje softverske imovine
 
JavaCro'14 - Is there a single “correct” web architecture for business apps –...
JavaCro'14 - Is there a single “correct” web architecture for business apps –...JavaCro'14 - Is there a single “correct” web architecture for business apps –...
JavaCro'14 - Is there a single “correct” web architecture for business apps –...
 

Mehr von Kruno Ris

Digital Transformation
Digital TransformationDigital Transformation
Digital TransformationKruno Ris
 
Marketing u startup tvrtkama
Marketing u startup tvrtkamaMarketing u startup tvrtkama
Marketing u startup tvrtkamaKruno Ris
 
Poduzetnici nisu zli, oni pokreću
Poduzetnici nisu zli, oni pokrećuPoduzetnici nisu zli, oni pokreću
Poduzetnici nisu zli, oni pokrećuKruno Ris
 
Tjedan mobilnosti studenata
Tjedan mobilnosti studenataTjedan mobilnosti studenata
Tjedan mobilnosti studenataKruno Ris
 
AngularJS - Ivan Vučičević
AngularJS - Ivan Vučičević AngularJS - Ivan Vučičević
AngularJS - Ivan Vučičević Kruno Ris
 
BetaWare d.o.o. ukratko
BetaWare d.o.o. ukratkoBetaWare d.o.o. ukratko
BetaWare d.o.o. ukratkoKruno Ris
 
FlyStartup | Seminar o poduzetništvu
FlyStartup | Seminar o poduzetništvuFlyStartup | Seminar o poduzetništvu
FlyStartup | Seminar o poduzetništvuKruno Ris
 
Ekspertni sustavi
Ekspertni sustaviEkspertni sustavi
Ekspertni sustaviKruno Ris
 
Mobile development
Mobile developmentMobile development
Mobile developmentKruno Ris
 
Elektronsko poslovanje mPayment
Elektronsko poslovanje mPaymentElektronsko poslovanje mPayment
Elektronsko poslovanje mPaymentKruno Ris
 

Mehr von Kruno Ris (12)

Digital Transformation
Digital TransformationDigital Transformation
Digital Transformation
 
Marketing u startup tvrtkama
Marketing u startup tvrtkamaMarketing u startup tvrtkama
Marketing u startup tvrtkama
 
CityHub
CityHubCityHub
CityHub
 
Poduzetnici nisu zli, oni pokreću
Poduzetnici nisu zli, oni pokrećuPoduzetnici nisu zli, oni pokreću
Poduzetnici nisu zli, oni pokreću
 
CityHub
CityHubCityHub
CityHub
 
Tjedan mobilnosti studenata
Tjedan mobilnosti studenataTjedan mobilnosti studenata
Tjedan mobilnosti studenata
 
AngularJS - Ivan Vučičević
AngularJS - Ivan Vučičević AngularJS - Ivan Vučičević
AngularJS - Ivan Vučičević
 
BetaWare d.o.o. ukratko
BetaWare d.o.o. ukratkoBetaWare d.o.o. ukratko
BetaWare d.o.o. ukratko
 
FlyStartup | Seminar o poduzetništvu
FlyStartup | Seminar o poduzetništvuFlyStartup | Seminar o poduzetništvu
FlyStartup | Seminar o poduzetništvu
 
Ekspertni sustavi
Ekspertni sustaviEkspertni sustavi
Ekspertni sustavi
 
Mobile development
Mobile developmentMobile development
Mobile development
 
Elektronsko poslovanje mPayment
Elektronsko poslovanje mPaymentElektronsko poslovanje mPayment
Elektronsko poslovanje mPayment
 

Data WareHose

  • 1. + Skladišta podataka Data WareHouse By: Krunoslav Ris CEO @ BetaWare d.o.o. | FlyStartup
  • 2. + Definicija  Sam pojam "skladište podataka" (engl. Data Warehouse) podrazumijeva zbirku podataka izoliranih iz operativnih baza i spremljenih u posebne baze odnosno skladišta podataka.  Glavna karakteristika koja određuje skladište podataka odnosi se na njegovu svrhu  Prema definiciji koju je postavio William H. Inmon, skladište podataka predstavlja subjektni usmjeren (subject-oriented), integrirani (integrated), vezan na vrijeme (time-variant) i sadržajno nepromjenjiv (non-volatile) skup podataka, a krajnji cilj mu je pomoć menadžmentu pri donošenju odluka.
  • 3. + Definicija  Subjektni usmjerenost podataka - znači da se oni organizuju oko predmeta, na način da daju informacije o točno određenim predmetima u okviru funkcionalnih područja (npr. u okviru prodaje, nabave.) Umjesto o tekućim operacijama poduzeća. Suprotno tome operativne baze podataka organizirane oko poslovnih aplikacija, dakle usmjerene su na tekuće operacije (npr. obrade narudžbi, isporuka i sl..).  Integriranost - podaci se skupljaju u bazu podataka iz različitih izvora i pohranjuju uvijek u istom formatu, te su konzistentni i prikazuju se na dosljedan način.  Vezanost uz vrijeme - svi podaci u skladištu podataka vezani su i identificiraju se uz određeni vremenski period, što znači da imaju povijesni karakter. Za razliku od njih, u operativnim bazama podataka pohranjeni su samo aktualni, najsvježiji podaci. Međutim, s gledišta koncepta poslovne inteligencije, sveobuhvatno predviđanja budućih događaja nije moguće provesti bez poznavanja povijesti istih ili nekih drugih događaja. Iz toga toki da premda podaci u skladištu podataka odražavaju prošlost, njihova usmjerenost je okrenuta budućnosti.
  • 4. + Osnove skladištenja podataka  sustavi 70-tih godina su bili monolitni sustavi sa centraliziranim “mainframe” računalom-naslijedeni sustavi (engl. Legacy systems)  80-tih godina dolazi do popularizacije osobnih računala  vrhunac sustava za analizu prije pojave skladištenja podataka bili su sustavi za potporu odlučivanju i izvršni informacijski sustavi  pojava koncepta Intraneta i korištenja web baziranih aplikacija- putem Intraneta podaci u skladištu podataka postaju dostupni svima unutar kompanije  Skladištenje podataka je novi koncept koji se pojavio sredinom 90-tih godina 20. stoljeća
  • 5. + Značajke skladišta podataka  pristup podacima je najefikasniji ako su ti podaci odvojeni od podataka pohranjenih u operacijskim sustavima  jedan od razloga za razdvajanje je da podaci u skladište podataka mogu doći i iz više izvora  Takoder bitan razlog je da se procesi obrade transakcije i analize podataka bitno razlikuju odnosno da postoji razlika između transakcijskih (operacijskih) sustava i sustava za analizu  transakcijski sustav (često se naziva i OLTP – On-Line Transaction Processing) pridaje najveću važnost raspoloživosti i brzini obrade i ne smije se dozvoliti da analiza podataka dovede do degradacija performansi transakcijskog sustava- ključni razlog razdvajanja
  • 6. + Značajke skladišta podataka Razlike između OLTP i skladišta podataka
  • 7. + Ciljevi skladištenja podataka  Skladište podataka mora omogućiti pristup podacima bitnim za neku organizaciju ili kompaniju  Podaci u skladištu podataka moraju biti konzistentni  Podaci se u skladištu podataka mogu kombinirati na sve moguće načine (engl. dice and slice requirement)  Skladište podataka nisu samo podaci, već ono mora sadržavati i skup alata za postavljanje upita (engl. query tools), alata za analizu i predstavljanje informacije  Skladište podataka je mjesto gdje se objavljuju korišteni podaci  Kvaliteta podataka u skladištu je pokretač poslovnog restrukturiranja
  • 8. + Što je to OLAP ?  Izrazom “On-Line Analytical Processing” (OLAP) označena je kategorija softverske tehnologije koja omogućava korisnicima (analitičarima, menadžerima) da steknu uvid u podatke kroz brz, konzistentan, interaktivan pristup različitim mogućim pogledima na informacije transformirane iz sirovih podataka da bi odrazile stvarnu dimenzionalnost poslovanja kako ga shvača korisnik
  • 9. + Što je to OLAP ?
  • 10. + Što je to OLAP ?  OLAP je pojam koji izvorno potiče od E.F. Codda, a opisuje informacijski sustav za brz, konzistentan i interaktivan pristup i manipulaciju multidimenzionalnim podacima koji dolaze iz različitih izvora, a spremljeni su u skladištu podataka  Funkcionalnost OLAP-a ostvarena je kroz mogućnost multidimenzionalnih analiza konsolidiranih korporativnih podataka koje uključuju: modeliranje korištenjem dimenzija i hijerarhija podataka, analize trendova kroz određena vremenska razdoblja, projekciju podataka kroz what-if scenarije, podskupove podataka, bušenje (drill down) do nižih nivoa detaljnosti podataka  OLAP je obično implementiran u klijent-server okruženju
  • 11. + Što je to OLAP ?  OLAP postoji u dva temeljna oblika s obzirom na formu u kojoj su podaci spremljeni: relacijski (ROLAP-Relational On Line Analitycal Processing) i multidimenzionalni (MOLAP- Multidimensional On Line Analitycal Processing), te u hibridnom obliku (HOLAP-Hybrid On Line Analitycal Processing) koji za više nivoe sumarizacije koristi multidimenzionalni oblik, ali omogućuje dril-down do nižih nivoa sumarizacije koji su smješteni u relacijskoj tablici  U posljednje vrijeme koristi se i izraz FASMI - Fast Analysis of Shared Multidimenzional Data
  • 12. + Što je to OLAP ?
  • 13. + Osnovni modeli skladišta podataka  Prilikom kreiranja skladišta podataka danas u praksi susrećemo tri osnovna modela ili osnovne arhitekture skladišta podataka: dvoslojna arhitektura s jednim zajedničkim skladištem podataka, dvoslojna arhitektura s više nezavisnih lokalnih spremišta podataka (engl. Data Marts) i troslojna arhitektura sa zajedničkim skladištem podataka i više povezanih lokalnih skladišta podataka  Dvoslojna arhitektura s jednim zajedničkim skladištem podataka  Dvoslojna arhitektura s više nezavisnih lokalnih skladišta podataka  Troslojna arhitektura skladišta podataka
  • 14. + Dvoslojna arhitektura s jednim zajedničkim skladištem podataka  Ovaj model karakterizira jedinstveno, zajedničko centralizirano skladište podataka.  Podaci se zaprimaju iz različitih izvora unutar organizacije (npr. podaci iz online sustava za obradu transakcija, podaci iz ranije razvijenih sustava koji održavaju baze podataka itd..) I vanjskih izvora podataka dostupnih putem interneta ili nekim drugim načinima.  Karakteristika dvoslojne arhitekture skladišta je da ono služi većem broju organizacijskih jedinica poduzeća kao i pojedinačnim korisnicima. Takva skladišta su velikog opsega i vrlo složena, au njima se u pravilu pohranjuje ogromna količina podataka. Pa i sheme podataka prema kojima se vrši pohranjivanje podataka trebaju podržavati široku lepezu aplikacijskih zahtjeva. Iz navedenog je vidljivo da su troškovi održavanja takve arhitekture visoki i pretpostavljaju znatan angažman i vrijeme određenog broja i profila stručnjaka.
  • 15. + Dvoslojna arhitektura s više nezavisnih lokalnih skladišta podataka  Karakteristika ove arhitekture skladišta podataka je postojanje većeg broja nezavisnih lokalnih spremišta podataka namijenjenih za podržavanje pojedinačnih aplikacija po organizacijskim jedinicama poduzeća. Rezultat takve arhitekture je velik broj sustava koji svaki posebno zaprimaju "svoje" podatke iz različitih transakcijskih baza podataka. Prednost navedenog modela skladišta podataka je jednostavnija izgradnja i lakše korištenje. Međutim takav model ima i nedostatke kao što su:  otežana komunikacija među organizacijskim jedinicama poduzeća.  povećanjem broja međusobno neovisnih skladišta podataka, usporedno raste i opterećenost samih transakcijskih sustava,  data mart-ovi oblikovani su tako da podržavaju samo jednu aplikaciju, pa naknadno dodavanje novih aplikacija u određeno skladište predstavlja poteškoće,  ograničena skalabilnost platforme i  otežan je uvid u stvarno stanje informacija na razini poduzeća
  • 16. + Troslojna arhitektura skladišta podataka  Ovaj model sastoji se od većeg broja lokalnih skladišta podataka i jednog zajedničkog skladišta podataka koje je smješteno između skladišta podataka i različitih izvora podataka unutar i izvan poduzeća. Skladišta podataka oslanjaju se na centralno skladište podataka koje im isporučuje podatke u obliku koji daje ujednačen uvid u sve segmente poslovanja poduzeća.  U odnosu na prethodna dva modela prednosti troslojne arhitekture su veća točnost informacija nevezano s kojeg izvora su zahvaćene, olakšana je komunikacija među organizacijskim jedinicama, smanjena je opterećenost informatičara, povećana je skalabilnost i proširivost platforme za pohranu podataka i na kraju ova arhitektura pruža mogućnost korištenja vanjskih aplikacija čime se omogućuje povezivanje svih subjekata u lancu vrijednosti.
  • 17. + Troslojna arhitektura skladišta podataka Istorijski podaci
  • 18. + Višedimenzionalni prikaz podataka  Skladište podataka, kao što je ranije rečeno, puni se izvorima podataka unutar organizacije (transakcijske baze) kao i vanjskim izvorima podataka. Postupcima ekstrakcije, transformacije i punjenja kojima se zaprimaju podaci iz unutarnjih i vanjskih izvora dobivaju se osnovni podaci skladišta.  Za vizualni prikaz dimenzionalnog modela podataka koristi se tzv. zvijezda shema (star shema) jer dijagram ima izgled zvijezde, kao što je prethodno navedeno - jednu središnju veliku relacijsku tablicu koja se naziva i tablicom činjenica (engl. fact table) i skup manjih tablica.  Dimenzione tablice posjeduju određene atribute, odnosno pozicije dimenzija i predstavljaju mogućnosti koje prikazuju neku pojavu, npr.. otpremu određenog proizvoda
  • 19. + Višedimenzionalni prikaz podataka
  • 20. + Višedimenzionalni prikaz podataka  Centralni dio sheme, tablica činjenica, predstavlja središnji dio koordinacije, koji uz osnovne podatke o šiframa relacijskih tablica koje su objedinjene u strukturu, može sadržavati i ostale segmente informacija.  Višedimenzionalna struktura podataka pruža velike mogućnosti za otkrivanje mnogih detalja različitim postupcima analitičke obrade kao što su agregacija i detaljizacija ili svrdlanje (drill up, drill down, drill through), unakrsno tabeliranje (cross tabulation), selekcija, isijecanje, izdvajanje i kombiniranje svih dimenzija (slice and dice requirement), rotacija odnosno isticanje jedne dimenzije dok su druge u pozadini (pivoting), prognoza, modeliranje, grafički prikaz (charting), statistike analize (trend, klaster) itd..
  • 21. + Zaključak  Skladištenje podataka – Data-Warehouse je posebno projektirano tehnološko okruženje koje omogućuje objedinjavanje srodnih podataka u oblik pogodan za analizu čime se olakšava proces donošenja odluka i daje novi pristup sustavima za potporu odlučivanju. Ovaj koncept osigurava fleksibilan, učinkovit način raspolaganja podataka u formatu pogodnom za suvremene poslovne aplikacije. Postojanje skladišta podataka kao bogato informacijama integrirano okruženje orijentirano je ka potrebama krajnjih korisnika koji uz pomoć alata za poslovno odlučivanje mogu donositi pravovremene i kvalitetne poslovne odluke.  Omogućuje stalno pronalaženje novih informacija namijenjenih menadžerima, a služe im prvenstveno za strateško, taktičko i operativno donošenje odluka. Uvođenjem koncepta skladištenja podataka, operativne baze prestaju biti opterećene složenim upitima, pa cijeli informacijski sustav koji se sad sastoji od dva dijela, operativnog i skladišta podataka postaje produktivniji i lakše se kontrolira i restrukturira.  Metode skladištenja podataka sve više postaju integrirane u softverske pakete temeljnog informacijskog sustava poduzeća, novije verzije relacijskih baza podataka (kao npr.. Oracle i SQL server) imaju dio za Data Warehousing integriran u svom paketu kao OLAP. Menadžmentu nije potreban angažman analitičara za obradu ključnih pokazatelja o stanju poduzeća, već takve podatke klikom miša mogu dobiti obrađene iz baze podataka, te koristiti kao pomoć u donošenju poslovnih odluka.  Načela upravljanja prema ciljevima (Management by Objectives) će biti podržana mogućnostima online pristupa bazama i skladištima podataka, kroz alate poslovne inteligencije. Koncept skladišta podataka usklađivanjem podataka omogućuje jedinstvenu istinu o poduzeću, što povećava kredibilitet informacijskog sustava.