CIO Survey 2018. Patrząc w przyszłość: poza erę cyfrową
Big Data +
1. BIG DATA+Systemy analityki wielkich zbiorów danych
w polskich organizacjach
CZERWIEC2011
RAPORTMAGAZYNUMENEDŻERÓWIINFORMATYKÓWWWW.COMPUTERWORLD.PL
WRZESIEŃ2014
2. agile.computerworld.pl
PARTNER MERYTORYCZNY: PATRONAT: ORGANIZATOR:
✓ INSPIRUJĄCE CASE STUDIES – m.in. Centralny Ośrodek Informatyki, ING
Bank Śląski, Onet, Orange Polska, PayU – poznaj praktyczne doświadczenia z dojrzałych
transformacji, ale także nowe wdrożenia z wielu branż
✓ BIEŻĄCA TEMATYKA, KLUCZOWE PROBLEMY – czy da się zmierzyć
agile, zarządzanie zmianą w metodykach agile, zarządzanie zespołami rozproszonymi,
kiedy zwinność na poziomie projektu jest widoczna na poziomie biznesowym, realizacja
kontraktów w duchu agile i wiele innych
✓ SESJE WARSZTATOWE – weź udział w jednym z równoległych, specjalistycznych,
interaktywnych treningów, by zgłębić swoje umiejętności:
• Warsztat I – Fakty i mity o holokracji – krótki kurs wdrożenia w organizacji
• Warsztat II – Przewodnik po metodykach zwinnych – czy agile jest dla mojej organizacji
• Warsztat III – Oszacowanie kosztów i korzyści metod zwinnych
• Warsztat IV – Kanban dla dużych organizacji
✓ WYZWANIA KOLEJNYCH LAT – sprawdź nowe techniki wspierające
agile w organizacji – przykłady wdrożeń holokracji po raz pierwszy
na konferencji w Polsce!
Agile
w biznesie
23–24WRZEŚNIA2014,WARSZAWA
DOUBLETREEBYHILTON
HOTEL&CONFERENCECENTER
IV KONFERENCJA COMPUTERWORLD
3. SPIS TRESCI
Strona 3
ZAWARTOŚĆ RAPORTU BIG DATA+
Strona 4
ORGANIZACJE NA DRODZE DO MODELU DATA DRIVEN
Strona 6
UCZESTNICY BADANIA
W perspektywie sektorów gospodarki
Profile respondentów
Ujęcie regionalne
Strona 8
BIG DATA Z PERSPEKTYWY BIZNESU
Znaczenie terminu
Big data z perspektywy końcowych użytkowników: opinie respondentów
Strona 10
BIG DATA W POLSKICH ORGANIZACJACH
Projekty zrealizowane i planowane oraz ich ramy czasowe
Powody niepodejmowania projektów wdrożeniowych w zakresie big data
W poszukiwaniu korzyści i zastosowań
Etapy wdrażania big data
Decyzyjność w zakresie wdrażania rozwiązań big data
Strona 14
DZIEDZINOWE WYKORZYSTANIE SYSTEMÓW BIG DATA
Marketing i sprzedaż
Finanse i controlling
Zarządzanie na szczeblu ogólnym
Inne obszary wykorzystania big data
Strona 16
POTENCJALNE ZASTOSOWANIA WIELKICH ZBIORÓW DANYCH
Potencjalne korzyści w perspektywie sektorów gospodarki
Świadomość korzyści wśród polskich organizacji
Inne wskazania respondentów
Strona 18
PROBLEMY I BARIERY PRZY REALIZACJI PROJEKTÓW BIG DATA
Najczęstsze bolączki towarzyszące wdrażaniu rozwiązań big data
Inne wskazywane problemy
•••
Strona 20
STUDIUM PRZYPADKU: KOMPANIA PIWOWARSKA
Błyskawiczna analityka w Kompanii Piwowarskiej
2 sierpień 2014
4. WSTĘP
Zawartość raportu
Big Data+
Badanie prowadzone przez redakcję
Computerworld we współpracy z IBM
Polska miało na celu zgromadzenie
informacji na temat wdrażania syste-
mów big data w polskich przedsiębior-
stwach i instytucjach – sprawdzenie,
które z nich posiadają takie rozwią-
zania bądź planują je zrealizować
i dlaczego, jakie napotykają przy tym
problemy, co chcą osiągać, wreszcie –
czy i jakie prawidłowości można w tej
kwestii nakreślić w odniesieniu do
organizacji wywodzących się z po-
szczególnych sektorów gospodarki.
W niniejszym raporcie przeanalizowano:
• co rozumieją przedsiębiorcy pod poję-
ciem big data;
• czy potrafią właściwie określić spo-
dziewane korzyści biznesowe i próg
opłacalności wdrożenia;
• które sektory gospodarki są szcze-
gólnie zainteresowane możliwo-
ściami analityki big data i w jakim
zakresie;
• w jakich obszarach organizacje wy-
korzystują analitykę wielkich wolu-
menów danych, oraz gdzie widzą jej
potencjalne zastosowania;
• jakie problemy utrudniają realizację
projektów związanych z big data;
• kto podejmuje strategiczne decyzje
o wdrażaniu;
• czego w omawianym zakresie ocze-
kują małe i średnie przedsiębiorstwa,
czego zaś duże firmy i korporacje.
Raport BIG DATA+ zawdzięcza
wiarygodność szerokiej próbie respon-
dentów. Badanie prowadzono na grupie
docelowej składającej się z decydentów
IT (IT Decision Makers) oraz w zakresie
biznesu (Business Decision Makers)
w lipcu 2014 roku.
Ankietowane organizacje reprezen-
towałyszerokiprzekrójsektorówgospo-
darki oraz wielkości – od małych przed-
siębiorstw po wielkie korporacje, w tym
firmy i instytucje o silnych, powszechnie
rozpoznawalnych markach.
5. Według badań Forrester Research, organizacje
analizują jedynie 12% wszystkich gromadzonych
danych. Tymczasem firmowe serwery pęcznieją z roku
na rok coraz szybciej, wydatnie zwiększając koszty
utrzymania. Czy firmy będą potrafiły zrobić użytek
z takiej ilości danych?
PIOTR PIETRUSZYŃSKI
Organizacje na drodze
do modelu Data-driven
Przez wiele lat big data było w zasadzie
teoretycznym problemem. Technologiczne
możliwości przez długi czas pozwalały
de facto jedynie na gromadzenie wielkich
wolumenów danych. Ich przetwarzanie,
z uwagi na często nieustrukturyzowany
charakter i ograniczone moce obliczeniowe
programów analitycznych, było poza zasię-
giem większości przedsiębiorstw. Obecnie
mamy do czynienia z sytuacją, w której
bariery technologiczne powoli przestają
mieć znaczenie. Rozwiązania pozwalające
wykorzystywać big data, niegdyś drogie
i trudno dostępne, stają się osiągalne dla
coraz szerszego grona przedsiębiorstw
i instytucji.
Określić cele
Kiedy stopniowo zanikają ograniczenia
technologiczne, pozostaje fundamentalne
pytanie: skoro można już sięgnąć do zbio-
rów typu big data, co tak naprawdę uda się
wynieść z nagromadzonych tam danych?
Okazuje się, że odpowiedź na to pytanie
nie jest już tak oczywista. Gromadzenie
wielkich zbiorów danych to wysokie i wciąż
wzrastające koszty. Big data to inwestycja,
która powinna prowadzić do zwiększenia
przewagi konkurencyjnej czy poprawy wy-
dajności procesów przedsiębiorstwa bądź
instytucji. Świadoma organizacja zaczyna
zatem od określenia celów, jakie zamierza
4 sierpień 2014
MODEL DATA DRIVEN
6. 5sierpień 2014
osiągnąć, inwestując w tego typu rozwią-
zania.
Możliwości zastosowania big data
jest wiele – od usprawniania kampanii
marketingowych, poprzez optymalizację
procesów i zarządzanie należnościami, aż
po ulepszanie modeli aktuarialnych czy
analizę obszarów ryzyka dla ubezpieczycie-
li i instytucji finansowych. Każda z branż
w zakresie analityki wielkich wolumenów
danych znajdzie rozwiązania adekwatne do
własnych potrzeb.
Kooperacja na linii biznes
- IT wysoce wskazana
Wraz z rozbudową aplikacji oraz wzro-
stem możliwości technologicznych rośnie
także stopień komplikacji projektów
wdrożeniowych, co jest szczególnie du-
żym problemem dla firm czy instytucji
nie potrafiących jasno zdefiniować celów,
jakie stawiane są przed analizą big data.
Niejednokrotnie trudno jest ustalić, kto
w ramach organizacji jest właścicielem
danych, a kto odpowiada za ich jakość.
Tymczasem aby odnieść sukces przy wdro-
żeniu, konieczna jest daleko posunięta
współpraca między biznesem, firmowym
IT a dostawcami technologii, wychodząca
od potrzeb i oczekiwań tego pierwszego.
Tylko w taki sposób możliwe będzie zreali-
zowanie celów określonych w modelu re-
ferencyjnym – podstawie udanej realizacji
projektu. Dostawca rzadko kiedy może się
bowiem poszczycić podobnym stopniem
znajomości specyfiki poszczególnych
sektorów gospodarki jak działające w nich
firmy.
Co nowego niesie big data?
Big data nie jest rewolucją, a od dawna
zapowiadanym przez ekspertów zjawi-
skiem, którego znaczenie rośnie z uwagi na
konieczność składowania i analizy coraz
większej liczby danych. W tym kontekście
możemy jednak mówić o pewnym novum.
Obecnie, dzięki zniesieniu (czy redukcji)
barier technologicznych, jesteśmy w stanie
analizować i zestawiać ze sobą dane, które
wcześniej były nieużyteczne – zwłaszcza
dane niestrukturalne – takie jak e-maile,
rozmowy z call centers, nagrania wideo,
czy też rejestry związane z pracą urządzeń
działających w technologii M2M (Machine
to Machine). Otwiera to ogrom nowych
możliwości dla przedsiębiorstw chcących
pogłębić prowadzone analizy czy pokony-
wać problemy biznesowe, które wcześniej
były nierozwiązywalne wskutek niedostat-
ku danych.
Perspektywy rozwoju
Dzięki technologiom, które pozwalają
zadawać pytania i uzyskiwać odpowiedzi
z nieustrukturyzowanych źródeł na sposo-
by znane wcześniej z tradycyjnych analiz
bazodanowych, sprzedawcy, marketingow-
cy czy decydenci uzyskują zupełnie nowe,
szerokie możliwości w dalszym podnosze-
niu przewagi konkurencyjnej swojej firmy,
zarówno poprzez analizowanie zdarzeń
przeszłych, jak i predykcję tych przyszłych.
Takie podejście wymaga precyzyjnego
i świadomego dostosowania oprogramo-
wania analitycznego do wymagań i potrzeb
nakreślonych przez klienta. W zasadzie
nie zdarzają się sytuacje, w których wdro-
żenie oprogramowania w firmie odbywa
się bez jego uprzedniej adaptacji. Ten
segment coraz częściej obsługują wysoce
wystandaryzowane rozwiązania chmurowe,
popularne zwłaszcza wśród mniejszych
przedsiębiorstw. Biznes oczekuje rozwią-
zań szytych na miarę – szkielety gotowych
rozwiązań wymagają wypełnienia wymaga-
niami i potrzebami specyficznymi i wyjąt-
kowymi dla poszczególnych branż. Obecnie
nie wystarczy już prosta analiza danych ze
sprzedaży. Organizacje muszą wybiegać
w przyszłość, poświęcając czas i zasoby na
realizację analiz predykcyjnych. Możliwych
użycia i analizy danych jest bez liku.
Ograniczeniami są coraz częściej jedynie
wyobraźnia i kreatywność decydentów.
Wyniki badania „Big data w polskich
organizacjach”, przeprowadzonego przez
Computerworld we współpracy z IBM
Polska, potwierdzają, że polskie firmy
i instytucje podchodzą do tematu w sposób
dojrzały i przemyślany. Potrafią właściwie
określić swoje potrzeby, a podjęte w zakre-
sie big data inwestycje poprzedzają skru-
pulatną analizą zysków i poprzedzających
je kosztów.
2,5 tryliona
bajtów danych tworzonych jest
codziennie
64%
organizacji inwestuje bądź zamierza zainwestować
w rozwiązania big data
przedsiębiorców jest zdania, że sukces firmy uzależniony
jest od stosowania big data
organizacji wskazało na osiągnięcie przewagi konkurencyjnej
dzięki wdrożeniu rozwiązań analityki wielkich zbiorów danych
przedsiębiorców widzi konieczność analizy wielkich
wolumenów danych w celu zapewnienia lepszej obrony
przed cyberprzestępcami
39%
19%
36%
Źródło:GartnerŹródło:EMCForum2013
7. W badaniu udział wzięły 224 firmy – zarówno
małe i średnie przedsiębiorstwa, jak i duże firmy
oraz korporacje. Organizacje te prezentują
szeroki przekrój branżowy, gwarantując
reprezentatywność badanej próby.
PIOTR PIETRUSZYŃSKI
Uczestnicy badania
Dla zachowania reprezentatywności odpo-
wiedzi w ujęciu sektorów gospodarki podkre-
ślić należy, że przy omawianiu specyfiki po-
szczególnych branż posługiwano się jedynie
wywodzącą się z nich bazą firm. Odpowiedzi
pokazywane są w tym przypadku jako pro-
cent łącznej liczby wskazań ze strony respon-
dentów reprezentujących określone branże.
Profile respondentów
Ankiety w imieniu badanych organizacji
wypełniali najczęściej szefowie działów in-
formatyki (CIO), stanowiący grupę 74 osób
(60%) w ramach najliczniejszej, 124-osobo-
wej grupy ankietowanych dyrektorów i kie-
rowników.
W małych przedsiębiorstwach (do 50
zatrudnionych) ankiety wypełniali przede
wszystkim prezesi i właściciele firm (55%).
W średnich (od 51 do 250 zatrudnionych)
i dużych firmach (powyżej 250) podejmowali
ją głównie dyrektorzy i kierownicy (odpo-
wiednio 27% i 53%).
W zależności od wielkości firmy, stanowi-
ska osób wypełniających ankiety wykazy-
wały zbieżność z wynikami, jakie uzyskano,
pytając o decyzyjność w kwestiach podej-
mowania strategicznych decyzji o wdrażaniu
rozwiązań big data, co dodatkowo potwier-
dzało wartość dobranej na potrzeby badania
grupy docelowej.
Wraz ze wzrostem skali działalności
i liczebności załogi firmy tendencja do roz-
budowywania pionowych struktur hierarchii
– a co za tym idzie, delegowania kompeten-
cji – zwiększa się. Związana z powyższym
6 sierpień 2014
BIG DATA+
W perspektywie sektorów
gospodarki
Wśród ankietowanych znaleźli się przedstawi-
ciele całego przekroju kluczowych sektorów
gospodarki: ICT, administracji publicznej, prze-
mysłu, FMCG, finansów, budownictwa, logistyki
oraz szeregu innych branż. Udział sektorów
gospodarki w badanej próbie obrazuje tabela 1.
Zasadniczą część ankietowanych firm – aż
25% – stanowiły przedsiębiorstwa informa-
tyczne, dalsze 3/4 organizacji wywodziło
się z pozostałych sektorów gospodarki.
Świadomość korzyści i adaptacja rozwiązań
big data wyraźnie odróżnia firmy informa-
tyczne od reszty ankietowanych – prawi-
dłowość ta będzie zauważalna w dalszych
sekcjach niniejszego opracowania.
Dla większości organizacji udało się ustalić
przynajmniej ogólną skalę wielkości zatrud-
nienia, tj. przynależność do sektora MSP
bądź sektora dużych firm i korporacji.
Sektor MSP reprezentuje w raporcie 113
firm, stanowiących niemal dokładnie połowę
próby. Do kategorii dużych przedsiębiorstw
i korporacji przyporządkowanych zostało 96
firm (43% próby). W przypadku 15 firm (7%)
nie udało się ustalić choćby przybliżonej
wielkości zatrudnienia. Kryterium wielkości
dotyczy wszystkich badanych podmiotów,
stąd w ramach powyższego podziału znalazły
się także urzędy i instytucje naukowe.
Dla 2/3 organizacji biorących udział w ba-
daniu udało się ustalić także bardziej precy-
zyjne informacje nt. wielkości zatrudnienia.
8. 7sierpień 2014
samodzielność budżetowa poszczególnych
działów powoduje, że ich szefowie zyskują
możliwości realizacji projektów na własny
użytek. Częściowo tożsamy charakter decy-
dentów z respondentami biorącymi udział
w badaniu omówiono w dalszej części opra-
cowania.
Ujęcie regionalne
Wyniki ankiety nakładają się na cechującą
polskie regionalizmy gospodarcze specy-
fikę. Najwięcej ludności oraz działających
firm znajduje się na Mazowszu (z czego ok.
połowa w samej Warszawie), na Śląsku oraz
w Małopolsce. W grupie 224 ankietowanych
firm niniejsza prawidłowość została w pełni
zachowana.
Aż 69 firm – tj. 31% ogółu ankietowanych
firm – prowadziło działalność w Warszawie.
Inne silnie reprezentowane w badaniu miasta
to Kraków (18 firm) oraz Katowice (11). O ile
w przypadku Mazowsza i Małopolski widać
znaczną koncentrację w ich największych
ośrodkach miejskich, o tyle Katowice odpo-
wiadają raptem za 1/4 wskazań dla Śląska
– przedsiębiorstwa są tam rozproszone
w ramach całej aglomeracji śląskiej.
Branża Liczba Procent
IT - firmy informatyczne 55 25
Przemysł/Produkcja
/Wydobycie
29 13
Administracja publiczna/
Służby mundurowe
27 12
FMCG/Dystrybucja/Handel 24 11
Media/Reklama
/Wydawnictwa/Drukarnie
19 8
Edukacja/Szkolenia/Nauka 14 6
Telekomunikacja
/Internet/TV kablowa
12 5
Finanse/Bankowość
/Ubezpieczenia
11 5
Farmacja/Służba zdrowia/
Opieka społeczna
10 4
Konsulting/Doradztwo/
Prawo/Audyt
9 4
Budownictwo/Nieruchomości 5 2
Energia/Gaz/Woda/Ciepło/
Oczyszczanie
4 2
Transport/Spedycja/Lo-
gistyka
4 2
brak danych 1 0,5
Tabela 1. Ankietowane firmy
w ujęciu sektorów gospodarki RESPONDENCIWEDŁUG STANOWISK
Wykres 1. Skala wielkości
przedsiębiorstw biorących udział
w badaniu
Wykres 2. Respodenci według
stanowisk
Wykres 4. Respondenci w ujęciu terytorialnym
Wykres 3. Przedziały wielkości zatrudnienia przedsiębiorstw biorących
udział w badaniu
9. Termin „big data” został po raz pierwszy
sformułowany w 2001 roku w raporcie ośrodka
analitycznego Gartner. Według przyjętej wtedy
definicji, big data to duża ilość (volume), zmienność
(velocity) oraz różnorodność (variety) danych.
PIOTR PIETRUSZYŃSKI
Big data
z perspektywy biznesu
sunkowo niedawno pojawiły się moż-
liwości technologiczne, pozwalające
organizacjom na realne generowanie korzy-
ści, opierając się na wielkich zbiorach danych: :
odpowiednie oprogramowanie analityczne i za-
plecze sprzętowe, np. platforma MapReduce
umożliwiająca równoległe przetwarzanie
ogromnych zbiorów danych na powiązanych
klastrach komputerów. Georedundancja za-
pewniła niedostępną wcześniej wydajność
oraz bezpieczeństwo.
Big data z perspektywy
końcowych użytkowników:
opinie respondentów
Nakreślone powyżej teoretyczne założenia big
data to jedno, ich praktyczne postrzeganie i wy-
korzystanie w organizacjach to drugie. Z perspek-
tywy dostawców IT szczególnie interesujące mogą
okazać się opinie przedstawicieli końcowych użyt-
kowników systemów analizy wielkich wolumenów
danych – zawierają one bowiem wskazania co do
priorytetów i potrzeb charakterystycznych dla
poszczególnych sektorów gospodarki.
Przedstawiciele organizacji biorących udział
w badaniu „Big data w polskich organizacjach”
zostali poproszeni o przedstawienie swojego ro-
zumienia omawianego zagadnienia. Pytanie miało
charakter fakultatywny, odpowiedziało na nie 60
osób. Jak można się było spodziewać, w uzyska-
nych odpowiedziach dało się zauważyć różnie
rozłożone punkty ciężkości, w widocznej zależno-
ści od branży, z której wywodził się respondent.
8 sierpień 2014
Obecnie do zarysowanej we wstępie definicji
dodaje się aspekt analityczno-technologiczny,
podkreślając, że zbiory danych nazywane big
data wymagają nowych form przetwarzania
w celu usprawniania procesów decyzyjnych,
odkrywania nowych zależności oraz optymaliza-
cji procesów.
Chociaż koncept big data znany był
już od dłuższego czasu, dopiero sto-
BIG DATA+
10. Big data w hasłach
respondentów:
• Big data – Big profit
• Big Picture
• Cyfrowy potop
• Zmiana sposobu myślenia o danych
zgromadzonych przez organizację
• Administracja publiczna: Przedstawiciele
tego sektora podkreślali aspekty związane
z integracją i uzyskiwaniem efektu synergii
danych gromadzonych przez różne podmioty
(w domyśle – np. urzędy oraz ich jednostki
organizacyjne). Rozwiązania big data są w ra-
mach tego sektora rozumiane jako narzędzia
umożliwiające poprawę efektywności proce-
sów administracyjnych i analizowania potrzeb
społecznych.
• Energetyka i utilities: Big data to gromadze-
nie, obróbka i taka wizualizacja danych, która
pozwoli zaoferować klientom produkty tańsze
i zarazem w pełni adekwatne do ich potrzeb,
„bez względnej nadmiarowości”.
• Przemysł i produkcja: Charakterystyczne dla
tego sektora są często wielka skala działal-
ności i rzadki kontakt z końcowym odbiorcą
produktów. Oprócz standardowych prób defi-
niowania big data jako dużych i zróżnicowa-
nych zbiorów danych, respondenci wywodzący
się z branży przemysłowej wskazywali opty-
malizację procesów.
• Finanse, bankowość, ubezpieczenia:
Prowadząc analizę ogromnych wolumenów
danych, branża ta koncentruje się na two-
rzeniu wartościowych informacji mających
pomóc w profilowaniu portfela produktowego
adresowanego do klientów oraz ułatwiać re-
agowanie na zmiany zachodzące w otoczeniu
biznesowym.
• FMCG, handel, dystrybucja: Cechą opinii
wyrażanych przez respondentów tego sekto-
ra jest nacisk na efektywność wykorzystania
danych, zwłaszcza w zakresie czasu nie-
zbędnego na dokonanie analizy i możliwości
wykorzystania wniosków z niej płynących
w okresie, kiedy pozostają aktualne i uży-
teczne. Big data może bowiem „dać odpo-
wiedź na pytania, których dotychczas nawet
nie zadawano ze względu na brak reprezen-
tatywnej próbki danych (brak możliwości ich
zgromadzenia) i czas ich analizy”.
• Konsulting i doradztwo: Firmy doradcze in-
terpretują rozwiązania big data jako zestaw
technologii stanowiących podstawę efektyw-
nego przetwarzania gromadzonych danych dla
poprawy procesów organizacji oraz zwiększa-
nia ich przewag konkurencyjnych.
• IT – firmy informatyczne: Ankietowani
przedstawiciele firm IT stosunkowo często
wprowadzali definicje bliskie teoretyczne-
mu, „słownikowemu” opisowi terminu „big
data ”, uwzględniając przy tym najważniej-
sze słowa kluczowe: zmienność, wielkość
i różnorodność. Inne odpowiedzi wskazy-
wały także możliwość integracji różnych
źródeł danych oraz podkreślały, że big data
to narzędzie pozwalające wyłuskać prawi-
dłowości i cenne informacje z chaotycznego
strumienia danych.
• Telekomunikacja: Branża telekomunikacyjna
gromadzi szczególnie potężne ilości danych.
Punkt ciężkości definicji podawanych przez
przedstawicieli tego sektora położony został
na ich porządkowanie oraz data mining – pro-
ces wydobywania wartości z całych tera- i pe-
tabajtów spływających do firmowych centrów
przetwarzania danych.
Omawiane powyżej odpowiedzi responden-
tów wskazują na zauważalne branżowe ten-
dencje w postrzeganiu big data, zwłaszcza od
strony związanych z analizą wielkich danych
korzyści. Branże skupiające się na dotarciu do
klienta końcowego, takie jak finanse, banko-
wość, FMCG czy telekomunikacja, szczególną
wagę przywiązują do – posługując się cytatem
– „samonapędzającego się rozwoju”. Dzięki
big data mają możliwość lepszego profilowa-
nia ofert produktowych i usługowych tak, aby
zwiększyć sprzedaż i dotarcie, co z kolei skut-
kuje jeszcze większą ilością danych i jeszcze
lepszymi informacjami generowanymi na ich
podstawie. Tendencja ta staje się tym bardziej
widoczna, im większa jest skala działalności
danej organizacji.
W sektorach, które nie kierują swoich usług
bezpośrednio do klientów końcowych bądź
nie działają stricte w logice rynkowej, częściej
dawało się zauważyć opinie wiążące big data
zwłaszcza z poprawą działalności operacyjnej,
integracją różnych źródeł danych oraz nacisk
kładziony na procesową stronę przetwarzania
danych. Branże odznaczające się takim sposo-
bem myślenia to: przemysł, administracja, czy
(częściowo) edukacja.
Powyżej odznaczające się prawidłowości
powtarzają się w innych częściach opracowania,
przy okazji omawiania szczegółowych wyników
badania „Big data w polskich organizacjach”.
Najciekawsze i – wydaje się – najlepiej od-
dające istotę big data definicje koncentrowały
się na zmianie sposobu myślenia o danych
gromadzonych przez firmy i instytucje. Dzięki
big data bezużyteczne dotychczas dane gro-
madzące się na serwerach stają się potencjal-
nymi skarbnicami wiedzy o realnej wartości
biznesowej. Właściwie wdrożone i realizowane
systemy analityki big data umożliwiają dostrze-
żenie szerszego kontekstu („Big Picture”) oraz
wyłuskanie prawidłowości niekiedy w zupełnie
niespodziewanych obszarach działalności.
9sierpień 2014
11. Choć wdrażanie rozwiązań big data wymaga
znacznych nakładów, tak finansowych jak
i organizacyjnych, potencjalne korzyści skłoniły już
szereg przedsiębiorstw do uruchomienia inwestycji
związanych z technologiami analizowania wielkich
wolumenów danych.
PIOTR PIETRUSZYŃSKI
Big data w polskich
organizacjach
1/3 organizacji zamierza wdrożyć tego typu syste-
my w przyszłości.
Najwięcej zainteresowanych rozwiązaniami
big data zaobserwowano wśród firm informatycz-
nych. Jak wspomniano we wstępie opracowania,
wykazywana przez nie świadomość korzyści
i adaptacja rozwiązań big data są dalej posunięte
niż w przypadku reszty ankietowanych organizacji.
Prawidłowość ta odznacza się już na etapie analizy
zrealizowanych i planowanych wdrożeń.
Aż 42% respondentów wywodzących się z sektora
firm informatycznych zadeklarowało posiadanie
rozwiązań big data. W porównaniu do pozostałych
badanych sektorów różnica na korzyść IT wynosi więc
aż 15%. Te 15% daje się odnaleźć po stronie firm
w ogóle nie zamierzających wdrażać rozwiązań do
analityki wielkich wolumenów danych. Powyższa pra-
widłowość wskazuje na naturalnie związaną z branżą
IT innowacyjność oraz siłą rzeczy lepsze niż w pozo-
stałych przypadkach zrozumienie nowych technologii
i oferowanych przez nie możliwości. Uzasadnienie tej
tezy szerzej przedstawione zostało w części poświę-
conej najczęściej wskazywanym przez respondentów
problemom przy wdrażaniu big data.
Z uwagi na wystarczającą liczbę ankietowanych,
miarodajne statystyki na temat użycia technologii
big data dało się wydzielić także dla kilku innych
sektorów. Wyniki przedstawiono w tabeli 2.
Powody niepodejmowania projektów
wdrożeniowych w zakresie big data
Uwagę zwracają licznie deklarowane przez respon-
dentów braki jakichkolwiek planów wdrażania
10 sierpień 2014
BIG DATA+
Podstawową przesłanką, jaka przyświeca realizacji
projektów big data, jest uzyskanie dodatkowych
przewag konkurencyjnych i optymalizacja działalno-
ści oraz procesów biznesowych za pomocą dotych-
czas niemożliwych do analizy danych.
Projekty zrealizowane i planowane
oraz ich ramy czasowe
Spośród 224 przedsiębiorstw, które wzięły udział
w badaniu, prawie co trzecie wykorzystuje już
w jakimś zakresie rozwiązania big data. Dalsza
12. 11sierpień 2014
rozwiązań big data w firmach i instytucjach związa-
nych z przemysłem ciężkim i wydobyciem, admini-
stracją oraz nauką i edukacją. Jako cechę wspólną
wspomnianych sektorów można wskazać fakt, że
często nie kierują swoich usług bezpośrednio do
klientów końcowych bądź nie działają stricte w logi-
ce rynkowej. Branże te stawiają większy nacisk na
procesową stronę przetwarzania danych, poprawę
działalności operacyjnej oraz integrację różnych
źródeł danych.
W przypadku administracji publicznej wyjaśnienie
niewielkiej liczby zrealizowanych i planowanych
wdrożeń infrastruktury oraz narzędzi analitycznych
big data wymaga bardziej kompleksowych wyja-
śnień niż rzekomo immanentnie związany z nią niski
poziom innowacyjności. Mimo że administracja
dysponuje ogromnymi zasobami różnorodnych
danych, których właściwa analiza mogłaby zasadni-
czo poprawić wydajność instytucji i szczelność ich
systemów, obostrzenia związane z bezpieczeństwem
oraz ochroną danych osobowych utrudniają bądź
wręcz uniemożliwiają wdrożenia, jakie mogłyby
przecież przynieść oszczędności. Żeby daleko nie
szukać – analityka zdarzeń i usług medycznych
gromadzonych w ramach platformy P1 zestawiona
z posiadanymi przez ZUS danymi na temat świadczeń
mogłaby poprawić jego system aktuarialny. W świe-
tle prawa, z uwagi na ochronę prywatności ubezpie-
czonych, działania takie nie są jednak dozwolone.
Innym problemem sektora administracji publicznej
są trudności w pozyskaniu wykwalifikowanych
specjalistów – pensje profesjonalnych analityków
IT dalece wykraczają poza możliwości urzędów i ich
jednostek pomocniczych, co wyraźnie utrudnia im
konkurowanie z pozostałymi branżami na rynku
pracy. Brak specjalistów utrudnia z kolei propagowa-
nie wewnątrz organizacji wiedzy na temat korzyści
z wdrażania rozwiązań big data, co skutkuje brakiem
długofalowej strategii w tym zakresie.
Pomijająctendencjewynikającezsektorówgo-
spodarki,dlaczegoorganizacjerezygnujązrealizacji
projektówbigdata?Wskazaćmożnatrzyzasadnicze
powody.Popierwsze,niektórefirmymogłydotąd
wogóleniesłyszećotakichrozwiązaniach,przezco
niemiałyjeszczeokazjiprzeprowadzićanalizyzasad-
nościwdrożenia.Podrugie,nawetpoświadomym
przeprowadzeniutakiejanalizyzorientowanejuż
wmożliwościachikosztachzwiązanychzwdrażaniem
systemówbigdata organizacjemogąświadomie
uznać,żewichprzypadkunieopłacasiępodejmować
takiejinwestycji,bowiemnakładyprzewyższaćbędą
potencjalneprofity.Potrzeciewreszcie,powodem
zarzuceniakoncepcjiwdrożeniamożebyćbrakzro-
zumieniapotrzebykompleksowegoanalizowania
danychzestronybiznesu.Toproblem,którywskazało
aż22%respondentówdeklarującychnapotykanie
przeszkódprzyrealizacjitakichprojektów.Szerzej
kwestiętęomówionowrozdziale„Problemyibariery
przyrealizacjiprojektówbigdata”.
W poszukiwaniu korzyści
i zastosowań
Na przeciwległym biegunie znajdują się sektory: IT,
mediów, reklamy i wydawnictw, a także finansów,
bankowości i ubezpieczeń. Branże te znacznie czę-
ściej deklarują posiadanie rozwiązań big data bądź
plany ich wdrożenia.
Media i reklama to branża szukająca korzyści
przede wszystkim w dokładniejszym profilowaniu
klientów i ich potrzeb oraz poprawie skuteczności
kampanii reklamowych. Sektor finansów,
Wykres 5. Wykorzystanie
rozwiązań big data w polskich
przedsiębiorstwach
Wykres 6. Planowane wdrożenia
big data – ramy czasowe
Wykres 7. Wykorzystanie big data w firmach: IT a pozostałe branże
Już wykorzystuje
Do
W ciągu
12 miesięcy
Branża Już wykorzystuje Planuje Nie planuje
Łącznie
odpo-
wiedzi
IT - firmy informatyczne 23 42% 15 27% 17 31% 55
Przemysł/ Produkcja/
Wydobycie
10 34% 1 3% 18 62% 29
Administracja publiczna/
Służby mundurowe
4 15% 6 22% 17 63% 27
FMCG/ Dystrybucja/
Handel
6 25% 8 33% 10 42% 24
Media/ Reklama/
Wydawnictwa/ Drukarnie
7 37% 7 37% 5 26% 19
Edukacja/ Szkolenia/
Nauka
2 14% 4 29% 8 57% 14
Telekomunikacja/
Internet/ TV kablowa
3 25% 5 42% 4 33% 12
Finanse/ Bankowość/
Ubezpieczenia
3 27% 7 64% 1 9% 11
Tabela 2. Wykorzystanie big data w firmach respondentów
wg sektorów gospodarki
13. 12 sierpień 2014
BIG DATA+
bankowości i ubezpieczeń cechuje szczególnie silne
zainteresowanie adaptacją technologii analityki
wielkich wolumenów danych – aż dziewięciu na
jedenastu respondentów wywodzących się z tego
sektora zadeklarowało planowanie bądź wykorzysty-
wanie platform big data. Branża finansowa i ubezpie-
czeniowa stawia przede wszystkim na analizowanie
potrzeb klientów i lepsze profilowanie produktów.
Od analityki wielkich zbiorów danych oczekuje także
możliwości stworzenia modeli i wzorców zachowań,
pomocnych przy wychwytywaniu oraz zapobieganiu
oszustwom i malwersacjom, a w przypadku ubezpie-
czycieli również rozwijaniu systemów aktuarialnych.
Systemy te wspierane będą nie tylko dzięki danym
tworzonym w ramach instytucji finansowych i ubez-
pieczeniowych, ale także za pomocą analizy danych
pochodzących m.in. z mediów społecznościowych,
co już zdążyło wzbudzić kontrowersje.
Stosunkowo dużym zainteresowaniem rozwią-
zania big data cieszą się również w sektorze FMCG,
handlu i dystrybucji – łącznie 58% wywodzących
się z tej branży respondentów korzysta bądź planuje
wdrożenie systemów analizy wielkich zbiorów da-
nych. FMCG koncentruje analitykę na optymalizacji
łańcucha dostaw, profilowaniu portfolio produktów
oraz wspieraniu kampanii marketingowych.
Etapy wdrażania big data
W poprzednich akapitach analizowano deklaracje
respondentów w zakresie zamiarów i planów doty-
czących wdrażania rozwiązań big data w ich organi-
zacjach, bądź też zaniechania tego rodzaju projek-
tów. W niniejszym akapicie opisano, na jakim etapie
wdrożenia znajdują się przedsiębiorstwa deklarują-
ce korzystanie z takich systemów (wykres 8).
Analizując dane na temat etapów wdrażania syste-
mów analizy wielkich wolumenów danych, ponownie
wyraźnie unaocznił się dystans dzielący w tej kwestii
Tabela 3. Działy podejmujące strategiczne decyzje o wdrożeniu
big data w zależności od wielkości firmy
firmy informatyczne od firm wywodzących się z pozo-
stałych sektorów gospodarki. W przypadku przedsię-
biorstw IT silnie zaznaczyła się przewaga odpowiedzi
sugerujących testowanie i udoskonalanie posiadanych
już rozwiązań. Resztę branż cechowała większa rów-
nowaga – wskazania rozłożyły się niemal po równo
pomiędzy dostępne odpowiedzi (wykres 10).
Warto wspomnieć tutaj inną interesującą obserwa-
cję: z racji na w oczywisty pełniejszy niż w przypadku
innych branż dostęp sektora IT do wiedzy na temat
najnowszych trendów technologicznych oraz wyni-
kających z nich możliwości jedynie 15% firm IT wska-
zało jako problem brak zrozumienia potrzeby analizy
danych ze strony biznesu. Wykres 10 wskazuje kon-
sekwencję powyższego – zasadnicza większość firm
informatycznych, która uznała wdrożenie rozwiązań
big data za korzystne dla swojego biznesu, przeszła
już z etapu planowania do etapów związanych z wdra-
żaniem i udoskonalaniem tej technologii.
Firmy wywodzące się z pozostałych sektorów
gospodarki mają więcej kłopotów z przekonaniem
decydentów o korzyściach płynących z inwestycji
w platformy big data. Innowacyjność technologicz-
na jest dla nich częściej wyzwaniem niż środowi-
skiem, w którym na co dzień się poruszają.
Widoczna na wykresie 11 rozpiska etapów wdra-
żania big data w ujęciu sektorów MSP oraz dużych
firm i korporacji sugeruje, że przedsiębiorstwa małe
i średnie decydujące się na wdrożenie mają krótsze
procesy decyzyjne – jak wskazano wcześniej, de-
cydentami są tam zwykle prezesi bądź właściciele
firm – oraz mniejszą skalę wdrożenia, co dodatkowo
skraca czas jego realizacji.
Korporacje potrzebują więcej czasu na testowa-
nie i wdrażanie rozwiązań. Oprócz wydłużonych
procesów decyzyjnych, np. w kwestiach akceptacji
budżetów, muszą bowiem zintegrować wdrażany
system z już funkcjonującą wewnątrz organizacji
architekturą IT.
Decyzyjność w zakresie wdrażania
rozwiązań big data
Wśród firm sektora MSP strategiczne decyzje
o realizacji systemów analityki wielkich wolume-
nów danych podejmują przede wszystkim zarządy
Decydenci / wielkość firmy Liczba wskazań
Procent
wskazań
Dział IT 24 24
duże firmy i korporacje (pow. 250) 15 63
średnie firmy (51–250) 5 21
małe firmy (do 50) 4 17
Działy biznesowe 25 25
duże firmy i korporacje (pow. 250) 13 52
średnie firmy (51–250) 7 28
małe firmy (do 50) 5 20
Zarząd 43 43
duże firmy i korporacje (pow. 250) 13 30
średnie firmy (51–250) 10 23
małe firmy (do 50) 20 47
Inne 7 7
duże firmy i korporacje (pow. 250) 5 71
średnie firmy (51–250) 2 29
Łącznie odpowiedzi 99 100
Wykres 8. Etapy wdrażania
big data w polskich organizacjach
Wykres 9. Szefowie działów
biznesowych będący najczęściej
wskazywanymi decydentami
w zakresie wdrażania projektów
big data
14. 13sierpień 2014
– aż 70% spośród dotyczących ich wskazań (30
spośród 43).
W przypadku dużych firm i korporacji decydujące
zdanie należy najczęściej do szefów poszczególnych
działów biznesowych lub działu IT – odpowiedzi te
uzyskały w sumie odpowiednio 52% wskazań spo-
śród 28. W grupie respondentów wskazujących, że
w ich organizacjach za realizację strategii w zakresie
big data odpowiada w całości dział IT (24 respon-
dentów, 24% odpowiedzi), aż 63% wywodziło się
spośród dużych firm i korporacji.
W rozdziale „Uczestnicy badania” nadmienio-
no, że respondenci biorący udział w badaniu są
w dużej mierze zarazem osobami podejmującymi
strategiczne decyzje dotyczące realizacji projek-
tów big data. Tabela 4 przedstawia, z jakiej grupy
stanowisk wywodzili się respondenci wskazujący
poszczególne pozycje w pytaniu dotyczącym dzia-
łów kompetentnych w zakresie decyzji o wdrożeniu
big data. Dla przypomnienia, w badanej grupie
docelowej aż 79% osób rekrutowało się spośród
przedstawicieli stanowisk kierowniczych różnego
rodzaju działów biznesowych (dyrektor/ kierownik
– 55%) bądź działów IT. Drugą pod kątem liczeb-
ności respondentów grupą były osoby pracujące
na stanowiskach zarządczych (prezes/ dyrektor
generalny/ właściciel – 24%).
Zależność pomiędzy stanowiskami osób wypeł-
niających ankietę oraz decydentów przez nich wska-
zanych wykazuje daleko posuniętą zbieżność z inną
zaobserwowaną – oczywistą – tendencją, wedle
której wraz ze wzrostem wielkości firmy widać de-
legację uprawnień decyzyjnych w zakresie big data
(i nie tylko) w dół rozbudowującej się hierarchii.
Najwięcej wskazań spośród decydentów wy-
wodzących się z działów biznesowych (wykres 9)
– wyjąwszy dział IT – padło na dyrektorów marke-
tingu. Wynik ten potwierdza zarazem, że marketing
i sprzedaż to obszar, w którym firmy najczęściej
wykorzystują analitykę wielkich danych – opcję tę
wskazało aż 37% przedsiębiorstw posiadających
bądź zamierzających wdrożyć rozwiązania big data.
Obszary wykorzystania big data w organizacjach
szerzej opisano w rozdziale „Dziedzinowe wykorzy-
stanie systemów big data”.
W odpowiedziach dotyczących decyzyjności
przy wdrażaniu rozwiązań big data respondenci
wskazywali także inne pozycje, np. w przypadku
administracji publicznej, zamiast wskazać odpo-
wiedź „zarząd”, jako decydenta wymieniono bur-
mistrza. Stosunkowo często podkreślano, że klu-
czowe decyzje w kwestiach wdrażania rozwiązań
big data podejmowane są wspólnie przez zarząd
i dział IT. Co ciekawe, w jednej z największych an-
kietowanych firm respondent nie potrafił określić,
kto jest decyzyjny.
Decydenci / respondenci Liczba wskazań Procent wskazań
Dział IT 24 24
dyrektor/ kierownik 15 63
prezes/dyrektor generalny/ właściciel 8 33
członek zarządu 1 4
Działy biznesowe 25 25
dyrektor/ kierownik 20 80
prezes/dyrektor generalny/ właściciel 5 20
Zarząd 43 43
dyrektor/ kierownik 26 60
prezes/dyrektor generalny/ właściciel 15 35
członek zarządu 2 5
Inne 7 7
dyrektor/ kierownik 4 57
prezes/dyrektor generalny/ właściciel 1 14
specjalista/ pracownik 2 29
Łącznie odpowiedzi 99 100
Tabela 4. Działy podejmujące strategiczne decyzje
o wdrożeniu big data w opinii badanych grup respondentów
(wg stanowisk)
Wykres 10. Etapy wdrażania big data w polskich organizacjach:
IT w porównaniu do innych branż
Wykres 11. Etapy wdrażania big data według wielkości przedsiębiorstw
15. Analiza uzyskanych danych wskazuje, że rozwiązania
big data cieszą się największą popularnością
w obszarze marketingu i sprzedaży, zwłaszcza wśród
działających w wysoce konkurencyjnych branżach firm
kierujących swoją ofertę bezpośrednio do klientów
końcowych.
PIOTR PIETRUSZYŃSKI
Dziedzinowe wykorzystanie
systemów big data
Na pytania dotyczące obszaru wykorzystywania
big data odpowiadały jedynie organizacje już
stosujące rozwiązania do analizy wielkich wolu-
menów danych bądź takie, które planują wdroże-
nie w ciągu nie więcej niż dwóch najbliższych lat.
Przyjęto, że firmy mające dłuższą niż dwuletnia
perspektywę wdrożenia big data nie są w stanie
miarodajnie określić swoich planów, zaś analiza
zasadności realizacji projektu nie została przez
nie prawdopodobnie wykonana.
Marketing i sprzedaż
Wzrost konkurencji oraz dojrzałości firm sprzyja in-
westycjom w systemy wspierające efektywne prze-
twarzanie informacji, a co za tym idzie – rozwijanie
przewag konkurencyjnych, opierając się na anali-
zowaniu danych pochodzących od klientów – aż
37% firm już wykorzystujących big data bądź
planujących wdrożenie wskazało chęć wykorzy-
stania tej technologii w działaniach marketingowo-
-sprzedażowych.
Jak wskazano na wstępie opracowania, spo-
śród już posiadanych bądź planowanych wdrożeń
systemów big data ich wykorzystanie w zakresie
marketingu bądź sprzedaży najczęściej dekla-
rowali respondenci wywodzący się z branży
mediów, reklamy i wydawnictw (74%), dostawców
usług telekomunikacyjnych (69%) bądź sektora
FMCG, dystrybucji i handlu (58%).
Warto przy tym dodać, że w grupie osób de-
cyzyjnych w kwestii wdrażania rozwiązań big
data, wywodzących się z działów biznesowych
14 sierpień 2014
BIG DATA+
16. 15sierpień 2014
(innych niż IT – łącznie 31 osób), najliczniejszą
grupę stanowili właśnie dyrektorzy marketin-
gu (57%).
Powyższe informacje potwierdzają wskazy-
waną już w niniejszym raporcie prawidłowość,
wedle której analityka wielkich zbiorów danych
jest najczęściej i najchętniej wykorzystywana
w branżach, w których szczególne znaczenie dla
sukcesu ma kontakt z klientem i konieczność
dostosowania oferty oraz przekazu do jego
potrzeb.
Warto podkreślić, że aż za 1/3 wskazań w pozy-
cji „analiza potrzeb klientów i lepsze profilowanie
produktów” odpowiadali respondenci sektora
finansów, bankowości i ubezpieczeń. To dużo,
zważywszy że w badaniu wzięło udział
11 firm wywodzących się z ww. branż.
Finanse i controlling
W przypadku finansów i controllingu próba zesta-
wienia uwzględniającego podział branżowy napo-
tyka trudność w postaci zbyt małej liczby wskazań,
nie stoi to jednak na przeszkodzie podjęcia próby
zarysowania zaobserwowanych w trakcie analizy
tendencji (wykres 14).
Spośród respondentów wskazujących po-
szczególne rodzaje analiz w ramach omawia-
nego obszaru dało się zauważyć większy niż
w przypadku marketingu i sprzedaży udział firm
z sektorów, w których nie występuje bezpośredni
kontakt firm z końcowymi konsumentami ich
produktów, m.in. z branży przemysłowej, budow-
nictwa, farmacji czy edukacji. Zarysowana tutaj
prawidłowość poparta jest zbyt małą liczbą wska-
zań, daje jednak pewien ogląd w zestawieniu
z innymi przytaczanymi wcześniej obserwacjami:
mniejszym zainteresowaniem rozwiązaniami big
data ze strony wspomnianych branż oraz naci-
skiem kładzionym na poprawę działalności opera-
cyjnej, niezwiązanej bezpośrednio ze sprzedażą
produktów finalnym klientom.
Zarządzanie na szczeblu ogólnym
Podobnie jak w przypadku finansów i controllin-
gu, obszar zarządzania na szczeblu ogólnym wy-
mieniło wśród wewnątrzfirmowych zastosowań
big data zbyt mało organizacji, jednak pewna
tendencja odznacza się tutaj wyraźnie (wykres
15). W ramach tego obszaru 1/4 spośród wszyst-
kich dwudziestu wskazań należała do responden-
tów wywodzących się z administracji publicznej,
która nie działa w logice rynkowej w takiej formie,
w jakiej czynią to prywatne przedsiębiorstwa
(pomijając może zakłady budżetowe jednostek
samorządu terytorialnego).
Inne obszary wykorzystania
big data
Ankietowani mieli możliwość wskazania i opi-
sania również innych dziedzin, w których posłu-
gują się analityką wielkich wolumenów danych.
Wśród formułowanych przez nich zastosowań
pojawiały się m.in.: analiza danych pomiaro-
wych, analiza danych na potrzeby regulatora
rynku telekomunikacyjnego, statystyka, mo-
nitorowanie jakości oraz testowanie procesów
biznesowych. Pojawiły się także wpisy mówiące
o zastosowaniach big data przy produkcji te-
lewizyjnej, przygotowywaniu rozwiązań IT do
wdrożeń u klientów, analizowaniu ruchu siecio-
wego na stronach internetowych oraz śledzeniu
procesów biznesowych zarówno w zakresie logi-
styki komponentów i przygotowań do produkcji,
jak i samej produkcji.
Wykres 12. Obszary
wykorzystania big data
w polskich organizacjach
Wykres 13. Wykorzystanie
big data w marketingu
i sprzedaży
Wykres 14. Wykorzystanie
big data w finansach
i controllingu
Wykres 15. Wykorzystanie
big data w zarządzaniu na
szczeblu ogólnym
17. 16 sierpień 2014
BIG DATA+
Analiza odpowiedzi na pytanie o potencjalne
zastosowania big data wskazuje, że firmy, które
dopiero planują wdrożenie – także w odległej
przyszłości – wykazują podobne priorytety jak te,
które już zrealizowały takie projekty bądź zamierzają
to zrobić niebawem.
PIOTR PIETRUSZYŃSKI
Potencjalne zastosowania
wielkich zbiorów danych
takie rozwiązania, a także organizacje planujące
wdrożenie w czasie pozwalającym na miarodajne
określenie jego zakresu.
W niniejszej części opracowania przedstawio-
no opinie respondentów na temat potencjalnych
zastosowań big data w ich organizacjach. Szersza
formuła pytania umożliwiała udzielanie odpowiedzi
uwzględniających także inne niż omawiane wcze-
śniej potrzeby oraz wyrażenie zdania tych spośród
ankietowanych, których firmy planują wdrożenie
w okresie późniejszym niż najbliższe dwa lata.
Tabela 5 obrazuje najczęstsze wskazania re-
spondentów wywodzących się poszczególnych
gałęzi gospodarki. Zebrane tam dane cechuje
– mimo zastrzeżeń nakreślonych we wstępie
– zbieżność z wynikami prezentowanymi w części
dotyczącej „Dziedzinowego wykorzystania big
data”. Firmy, które dopiero planują wdrożenie,
także w odległej przyszłości, wykazują podobne
priorytety jak te, które już zrealizowały projekty
big data bądź zamierzają to zrobić niebawem.
Różnicą w stosunku do wniosków płynących
z analizy „Dziedzinowego wykorzystania big data”
jest wyraźnie większy udział odpowiedzi związa-
nych z zarządzaniem procesowym wewnątrz firmy
oraz nieco większy – z obszarem marketingu.
Powodem mogą być ujęte w omawianym zestawie-
niu wskazania ze strony sektorów administracji
publicznej, energetyki, edukacji oraz FMCG, które
częściej deklarowały długofalowe plany wdrażania
rozwiązań big data, niż ich posiadanie. Priorytety
pozostają podobne jak w przypadku innych pod-
Realizacja projektów big data wymaga poważnych
nakładów finansowych oraz organizacyjnych,
stąd decyzje o takiej inwestycji podejmowane są
zwykle po kompleksowej analizie priorytetów,
spodziewanych zysków i związanych z ich uzyska-
niem kosztów.
Potencjalne korzyści w perspektywie
sektorów gospodarki
W poprzedniej części omawiano obszary wyko-
rzystania big data przez firmy już posiadające
18. 17sierpień 2014
miotów wywodzących się z wymienionych sekto-
rów – stąd stosunkowo większy udział punktów
związanych z zarządzaniem ogólnym, a w przy-
padku FMCG z marketingiem. Spośród branż
nastawionych na dotarcie do końcowych klientów
respondenci wywodzący się z sektora FMCG i han-
dlu wskazali największą przewagę odpowiedzi
związanych z planowaniem, z czego aż 1/4 mówiła
o okresie dłuższym niż dwa lata.
Świadomość korzyści
wśród polskich organizacji
Tabela 5 ponownie ujawnia omawiane już wcze-
śniej tendencje. Organizacje nie działające stricte
w logice rynkowej bądź nie docierające z ofertą
bezpośrednio do końcowych odbiorców stawiają
raczej na analitykę związaną z usprawnianiem we-
wnętrznych procesów biznesowych oraz zarządza-
niem budżetami. Firmy adresujące swoje portfolio
usług czy produktów bezpośrednio do klientów
końcowych rozwiązania big data postrzegają
przede wszystkim jako wsparcie dla skuteczności
kampanii marketingowych oraz możliwość lepsze-
go profilowania oferty handlowej.
Polskie organizacje zdają się w sposób od-
powiedzialny, metodyczny, ale i bez zbędnego
hurraoptymizmu przystępować do wdrażania
Branża
Analiza należności,
przewidywanie
płatności,
zarządzanie
aktywami
Poprawa
skuteczności
kampanii
marketingowej
Lepsze
profilowanie
portfolio
produktów
Dokładniejsza
kontrola wpływu
strategii mar-
ketingowej firmy
na rzeczywiste
osiągnięcia finan-
sowe firmy
Bezpieczeństwo
(np. wykrywanie
incydentów,
poprawa ciągłości
działania, monito-
ring infrastruktury)
Obsługa innych
bieżących
procesów
biznesowych
Inne Łącznie
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
Liczba
wskazań
Procent
odpo-
wiedzi
IT - firmy
informatyczne
9 10 16 18 15 17 11 13 15 17 19 22 3 3 88
Finanse/
Bankowość/
Ubezpieczenia
3 9 9 26 8 24 6 18 5 15 3 9 0 0 34
Media/Reklama/
Wydawnictwa/
Drukarnie
2 6 9 29 7 23 4 13 2 6 6 19 1 3 31
FMCG/Dystry-
bucja/Handel
3 13 6 25 6 25 3 13 2 8 4 17 0 0 24
Przemysł/
Produkcja/Wydo-
bycie
3 17 2 11 0 0 2 11 4 22 6 33 1 6 18
Administracja
publiczna/Służby
mundurowe
2 13 0 0 1 7 0 0 4 27 7 47 1 7 15
Średnia dla
wszystkich
respondentów
31 11 51 19 46 17 38 14 43 16 58 21 7 3 274
rozwiązań big data. Potrafią określić potrzeby
zarówno swoje, jak i klientów. Wiedzą, że kluczem
do odniesienia sukcesu jest zrozumienie specyfiki
działalności w danej branży oraz synergia działań
technologii informacyjnych z kluczowymi z punktu
widzenia firmy procesami biznesowymi.
Inne wskazania respondentów
Przedstawiciele ankietowanych organizacji mieli
możliwość wskazania dowolnych innych potencjal-
nych korzyści, płynących z wdrażania rozwiązań big
data, niż te domyślnie wymienione w ankiecie.
Respondenci wskazywali m.in. możliwość analizo-
wania informacji z uwzględnieniem szczebla w hie-
rarchii organizacji, optymalne ich wykorzystywanie
i unikanie ich duplikowania się, a także bardzo
szybki dostęp do gromadzonych na bieżąco danych
czy sporządzanych na ich podstawie raportów.
Zwłaszcza ostanie wspomniane punkty oddają jedną
ze szczególnie zauważalnych zalet wdrożenia roz-
wiązań analityki wielkich zbiorów danych. Większa
prędkość generowania informacji z systemu – nie-
kiedy o całe godziny, a nawet dni – przekłada się na
możliwość szybszej reakcji na zmiany zachodzące
w otoczeniu biznesowym, a co za tym idzie – zwięk-
szenie przewagi konkurencyjnej nad organizacjami
nieposiadającymi takich możliwości.
Tabela 5. Potencjalne zastosowania big data według respondentów
19. 18 sierpień 2014
BIG DATA+
Wdrożeniom rozwiązań do analityki wielkich danych
towarzyszą niekiedy poważne komplikacje. Kłopoty
z realizacją takich projektów zadeklarowało aż 42%
spośród organizacji posiadających rozwiązania big
data bądź planujących ich wdrożenie.
PIOTR PIETRUSZYŃSKI
Problemy i bariery przy
realizacji projektów big data
Ponownie zauważalna była w tej kwestii różnica
między firmami informatycznymi a przedstawi-
cielami pozostałych biorących udział w badaniu
branż. Spośród przedsiębiorstw IT jedynie co
trzecie (34%) miało kłopoty przy realizacji inwe-
stycji w big data. Dla porównania, takie proble-
my napotkała niemal połowa (46%) firm wywo-
dzących się z pozostałych sektorów gospodarki.
Najczęstsze bolączki towarzyszą-
ce wdrażaniu rozwiązań big data
Jakie najczęściej problemy przy wdrożeniu sy-
gnalizowali respondenci? Wyniki przedstawione
na wykresie 16 wskazują, że najbardziej proble-
matyczne jest pozyskiwanie wykwalifikowanych
specjalistów. To kłopot podany przez największą
liczbę respondentów, który wraz z czasem bę-
dzie z pewnością narastał. Według analityków
Gartnera, do 2015 roku w firmach na całym
świecie będzie zapotrzebowanie na ok. 4,4 mln
pracowników posiadających kwalifikacje w za-
kresie systemów big data, przy czym odpowied-
nio wyszkolona kadra znajdzie się jedynie dla
1/3 spośród takich stanowisk. Niebezzasadnie
zatem braki kadrowe zostały wskazane przez
ankietowanych jako najbardziej palący przy
wdrażaniu big data problem. Spośród licznych
wynikających w jego następstwie trudności
szczególnie dotkliwe mogą okazać się kłopoty
w przełożeniu oczekiwań biznesu na język tech-
nologii, które mogą w skrajnym przypadku wręcz
uniemożliwić realizację projektu. Coraz bardziej
świadome problemów kadrowych organizacje,
20. Wykres 16. Jakie problemy napotykają firmy przy wdrożaniu big data?
Wykres 17. Najczęściej wskazywane problemy w perspektywie wielkości
przedsiębiorstwa
planujące inwestycje w big data, już teraz wy-
syłają pracowników na coraz popularniejsze,
również w Polsce, kursy szkoleniowe dotyczące
omawianej tematyki. W ramach takich szkoleń
kursanci dowiadują się np., na czym polega
model MapReduce, jak instalować i konfiguro-
wać Hadoop, w jaki sposób budować hurtownie
danych, czy też jak dostosowywać technologie
do potrzeb i wymagań biznesu.
Drugą w kolejności liczbę wskazań na pytanie
o problemy przy wdrożeniach big data otrzymała
odpowiedź podnosząca kwestie kosztów utrzy-
mania. Jak można się było spodziewać, częściej
wskazywały ją małe i średnie przedsiębiorstwa
niż te duże. Sektor MSP miewa większe trudności
z kosztami projektów big data, nawet biorąc pod
uwagę, że ich skala jest z zasady o wiele mniejsza
niż w przypadku korporacji. Z drugiej strony, MSP
rzadziej wskazują problemy związane z brakami
kadrowymi, szczególnie palącymi dla firm o wiel-
kich zespołach i jeszcze większych potrzebach.
Trzeci omawiany problem to brak zrozumienia
konieczności analizowania danych ze strony
biznesu. Widać tu dwie prawidłowości – po
pierwsze, wychwycić dało się (znowu) różnicę
pomiędzy firmami IT a pozostałymi branżami.
Dla respondentów wywodzących się z sektora
informatycznego problem ten był marginalny
(jedynie 15% odpowiedzi), z kolei dla pozosta-
łych branż – dość istotny, bowiem wskazała
go prawie co czwarta (22%) reprezentująca je
osoba. Jak już wspomniano w części dotyczą-
cej „Projektów zrealizowanych i planowanych
oraz ich ram czasowych”, potwierdza to tezę
o głębszym zrozumieniu możliwości oferowa-
nych przez nowe technologie przez organizacje
o profilu informatycznym. Druga zaobserwowa-
na prawidłowość to częściej występujący wśród
firm sektora MSP brak zrozumienia dla koniecz-
ności analizy własnych danych niż w przypadku
przedsiębiorstw większych.
Inne wskazywane problemy
Jakie jeszcze problemy wskazywali ankietowani?
Podkreślali m.in., nienadążające za rzeczywisto-
ścią ograniczenia prawne, duży koszt oprogra-
mowania analitycznego czy tzw. czynnik ludzki
– wyuczony opór przed zmianami.
Jeden z respondentów wskazał jako problem
nieprawdziwą specyfikację oferowanych przez
dostawców rozwiązań. To kwestia godna uwagi,
zwłaszcza biorąc pod uwagę najczęściej wska-
zywany przy wdrożeniach big data kłopot, mia-
nowicie trudności w znalezieniu odpowiednio
kompetentnej kadry. Może to utrudniać kontrolę
nabywanych rozwiązań, nie mówiąc o rzetelnym
przeprowadzeniu poprzedzającej wdrożenie ana-
lizy zysków, potencjalnych problemów i kosztów
zapobiegania.
Źródła sukcesu
Problemów przy realizacji projektów z zakresu
analizy wielkich zbiorów danych da się uniknąć,
podejmując całościową, wielowymiarową ana-
lizę zasadności wdrożenia i związanych z nim
kosztów. Analiza taka powinna rozpoczynać się
zawsze od nakreślenia potrzeb biznesu, dopiero
później zaś przechodzić do kwestii technologicz-
nych. Przy projektach big data – jeszcze bardziej
niż zwykle – konieczna jest ścisła współpraca
biznesu z działem IT.
Po zakończonej analizie potrzeb i wymagań
firmowe IT powinno przygotować propozycję
strategii wdrażania dostępnych na rynku roz-
wiązań technologicznych, adekwatnych do
przyjętych ustaleń. Po uzyskaniu akceptacji ze
strony biznesu rozpocząć zaś realizację projektu
w ramach przyjętej architektury referencyjnej.
Czy warto zatem podjąć trud wdrażania roz-
wiązań big data? Na pewno warto przeprowadzić
analizę potrzeb i możliwości własnej organizacji.
Według cytowanego już wyżej Gartnera, tylko
do roku 2015 przedsiębiorstwa podejmujące
trud wdrażania nowoczesnych metod analizy
gromadzonych danych zwiększą udział w swoich
segmentach rynku wobec konkurentów nawet
o 20%. Jest o co zawalczyć.
19sierpień 2014
21. Wlatach 1996–2007 rynek piwa w Polsce wzrósł
dwukrotnie. Jednak od 2008 roku utrzymuje się na
podobnym poziomie. Wynika to z nasycenia rynku, a tak-
że aktualnego stanu gospodarki i podniesienia podatku
akcyzowego. W związku z tym możliwości wzrostu stały
się bardzo ograniczone. Spowodowało to zaostrzenie
konkurencji i poszukiwanie przez producentów przewagi
we wszystkich możliwych obszarach.
Jednym ze źródeł przewagi konkurencyjnej Kompanii
Piwowarskiej są systemy analityczne. Wykorzystywany
w firmie od kilku lat system stanowi nieocenione źródło
informacji biznesowej. „Platforma i raporty przez nią
udostępnione są niezbędne do codziennej pracy działu
sprzedaży. Zgromadzone dane to twarde fakty, odzwier-
ciedlające zmieniające się środowisko biznesowe. Jeśli są
dostarczane codziennie, pozwalają szybko i efektywnie
osiągać cele, a także w wiarygodny i sprawdzalny sposób
pokazują wyniki pracy” – mówi Danuta Nyckowska, IT
Solutions Manager Kompanii Piwowarskiej.
Coraz większe potrzeby
Każdego dnia z systemu korzystało kilkaset osób. Dane
są wplecione w procesy (m.in. kluczowe z punktu widzenia
firmy rozliczenia z dystrybutorami) i wymagane przez
umowy podpisane z klientami. Szybki dostęp do danych
oraz generowanych raportów umożliwia lepsze kontrolo-
wanie i stymulowanie rynku. Natomiast analizy tworzone
w ramach procesów pozwalają na weryfikowanie popraw-
ności realizacji celów biznesowych. Oznacza to, że system
musi być stabilny i posiadać dużą rezerwę zasobów.
W przeciwnym wypadku zakłócana jest praca operacyjna
organizacji.
Firma szybko dotarła do granic możliwości sprzęto-
wych oraz optymalizacyjnych systemu. Oznaczało to, że
biznes utracił szybki dostęp do informacji: brakowało
możliwości planowania sprzedaży, co przekładało się na
utracone korzyści, utrudniało to możliwości zarządzania
relacjami z dystrybutorami, przygotowania akcji marketin-
gowych stymulujących rozwój.
Błyskawiczna
analityka
W
Wdrożenie innowacyjnego środowiska IBM PureData Systems for Analytics
7.0 pozwoliło Kompanii Piwowarskiej zapewnić odpowiednie wsparcie dla
procesu sprzedaży. Rzetelne informacje decyzyjno-operacyjne pozwalają
kadrze zarządzającej podejmować lepsze decyzje i szybciej reagować na
zmiany zachodzące na rynku.
22. „W 2012 roku obciążenie systemu wzrosło o 100%.
Skutkowało to zbyt wolnym przetwarzaniem danych w pla-
nowych procesach oraz problemami z dostępnością rapor-
tów na przełomie miesiąca. Czas wykonywania raportów
był zbyt długi – średnio wynosił 7 minut. Tymczasem
oczekiwania biznesu kształtowały się na poziomie se-
kund. Co więcej, nie można było implementować nowych
procesów i aplikacji, a potrzeby w zakresie lepszej jakości
danych oraz bardziej zaawansowanej i rozbudowanej
ich analizy były coraz większe. Brakowało także kontroli
nad użytkownikami ad hoc, którzy mogliby zawłaszczyć
zasoby serwera” – tłumaczy Ewa Piekarska, Business
Solutions Manager.
Dlatego Kompania Piwowarska zdecydowała się na roz-
poczęcie projektu FRESH (Flexible Reporting Environment
for Sales enHancement). Celem ostatecznym było wzmoc-
nienie biznesu, osiągnięcie przewagi konkurencyjnej
i udostępnienie informacji niezbędnych do realizacji celów
strategicznych. Rozwiązanie miało umożliwić pomiar
szans i zagrożeń, a także pozwolić na szybkie reagowanie
na tendencje na rynku, a tym samym przełożyć się na
wzrost wartości przedsiębiorstwa.
W ramach projektu miało zostać wdrożone nowe
rozwiązanie sprzętowe, które zapewniłoby wzrost wy-
dajności pracy (rozumianej jako dostępność raportów).
Jednocześnie chodziło o umożliwienie szybkiego i ela-
stycznego wprowadzania zmian w modelu danych oraz
wykonywania symulacji „what if”, które polegają na
sprawdzaniu, jak zmiana parametrów wpłynie na wynik
finansowy.
Rozwiązanie szyte na miarę
Kompania Piwowarska zdecydowała się na wybór
rozwiązania sprzętowego IBM PureData System for
Analytics w wersji 7.0, oparte na technologii Netezza.
Jest to specjalnie do tego celu opracowane rozwiązanie,
które upraszcza działanie i zwiększa wydajność usług
danych dla aplikacji analitycznych. W efekcie możliwe
staje się realizowanie skomplikowanych algorytmów
wielokrotnie szybciej niż w przypadku tradycyjnych
systemów, a przy tym nie wymaga to dużych nakładów
pracy administracyjnej.
Rozwiązanie IBM pozwoliło rozstrzygnąć wszystkie
aktualne problemy. Oczekiwane czasy odpowiedzi zostały
potwierdzone w testach (wdrożony system okazał się osta-
tecznie dwa razy szybszy niż testowany). Zaletą systemu
IBM był bardzo szybki proces implementacji.
„Rozwiązanie charakteryzuje się wysoką dostępnością,
jest łatwo skalowalne wertykalnie do dużych wolumenów
danych – rzędu petabajtów – oraz zapewnia w cenie bo-
gaty aparat statystyczno-analityczny. Przy tym w prosty
sposób można je zintegrować w aktualnym środowisku,
a nakłady pracy na administrację i strojenie są minimalne”
– mówi Ewa Piekarska.
Cały projekt rozpoczęty w lutym 2013 roku od wyboru
rozwiązania, ustalenia ram projektu, architektury doce-
lowego rozwiązania i zamówienia maszyn, zakończył się
pod koniec września. Biorąc pod uwagę, że w tym czasie
dokonana została instalacja fizyczna maszyn oraz ich
konfiguracja w infrastrukturze Kompanii Piwowarskiej,
przeprowadzono analizę potrzeb i utworzono całkiem
nowy model danych, mechanizmy ETL, wykonano testy,
przeniesiono raporty konektorowe WWW, dokonano
adaptacji pozostałych raportów i aplikacji oraz przeprowa-
dzono szkolenia dla biznesu, można mówić o rekordowo
krótkim projekcie.
Realne zyski z szybkości
Projekt FRESH bardzo szybko przyniósł oczekiwane efek-
ty. Udało się zbudować rozwiązanie, które jest prostsze,
szybsze i lepsze. Przede wszystkim dzięki nowej plat-
formie sprzętowej udało się uzyskać wzrost wydajności
pracy systemu. Dzięki rozwiązaniu IBM i przejściu na
zasilanie danymi z plików płaskich udało się skrócić czas
dziennego ładowania danych do systemu z 4 godzin do
40 minut. Jeszcze większy zysk udało się osiągnąć przy
ładowaniu danych w przypadku zmiany indeksów maga-
zynowych (z 48 godzin do 40 minut). Wielokrotnie skró-
cony został także czas wykonywania skomplikowanych
raportów oraz działania aplikacji dokonującej rozliczenia
z dystrybutorami. Wszystkie raporty operacyjne są do-
stępne w czasie poniżej 1 minuty (przy tym dostępność
90% raportów nie przekracza 30 sekund). Natomiast
przeliczanie danych dla wszystkich płatników trwa nie 24
godziny, ale tylko 4.
Analitycy mogą wykorzystać swoją wiedzę i skupić
się na nowych możliwościach, jakie daje rozwiązanie.
Nie muszą poświęcać czasu na generowanie danych.
Skrócił się także czas wprowadzania zmian do systemu.
„Realizacja projektu FRESH przełożyła się także na
możliwości realizacji nowych potrzeb analitycznych.
Możemy teraz lepiej planować sprzedaż, zarządzać
relacjami z dystrybutorami i przygotowywać akcje
marketingowe. Daje to realne i szybkie badanie wpły-
wu zmiany parametrów na wyniki finansowe” – mówi
Danuta Nyckowska.
Najważniejsze
informacje
• Zwiększenie wydajności pracy
systemu analitycznego.
• Wielokrotnie skrócenie czasu
wszystkich czynności związanych
z wykonywaniem analiz.
• Dostępność wszystkich raportów
w czasie poniżej 1 min.
• Usprawnienie pracy działu sprze-
daży i marketingu.
• Usprawnienie pracy działu analiz.
• Szybkie prognozowanie wpływu
zmian parametrów na wyniki fi-
nansowe.
• Możliwość szybszego wykrywania
trendów i reagowania na zmiany
rynkowe.
Rozwiązanie
• IBM PureData System for Analytics 7.0
Partner
• Qumak S.A.
IBM Premier Business Partner IBM PureData System for
Analytics 7.0
„Kompania Piwowarska jest największą w Europie
spółką Grupy SABMILLER, drugiego pod względem
wielkości producenta piwa na świecie. Jednocześnie to naj-
większy pod względem wielkości producent piwa w Polsce.
Firma ma ponad 37-proc. udziału w rynku. Posiada w Polsce
3 browary i 14 filii. Zatrudnia ok. 3,2 tys. osób”.
„Realizacja projektu FRESH
przełożyła się także na możli-
wości realizacji nowych potrzeb anali-
tycznych. Możemy teraz lepiej planować
sprzedaż, zarządzać relacjami z dys-
trybutorami i przygotowywać akcje
marketingowe. Daje to realne i szybkie
badanie wpływu zmiany parametrów na
wyniki finansowe”.
Danuta Nyckowska, IT Solutions
Manager Kompanii Piwowarskiej