SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
Długoterminowe 
przechowywanie 
danych 
dziedzictwa 
kulturowego 
w 
środowisku 
skalowalnych 
technologii 
ICT 
Doświadczenia 
projektu 
SCAPE 
Tomasz 
Parkoła 
Poznańskie 
Centrum 
Superkomputerowo-­‐Sieciowe 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
• Wprowadzenie 
• Długoterminowe 
przechowywanie 
• Aktualne 
wyzwania 
w 
zakresie 
przechowywania 
danych 
• Projekt 
SCAPE 
• Główne 
założenia 
i 
cele 
projektu 
• Proces 
długoterminowego 
przechowywania 
• Weryfikacja 
narzędzi 
i 
rozwiązań 
SCAPE 
• Przykładowe 
systemy 
i 
oprogramowanie 
• Informacje 
dodatkowe 
• Podsumowanie 
Agenda 
2 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Wprowadzenie 
• Zapewnienie 
dostępności 
materiałów 
cyfrowych 
w 
długiej 
perspektywie 
czasu 
dla 
docelowej 
grupy 
użytkowników 
• Czynniki 
ryzyka 
• Sprzęt 
komputerowy: 
zmiany 
technologiczne 
• Oprogramowanie: 
aktualizacje, 
wyjście 
z 
użycia 
• Formaty 
plików: 
zmiany 
w 
użytkowanych 
formatach 
• Brak 
świadomości 
problemów 
i 
wyzwań 
związanych 
z 
przechowywaniem 
danych 
• Brak 
aktywnego 
planowania 
w 
zakresie 
przechowywania 
danych 
3 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Aktualne 
wyzwania 
• Liczba 
obiektów 
(zdjęcia 
zabytków, 
skany 
dokumentów) 
• Heterogeniczność 
danych 
(strony 
internetowe, 
dane 
medyczne) 
• Rozmiar 
i 
złożoność 
obiektów 
(nagrania 
wideo, 
obiekty 
3D) 
• Automatyzacja 
procesu 
przy 
użyciu 
scenariuszy 
przechowywania 
danych 
• Monitorowanie 
przechowywanych 
treści 
i 
ich 
analiza 
• Aktywne 
planowanie 
procesu 
dugoterminowego 
przechowywania 
danych 
4 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Projekt 
SCAPE 
• Zasadniczy 
cel 
to 
opracowanie 
skalowalnych 
technologii 
dla 
dużych, 
heterogenicznych 
i 
złożonych 
wolumenów 
danych 
• W 
szczególności 
• Usługi 
planowania 
i 
wdrażania 
zdefiniowanych 
w 
ramach 
instytucji 
zasad 
przechowywania 
danych 
• Infrastruktura 
w 
ramach 
której 
uruchamiane 
są 
procesy 
związane 
z 
długoterminowym 
przechowywaniem 
rozbudowanych 
wolumenów 
danych 
• Udoskonalenie 
i 
rozwój 
istniejących/nowych 
systemów 
i 
narzędzi 
informatycznych 
5 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
6 
Partnerzy 
projektu 
SCAPE 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Proces 
przechowywania 
danych 
w 
SCAPE 
7 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Weryfikacja 
rozwiązań 
SCAPE 
• Scenariusze 
weryfikujące 
bazują 
na 
problemach 
i 
wyzwaniach 
pojawiających 
się 
w 
praktyce 
w 
czterech 
głównych 
obszarach 
8 
treści 
stron 
internetowych 
biblioteki/ 
muzea/ 
repozytoria 
cyfrowe 
dane 
z 
badań 
dot. 
astrofizyki 
zastosowania 
technologii 
w 
centrach 
danych 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
9 
Przykładowe 
narzędzia 
SCAPE 
Plato 
– 
planowanie 
procesu 
przechowywania 
danych 
• Wspiera 
podejmowanie 
kluczowych 
decyzji 
w 
zakresie 
planowania 
procesu 
przechowywania 
danych 
• Bazuje 
na 
przeprowadzonych 
eksperymentach 
• Tworzy 
uruchamialny 
plan 
przetwarzania 
danych 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Przykładowe 
narzędzia 
SCAPE 
C3PO 
– 
narzędzie 
do 
analizy 
informacji 
na 
temat 
przechowywanych 
zasobów 
• 
Analizuje 
metadane 
techniczne 
przechowywanych 
plików 
(przetwarza 
różne 
formaty) 
• Agreguje 
i 
łączy 
informacje 
z 
wielu 
kolekcji 
danych 
• Tworzy 
profil 
przechowywanych 
zasobów 
• Dostarcza 
atrakcyjne 
wizualizacje 
10 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Przykładowe 
narzędzia 
SCAPE 
Scout 
– 
zautomatyzowany 
system 
monitorowania 
przechowywanych 
danych 
• Monitorowanie 
kolekcji 
danych 
• Wykrywanie 
i 
powiadamianie 
o 
pojawiających 
się 
możliwościach 
i 
zagrożeniach 
• Współdzielenie 
informacji 
między 
instytucjami 
• hgp://openplanets.github.io/scout/ 
11 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
12 
Przykładowe 
narzędzia 
SCAPE 
ToMaR 
– 
skalowanie 
istniejących 
narzędzi 
• Umożliwia 
uruchamianie 
istniejących 
narzędzi 
na 
dużych 
ilościach 
danych 
• Wykorzystuje 
klastry 
serwerów 
korzystających 
z 
technologii 
Map-­‐Reduce 
• Pozwala 
na 
tworzenie 
procesów 
przetwarzania 
danych 
z 
wykorzystaniem 
wielu 
narzędzi 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
13 
Przykładowe 
narzędzia 
SCAPE 
Pagelyzer 
– 
monitorowanie 
treści 
stron 
internetowych 
• Wykrywa 
zmiany 
na 
stronach 
internetowych 
• Porównuje 
wyniki 
wyświetlania 
stron 
na 
różnych 
przeglądarkach 
• Oblicza 
częstotliwość 
archiwizowania 
stron 
internetowych 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
14 
Przykładowe 
narzędzia 
SCAPE 
Jpylyzer 
– 
narzędzie 
do 
walidacji 
plików 
JPEG 
2000 
• Zautomatyzowana 
walidacja 
plików 
JP2 
• Umożliwia 
potwierdzenie 
tego 
czy 
dany 
plik 
jest 
zgodny 
z 
formatem 
JPEG 
2000 
• Ekstrachowanie 
technicznych 
informacji 
na 
temat 
plików 
JP2 
• Raportuje 
o 
kluczowych 
właściwościach 
pliku 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
15 
Przykładowe 
narzędzia 
SCAPE 
Matchbox 
– 
detekcja 
duplikatów 
w 
dokumentach 
graficznych 
• Identyfikuje 
duplikatów 
w 
ramach 
kolekcji 
bez 
względu 
na 
rozmiar 
plików, 
format, 
obcięcia, 
obrót 
lub 
pochodzenie 
skanów/grafiki 
• Może 
być 
zastosowany 
w 
przypadku 
różnych 
typów 
dokumentów 
(manuskrypty, 
nuty, 
dokumenty 
drukowane) 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
16 
Przykładowe 
narzędzia 
SCAPE 
xcorrSound 
– 
porównanie 
dokumentów 
dziwękowych 
• Porównuje 
dwa 
pliki 
dzwiękowe 
i 
określa 
ich 
podobieństwo 
• Wykrywa 
podobne 
obszary 
w 
różnych 
plikach 
• Wykrywa 
wykorzystanie 
krótkich 
ścieżek 
audio 
(np. 
dżingli) 
w 
długich 
nagraniach 
lub 
serii 
nagrań 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Wszystkie 
narzędzia 
SCAPE 
udostępnianie 
są 
na 
licencjach 
FLOSS 
Narzędzia 
opracowane 
w 
SCAPE 
są 
utrzymywane 
przez 
• Open 
Planets 
Foundalon 
skupia 
się 
na 
rozwiązywaniu 
problemów 
związanych 
z 
przechowywaniem 
danych 
poprzez 
angażowanie 
szerokiej 
społeczności 
• COPTR 
rejestr 
narzędzi 
przydatnych 
w 
procesie 
przechowywania 
danych 
17 
Utrzymanie 
narzędzi 
i 
usług 
SCAPE 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).
Podsumowanie 
• SCAPE 
website: 
www.scape-­‐project.eu 
• Blog: 
www.openplanetsfoundalon.com/projects/scape 
• Narzędzia 
SCAPE: 
hgps://github.com/openplanets/scape 
• SCAPE 
Twiger: 
@SCAPEProject, 
#SCAPEProject 
• SCAPE 
Newsleger: 
rejestracja 
poprzez 
www.scape-­‐project.eu 
18 
? 
This 
work 
was 
par,ally 
supported 
by 
the 
SCAPE 
Project. 
The 
SCAPE 
project 
is 
co-­‐funded 
by 
the 
European 
Union 
under 
FP7 
ICT-­‐2009.4.1 
(Grant 
Agreement 
number 
270137).

Weitere ähnliche Inhalte

Ähnlich wie C sz z6

Technik.teleinformatyk 312[02] z3.02_u
Technik.teleinformatyk 312[02] z3.02_uTechnik.teleinformatyk 312[02] z3.02_u
Technik.teleinformatyk 312[02] z3.02_uRzeźnik Sebastian
 
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danychkalaxq
 
Podążając śladami użytkownika Windows – elementy informatyki śledczej
Podążając śladami użytkownika Windows –elementy informatyki śledczejPodążając śladami użytkownika Windows –elementy informatyki śledczej
Podążając śladami użytkownika Windows – elementy informatyki śledczejKrzysztof Binkowski
 
DevOps - what I have learnt so far
DevOps - what I have learnt so far DevOps - what I have learnt so far
DevOps - what I have learnt so far Wojciech Barczyński
 
CI oraz CD w złożonym projekcie o małym budżecie
CI oraz CD w złożonym projekcie o małym budżecieCI oraz CD w złożonym projekcie o małym budżecie
CI oraz CD w złożonym projekcie o małym budżecieGrzegorz Godlewski
 
2019.10.08 share con365 2019 open source in azure devops, on the example open...
2019.10.08 share con365 2019 open source in azure devops, on the example open...2019.10.08 share con365 2019 open source in azure devops, on the example open...
2019.10.08 share con365 2019 open source in azure devops, on the example open...Janusz Nowak
 
infraxstructure: Rafał Stańczak "Postępujący rozwój infrastruktury na potrze...
infraxstructure: Rafał Stańczak  "Postępujący rozwój infrastruktury na potrze...infraxstructure: Rafał Stańczak  "Postępujący rozwój infrastruktury na potrze...
infraxstructure: Rafał Stańczak "Postępujący rozwój infrastruktury na potrze...PROIDEA
 
OAIS. Open Archival Information System, aut. dr Aneta Januszko-Szakiel
OAIS. Open Archival Information System, aut. dr Aneta Januszko-SzakielOAIS. Open Archival Information System, aut. dr Aneta Januszko-Szakiel
OAIS. Open Archival Information System, aut. dr Aneta Januszko-SzakielŚląska Biblioteka Cyfrowa
 
Technik.teleinformatyk 312[02] z3.03_u
Technik.teleinformatyk 312[02] z3.03_uTechnik.teleinformatyk 312[02] z3.03_u
Technik.teleinformatyk 312[02] z3.03_uRzeźnik Sebastian
 
[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics SystemArtur Wronski
 
Jak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayJak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayTomasz Dziuda
 
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCAPRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCAArtur Gunia
 
3. Organizowanie procesu pracy
3. Organizowanie procesu pracy3. Organizowanie procesu pracy
3. Organizowanie procesu pracykalaxq
 
4. Wykorzystanie informacyjnych technik biurowych
4. Wykorzystanie informacyjnych technik biurowych4. Wykorzystanie informacyjnych technik biurowych
4. Wykorzystanie informacyjnych technik biurowychkalaxq
 
Wprowadzenie do Big Data i Apache Spark
Wprowadzenie do Big Data i Apache SparkWprowadzenie do Big Data i Apache Spark
Wprowadzenie do Big Data i Apache SparkSages
 

Ähnlich wie C sz z6 (20)

Technik.teleinformatyk 312[02] z3.02_u
Technik.teleinformatyk 312[02] z3.02_uTechnik.teleinformatyk 312[02] z3.02_u
Technik.teleinformatyk 312[02] z3.02_u
 
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
 
Podążając śladami użytkownika Windows – elementy informatyki śledczej
Podążając śladami użytkownika Windows –elementy informatyki śledczejPodążając śladami użytkownika Windows –elementy informatyki śledczej
Podążając śladami użytkownika Windows – elementy informatyki śledczej
 
DevOps - what I have learnt so far
DevOps - what I have learnt so far DevOps - what I have learnt so far
DevOps - what I have learnt so far
 
CI oraz CD w złożonym projekcie o małym budżecie
CI oraz CD w złożonym projekcie o małym budżecieCI oraz CD w złożonym projekcie o małym budżecie
CI oraz CD w złożonym projekcie o małym budżecie
 
2019.10.08 share con365 2019 open source in azure devops, on the example open...
2019.10.08 share con365 2019 open source in azure devops, on the example open...2019.10.08 share con365 2019 open source in azure devops, on the example open...
2019.10.08 share con365 2019 open source in azure devops, on the example open...
 
infraxstructure: Rafał Stańczak "Postępujący rozwój infrastruktury na potrze...
infraxstructure: Rafał Stańczak  "Postępujący rozwój infrastruktury na potrze...infraxstructure: Rafał Stańczak  "Postępujący rozwój infrastruktury na potrze...
infraxstructure: Rafał Stańczak "Postępujący rozwój infrastruktury na potrze...
 
OAIS. Open Archival Information System, aut. dr Aneta Januszko-Szakiel
OAIS. Open Archival Information System, aut. dr Aneta Januszko-SzakielOAIS. Open Archival Information System, aut. dr Aneta Januszko-Szakiel
OAIS. Open Archival Information System, aut. dr Aneta Januszko-Szakiel
 
Technik.teleinformatyk 312[02] z3.03_u
Technik.teleinformatyk 312[02] z3.03_uTechnik.teleinformatyk 312[02] z3.03_u
Technik.teleinformatyk 312[02] z3.03_u
 
TECHNIK FOTOGRAFII I MULTIMEDIÓW
TECHNIK FOTOGRAFII I MULTIMEDIÓWTECHNIK FOTOGRAFII I MULTIMEDIÓW
TECHNIK FOTOGRAFII I MULTIMEDIÓW
 
Z2.04
Z2.04Z2.04
Z2.04
 
System zarządzania projektami
System zarządzania projektamiSystem zarządzania projektami
System zarządzania projektami
 
[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System
 
Jak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayJak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training Day
 
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCAPRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
 
Newag
NewagNewag
Newag
 
3. Organizowanie procesu pracy
3. Organizowanie procesu pracy3. Organizowanie procesu pracy
3. Organizowanie procesu pracy
 
4. Wykorzystanie informacyjnych technik biurowych
4. Wykorzystanie informacyjnych technik biurowych4. Wykorzystanie informacyjnych technik biurowych
4. Wykorzystanie informacyjnych technik biurowych
 
Wprowadzenie do Big Data i Apache Spark
Wprowadzenie do Big Data i Apache SparkWprowadzenie do Big Data i Apache Spark
Wprowadzenie do Big Data i Apache Spark
 
Tik a projekty przyrodnicze
Tik a projekty przyrodniczeTik a projekty przyrodnicze
Tik a projekty przyrodnicze
 

Mehr von SCAPE Project

SCAPE Information Day at BL - Characterising content in web archives with Nanite
SCAPE Information Day at BL - Characterising content in web archives with NaniteSCAPE Information Day at BL - Characterising content in web archives with Nanite
SCAPE Information Day at BL - Characterising content in web archives with NaniteSCAPE Project
 
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...Scape information day at BL - Using Jpylyzer and Schematron for validating JP...
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...SCAPE Project
 
SCAPE Information Day at BL - Some of the SCAPE Outputs Available
SCAPE Information Day at BL - Some of the SCAPE Outputs AvailableSCAPE Information Day at BL - Some of the SCAPE Outputs Available
SCAPE Information Day at BL - Some of the SCAPE Outputs AvailableSCAPE Project
 
SCAPE Information Day at BL - Large Scale Processing with Hadoop
SCAPE Information Day at BL - Large Scale Processing with HadoopSCAPE Information Day at BL - Large Scale Processing with Hadoop
SCAPE Information Day at BL - Large Scale Processing with HadoopSCAPE Project
 
SCAPE Information day at BL - Flint, a Format and File Validation Tool
SCAPE Information day at BL - Flint, a Format and File Validation ToolSCAPE Information day at BL - Flint, a Format and File Validation Tool
SCAPE Information day at BL - Flint, a Format and File Validation ToolSCAPE Project
 
SCAPE Webinar: Tools for uncovering preservation risks in large repositories
SCAPE Webinar: Tools for uncovering preservation risks in large repositoriesSCAPE Webinar: Tools for uncovering preservation risks in large repositories
SCAPE Webinar: Tools for uncovering preservation risks in large repositoriesSCAPE Project
 
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...SCAPE Project
 
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...SCAPE Project
 
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014SCAPE Project
 
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...SCAPE Project
 
Hadoop and its applications at the State and University Library, SCAPE Inform...
Hadoop and its applications at the State and University Library, SCAPE Inform...Hadoop and its applications at the State and University Library, SCAPE Inform...
Hadoop and its applications at the State and University Library, SCAPE Inform...SCAPE Project
 
LIBER Satellite Event, SCAPE by Sven Schlarb
LIBER Satellite Event, SCAPE by Sven SchlarbLIBER Satellite Event, SCAPE by Sven Schlarb
LIBER Satellite Event, SCAPE by Sven SchlarbSCAPE Project
 
Content profiling and C3PO
Content profiling and C3POContent profiling and C3PO
Content profiling and C3POSCAPE Project
 
Control policy formulation
Control policy formulationControl policy formulation
Control policy formulationSCAPE Project
 
Preservation Policy in SCAPE - Training, Aarhus
Preservation Policy in SCAPE - Training, AarhusPreservation Policy in SCAPE - Training, Aarhus
Preservation Policy in SCAPE - Training, AarhusSCAPE Project
 
An image based approach for content analysis in document collections
An image based approach for content analysis in document collectionsAn image based approach for content analysis in document collections
An image based approach for content analysis in document collectionsSCAPE Project
 
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE Project
 
TAVERNA Components - Semantically annotated and sharable units of functionality
TAVERNA Components - Semantically annotated and sharable units of functionalityTAVERNA Components - Semantically annotated and sharable units of functionality
TAVERNA Components - Semantically annotated and sharable units of functionalitySCAPE Project
 
Automatic Preservation Watch
Automatic Preservation WatchAutomatic Preservation Watch
Automatic Preservation WatchSCAPE Project
 
Policy levels in SCAPE
Policy levels in SCAPEPolicy levels in SCAPE
Policy levels in SCAPESCAPE Project
 

Mehr von SCAPE Project (20)

SCAPE Information Day at BL - Characterising content in web archives with Nanite
SCAPE Information Day at BL - Characterising content in web archives with NaniteSCAPE Information Day at BL - Characterising content in web archives with Nanite
SCAPE Information Day at BL - Characterising content in web archives with Nanite
 
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...Scape information day at BL - Using Jpylyzer and Schematron for validating JP...
Scape information day at BL - Using Jpylyzer and Schematron for validating JP...
 
SCAPE Information Day at BL - Some of the SCAPE Outputs Available
SCAPE Information Day at BL - Some of the SCAPE Outputs AvailableSCAPE Information Day at BL - Some of the SCAPE Outputs Available
SCAPE Information Day at BL - Some of the SCAPE Outputs Available
 
SCAPE Information Day at BL - Large Scale Processing with Hadoop
SCAPE Information Day at BL - Large Scale Processing with HadoopSCAPE Information Day at BL - Large Scale Processing with Hadoop
SCAPE Information Day at BL - Large Scale Processing with Hadoop
 
SCAPE Information day at BL - Flint, a Format and File Validation Tool
SCAPE Information day at BL - Flint, a Format and File Validation ToolSCAPE Information day at BL - Flint, a Format and File Validation Tool
SCAPE Information day at BL - Flint, a Format and File Validation Tool
 
SCAPE Webinar: Tools for uncovering preservation risks in large repositories
SCAPE Webinar: Tools for uncovering preservation risks in large repositoriesSCAPE Webinar: Tools for uncovering preservation risks in large repositories
SCAPE Webinar: Tools for uncovering preservation risks in large repositories
 
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...
SCAPE – Scalable Preservation Environments, SCAPE Information Day, 25 June 20...
 
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...
Policy driven validation of JPEG 2000 files based on Jpylyzer, SCAPE Informat...
 
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014
Migration of audio files using Hadoop, SCAPE Information Day, 25 June 2014
 
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...
Integrating the Fedora based DOMS repository with Hadoop, SCAPE Information D...
 
Hadoop and its applications at the State and University Library, SCAPE Inform...
Hadoop and its applications at the State and University Library, SCAPE Inform...Hadoop and its applications at the State and University Library, SCAPE Inform...
Hadoop and its applications at the State and University Library, SCAPE Inform...
 
LIBER Satellite Event, SCAPE by Sven Schlarb
LIBER Satellite Event, SCAPE by Sven SchlarbLIBER Satellite Event, SCAPE by Sven Schlarb
LIBER Satellite Event, SCAPE by Sven Schlarb
 
Content profiling and C3PO
Content profiling and C3POContent profiling and C3PO
Content profiling and C3PO
 
Control policy formulation
Control policy formulationControl policy formulation
Control policy formulation
 
Preservation Policy in SCAPE - Training, Aarhus
Preservation Policy in SCAPE - Training, AarhusPreservation Policy in SCAPE - Training, Aarhus
Preservation Policy in SCAPE - Training, Aarhus
 
An image based approach for content analysis in document collections
An image based approach for content analysis in document collectionsAn image based approach for content analysis in document collections
An image based approach for content analysis in document collections
 
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
SCAPE - Skalierbare Langzeitarchivierung (SCAPE - scalable longterm digital p...
 
TAVERNA Components - Semantically annotated and sharable units of functionality
TAVERNA Components - Semantically annotated and sharable units of functionalityTAVERNA Components - Semantically annotated and sharable units of functionality
TAVERNA Components - Semantically annotated and sharable units of functionality
 
Automatic Preservation Watch
Automatic Preservation WatchAutomatic Preservation Watch
Automatic Preservation Watch
 
Policy levels in SCAPE
Policy levels in SCAPEPolicy levels in SCAPE
Policy levels in SCAPE
 

C sz z6

  • 1. Długoterminowe przechowywanie danych dziedzictwa kulturowego w środowisku skalowalnych technologii ICT Doświadczenia projektu SCAPE Tomasz Parkoła Poznańskie Centrum Superkomputerowo-­‐Sieciowe This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 2. • Wprowadzenie • Długoterminowe przechowywanie • Aktualne wyzwania w zakresie przechowywania danych • Projekt SCAPE • Główne założenia i cele projektu • Proces długoterminowego przechowywania • Weryfikacja narzędzi i rozwiązań SCAPE • Przykładowe systemy i oprogramowanie • Informacje dodatkowe • Podsumowanie Agenda 2 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 3. Wprowadzenie • Zapewnienie dostępności materiałów cyfrowych w długiej perspektywie czasu dla docelowej grupy użytkowników • Czynniki ryzyka • Sprzęt komputerowy: zmiany technologiczne • Oprogramowanie: aktualizacje, wyjście z użycia • Formaty plików: zmiany w użytkowanych formatach • Brak świadomości problemów i wyzwań związanych z przechowywaniem danych • Brak aktywnego planowania w zakresie przechowywania danych 3 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 4. Aktualne wyzwania • Liczba obiektów (zdjęcia zabytków, skany dokumentów) • Heterogeniczność danych (strony internetowe, dane medyczne) • Rozmiar i złożoność obiektów (nagrania wideo, obiekty 3D) • Automatyzacja procesu przy użyciu scenariuszy przechowywania danych • Monitorowanie przechowywanych treści i ich analiza • Aktywne planowanie procesu dugoterminowego przechowywania danych 4 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 5. Projekt SCAPE • Zasadniczy cel to opracowanie skalowalnych technologii dla dużych, heterogenicznych i złożonych wolumenów danych • W szczególności • Usługi planowania i wdrażania zdefiniowanych w ramach instytucji zasad przechowywania danych • Infrastruktura w ramach której uruchamiane są procesy związane z długoterminowym przechowywaniem rozbudowanych wolumenów danych • Udoskonalenie i rozwój istniejących/nowych systemów i narzędzi informatycznych 5 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 6. 6 Partnerzy projektu SCAPE This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 7. Proces przechowywania danych w SCAPE 7 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 8. Weryfikacja rozwiązań SCAPE • Scenariusze weryfikujące bazują na problemach i wyzwaniach pojawiających się w praktyce w czterech głównych obszarach 8 treści stron internetowych biblioteki/ muzea/ repozytoria cyfrowe dane z badań dot. astrofizyki zastosowania technologii w centrach danych This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 9. 9 Przykładowe narzędzia SCAPE Plato – planowanie procesu przechowywania danych • Wspiera podejmowanie kluczowych decyzji w zakresie planowania procesu przechowywania danych • Bazuje na przeprowadzonych eksperymentach • Tworzy uruchamialny plan przetwarzania danych This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 10. Przykładowe narzędzia SCAPE C3PO – narzędzie do analizy informacji na temat przechowywanych zasobów • Analizuje metadane techniczne przechowywanych plików (przetwarza różne formaty) • Agreguje i łączy informacje z wielu kolekcji danych • Tworzy profil przechowywanych zasobów • Dostarcza atrakcyjne wizualizacje 10 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 11. Przykładowe narzędzia SCAPE Scout – zautomatyzowany system monitorowania przechowywanych danych • Monitorowanie kolekcji danych • Wykrywanie i powiadamianie o pojawiających się możliwościach i zagrożeniach • Współdzielenie informacji między instytucjami • hgp://openplanets.github.io/scout/ 11 This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 12. 12 Przykładowe narzędzia SCAPE ToMaR – skalowanie istniejących narzędzi • Umożliwia uruchamianie istniejących narzędzi na dużych ilościach danych • Wykorzystuje klastry serwerów korzystających z technologii Map-­‐Reduce • Pozwala na tworzenie procesów przetwarzania danych z wykorzystaniem wielu narzędzi This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 13. 13 Przykładowe narzędzia SCAPE Pagelyzer – monitorowanie treści stron internetowych • Wykrywa zmiany na stronach internetowych • Porównuje wyniki wyświetlania stron na różnych przeglądarkach • Oblicza częstotliwość archiwizowania stron internetowych This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 14. 14 Przykładowe narzędzia SCAPE Jpylyzer – narzędzie do walidacji plików JPEG 2000 • Zautomatyzowana walidacja plików JP2 • Umożliwia potwierdzenie tego czy dany plik jest zgodny z formatem JPEG 2000 • Ekstrachowanie technicznych informacji na temat plików JP2 • Raportuje o kluczowych właściwościach pliku This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 15. 15 Przykładowe narzędzia SCAPE Matchbox – detekcja duplikatów w dokumentach graficznych • Identyfikuje duplikatów w ramach kolekcji bez względu na rozmiar plików, format, obcięcia, obrót lub pochodzenie skanów/grafiki • Może być zastosowany w przypadku różnych typów dokumentów (manuskrypty, nuty, dokumenty drukowane) This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 16. 16 Przykładowe narzędzia SCAPE xcorrSound – porównanie dokumentów dziwękowych • Porównuje dwa pliki dzwiękowe i określa ich podobieństwo • Wykrywa podobne obszary w różnych plikach • Wykrywa wykorzystanie krótkich ścieżek audio (np. dżingli) w długich nagraniach lub serii nagrań This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 17. Wszystkie narzędzia SCAPE udostępnianie są na licencjach FLOSS Narzędzia opracowane w SCAPE są utrzymywane przez • Open Planets Foundalon skupia się na rozwiązywaniu problemów związanych z przechowywaniem danych poprzez angażowanie szerokiej społeczności • COPTR rejestr narzędzi przydatnych w procesie przechowywania danych 17 Utrzymanie narzędzi i usług SCAPE This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).
  • 18. Podsumowanie • SCAPE website: www.scape-­‐project.eu • Blog: www.openplanetsfoundalon.com/projects/scape • Narzędzia SCAPE: hgps://github.com/openplanets/scape • SCAPE Twiger: @SCAPEProject, #SCAPEProject • SCAPE Newsleger: rejestracja poprzez www.scape-­‐project.eu 18 ? This work was par,ally supported by the SCAPE Project. The SCAPE project is co-­‐funded by the European Union under FP7 ICT-­‐2009.4.1 (Grant Agreement number 270137).