1. Zasady tworzenia dobrych
kolekcji i bibliotek
cyfrowych
Dr Marek Nahotko
XVIII Seminarium Digitalizacja - 1
Warszawa, 11.01.2012
2. Dobre biblioteki cyfrowe
wg NISO Framework 3rd ed., 2007
• Trzy etapy rozwoju digitalizacji zbiorów:
– Etap eksperymentów i testów: badanie
możliwości, metod i technologii;
– Etap projektów dojrzałych: zaspakajanie
określonych potrzeb użytkowników;
– Etap trzeci: integracja rozproszonych zasobów i
zwiększenie ich wiarygodności; ważne cechy:
współdziałanie, wielokrotne stosowanie, trwałość,
weryfikowalność, udokumentowanie, zachowanie
praw autorskich.
XVIII Seminarium Digitalizacja - 2
Warszawa, 11.01.2012
3. Elementy dobrych bibliotek
cyfrowych
• Kolekcje (zorganizowane grupy
obiektów);
• Obiekty (zasoby cyfrowe);
• Metadane (dane o obiektach i
kolekcjach);
• Inicjatywy (programy lub projekty służące
tworzeniu i/lub zarządzaniu kolekcjami).
XVIII Seminarium Digitalizacja - 3
Warszawa, 11.01.2012
4. Kolekcje
Kolekcje cyfrowe zawierają obiekty
cyfrowe, wyselekcjonowane i
zorganizowane w celu ich wyszukania,
udostępniania i wykorzystywania. Dobre
kolekcje zawierają obiekty cyfrowe i
metadane je opisujące oraz
przynajmniej jeden interfejs użytkownika
pozwalający na dostęp do nich.
XVIII Seminarium Digitalizacja - 4
Warszawa, 11.01.2012
5. Kolekcje
• Zasada 1: Dobra kolekcja jest tworzona
zgodnie z jasno określoną polityką
rozwoju zasobu, uzgodnionej i
udokumentowanej przed rozpoczęciem
digitalizacji.
– Określenie celów i misji organizacji;
– Określenie odbiorcy (celowego i
niespodziewanego) i jego potrzeb;
– Powiązania z zasobami dokumentów
tradycyjnych: wspólna polityka.
XVIII Seminarium Digitalizacja - 5
Warszawa, 11.01.2012
6. Misja i cele biblioteki cyfrowej
XVIII Seminarium Digitalizacja - 6
Warszawa, 11.01.2012
8. Określenie
odbiorcy
Cyfrowy świat bibliotek - 8
Warszawa, 17-18.01.2006
9. Powiązania z OPAC
Cyfrowy świat bibliotek - 9
Warszawa, 17-18.01.2006
10. Powiązania z
OPAC:
Rekord Dublin Core w
BCPW
Rekord OPAC w BGPW
XVIII Seminarium Digitalizacja - 10
Warszawa, 11.01.2012
11. Kolekcje
• Zasada 2: Kolekcje powinny być
opisywane w taki sposób, aby użytkownik
mógł uzyskać charakterystyki kolekcji, w
tym jej zakres, format, ograniczenia
dostępu, prawa własności oraz inne
informacje ważne dla określenia
autorytarności, integralności i
umożliwienia interpretacji kolekcji.
– Metadane: informacja o zasobie i jego charakterze;
– Opisy w katalogach centralnych lub rejestrach.
XVIII Seminarium Digitalizacja - 11
Warszawa, 11.01.2012
15. Kolekcje
• Zasada 3: Dobra kolekcja jest
chroniona (curated), co oznacza, że jej
zasoby są aktywnie zarządzane w
trakcie całego ich cyklu życia.
– Ochrona od utworzenia lub uzyskania zasobu do
usunięcia;
– Działania: zarządzanie zasobami (tworzenie i
modyfikacja metadanych, modyfikacja obiektów,
uzupełnianie adnotacji, linków i in. materiałów
uzupełniających), archiwizacja.
XVIII Seminarium Digitalizacja - 15
Warszawa, 11.01.2012
16. Kolekcje
• Zasada 4: Dobra kolekcja jest ogólnie
dostępna, a jej twórcy unikają zbędnych
ograniczeń w korzystaniu z niej.
– Kolekcje powinny być dostępne dla osób
niepełnosprawnych;
– Dostępność: przez Web, 24/7, możliwa
odpłatność;
– Użyteczność: łatwość stosowania, sprzeczność
między funkcjonalnością a użytecznością;
– Potrzeba testowania różnych przeglądarek,
rozdzielczości ekranów, systemów operacyjnych.
XVIII Seminarium Digitalizacja - 16
Warszawa, 11.01.2012
20. Kolekcje
• Zasada 5: Zarządzający dobrą kolekcją
przestrzegają zasad prawa własności
intelektualnej.
– Różne punkty widzenia: właściciela oryginału,
twórcy zasobu cyfrowego, właściciela biblioteki
cyfrowej, użytkownika;
– Wiele zasobów o niepewnym pochodzeniu,
niezbędne zarządzanie ryzykiem;
– Zasady praw autorskich często niejasne, możliwe
np. prawa wielu twórców do części obiektu
złożonego.
XVIII Seminarium Digitalizacja - 20
Warszawa, 11.01.2012
21. Kolekcje
• Zasada 6: W dobrej kolekcji funkcjonują
mechanizmy dostarczania danych o jej
użytkowaniu i użyteczności.
– Ocena użyteczności zasobów i poziomu realizacji
misji w określonych odstępach czasu;
– Dane dla polityki gromadzenia, planowania
strategicznego, grantodawców;
– Metody: obserwacja, ekspertyza, wywiad, grupy
celowe, eksperyment, studium przypadków,
analiza logów transakcji;
– Miary stosowane w długich okresach czasu,
powinny być związane z celami instytucji.
XVIII Seminarium Digitalizacja - 21
Warszawa, 11.01.2012
23. Kolekcje
• Zasada 7: Dobra kolekcja współdziała z
innymi kolekcjami i systemami.
– Uwzględnianie wyników najnowszych badań i
priorytetów narodowych i międzynarodowych;
– Zapewnienie współdziałania związane z dobrymi
metadanymi i obiektami;
– Uwzględnienie istnienia portali dziedzinowych i
innych inicjatyw podobnych do naszej;
– Wymiana metadanych z wyszukiwarkami.
XVIII Seminarium Digitalizacja - 23
Warszawa, 11.01.2012
26. Kolekcje
• Zasada 8: Dobra kolekcja pozwala na
włączenie jej w przebiegi (czynności) pracy
(workflow) pracowników biblioteki oraz jej
użytkowników końcowych.
– Okazja do analizy dotychczasowej organizacji pracy;
– Integracja prac nad kolekcją z innymi zadaniami
personelu;
– Dostosowanie kolekcji do sposobu pracy użytkowników
– Włączenie użytkowników do prac (tagowanie,
umieszczanie własnych zasobów itp.).
XVIII Seminarium Digitalizacja - 26
Warszawa, 11.01.2012
28. Kolekcje
• Zasada 9: Dobra kolekcja jest trwała w
czasie, co wiąże się także z trwałością
znajdujących się w niej obiektów.
– Punkty widzenia: organizacyjny, finansowy,
techniczny;
– Związki z archiwizacją na poziomie obiektów.
XVIII Seminarium Digitalizacja - 28
Warszawa, 11.01.2012
29. Obiekty
W Przewodniku NISO uwzględniono dwa
rodzaje obiektów: obiekty digitalizowane
i obiekty oryginalnie powstałe jako
cyfrowe (born digital). Obiekty mogą
stanowić jeden plik lub wiele
połączonych plików, i/lub połączenie
plików danych z metadanymi.
XVIII Seminarium Digitalizacja - 29
Warszawa, 11.01.2012
30. Obiekty
• Zasada 1: Dobry obiekt cyfrowy istnieje
w formacie, który ułatwia jego bieżące i
przyszłe zastosowanie.
– Wymienialność obiektu pomiędzy platformami;
– Ważna jakość tworzenia obiektów;
– Różne znaczenia terminu format, np.: format pliku
(np. wg MIME), sposób kodowania ciągu bitów.
XVIII Seminarium Digitalizacja - 30
Warszawa, 11.01.2012
31. Formaty w polskich
bibliotekach cyfrowych
Lidia Derfert-Wolf (2011): 77% zasobów polskich bibliotek cyfrowych
należy do tzw. niewidzialnego Webu (pliki w formacie DjVu)
XVIII Seminarium Digitalizacja - 31
Warszawa, 11.01.2012
32. Formaty w Internet Archive
XVIII Seminarium Digitalizacja - 32
Warszawa, 11.01.2012
33. Obiekty
• Zasada 2: Dobry obiekt jest możliwy do
archiwizacji, bez względu na zmiany
stosowanej technologii.
– Dwie główne strategie: migracja (na nośniki,
oprogramowanie, formaty) i emulacja;
– Obie strategie komplementarne;
– Tworzenie kopii głównej (master) o wyższej
jakości do celów archiwizacji.
XVIII Seminarium Digitalizacja - 33
Warszawa, 11.01.2012
34. Obiekty
• Zasada 3: Dobry obiekt jest zrozumiały
i użyteczny poza swoim lokalnym
kontekstem, w którym został utworzony.
– Obiekty przenośne, współdziałąjące,
wielokrotnego użytku;
– Obiekty samoopisujące się: metadane włączone,
znany format, znane warunki dostępu.
XVIII Seminarium Digitalizacja - 34
Warszawa, 11.01.2012
35. Obiekty
• Zasada 4: Dobry obiekt jest nazwany z
wykorzystaniem trwałego, globalnie
unikalnego identyfikatora.
– Identyfikator: nazwa przydzielona obiektowi;
– Konieczna przynajmniej lokalna unikalność;
– Standardowe identyfikatory dla klas obiektów (jak
ISBN), lub płatne;
– Schemat lokalny powinien być zgodny ze
standardami i opisany;
– Mapowanie identyfikatora na zmienną lokalizację.
XVIII Seminarium Digitalizacja - 35
Warszawa, 11.01.2012
37. Obiekty
• Zasada 5: Autentyczność obiektu
powinna być określana na trzy sposoby:
– Określenie pochodzenia obiektu (proweniencja);
– Określenie czym jest obiekt;
– Stwierdzenie braku uszkodzeń i
nieupoważnionych zmian (integralność);
– Informacja o pochodzeniu obiektu i jego
modyfikacjach jest zapisywana jako metadane;
– Odesłania do wcześniejszych wersji, innych
obiektów w kolekcji.
XVIII Seminarium Digitalizacja - 37
Warszawa, 11.01.2012
38. Obiekty
• Zasada 6: Dobry obiekt zaopatrzony
jest w metadane: opisowe,
administracyjne i strukturalne (obiekty
złożone).
– Metadane włączone lub wyodrębnione;
– Najlepiej tworzyć metadane razem z obiektem;
– Możliwe istnienie wielu zestawów metadanych dla
jednego obiektu;
– Metadane także na poziomie kolekcji.
XVIII Seminarium Digitalizacja - 38
Warszawa, 11.01.2012
39. Metadane
• Metadane to ustrukturyzowana informacja
o obiekcie służąca jego opisowi,
wyszukaniu, użytkowaniu i
administrowaniu/zarządzaniu.
• Metadane: opisowe, administracyjne,
strukturalne.
• Współdziałanie schematów metadanych.
• Związek między kosztem a efektywnością.
XVIII Seminarium Digitalizacja - 39
Warszawa, 11.01.2012
40. Metadane
• Zasada 1: Dobre metadane tworzone są
w zgodzie ze standardami stosowanymi
w danej społeczności, w sposób
odpowiadający potrzebom materiałów
tworzących kolekcję, użytkowników
kolekcji oraz bieżącym i potencjalnym
sposobom wykorzystania kolekcji.
– Uwzględnienie istniejących standardów;
– Profile aplikacyjne.
XVIII Seminarium Digitalizacja - 40
Warszawa, 11.01.2012
41. Profile aplikacyjne
XVIII Seminarium Digitalizacja - 41
Warszawa, 11.01.2012
42. Metadane
• Zasada 2: Dobre metadane ułatwiają
współdziałanie.
– Współdziałanie: możliwość stosowania różnych
schematów bez potrzeby dokonywania konwersji
danych;
– Sposoby osiągnięcia współdziałania: standardowe
schematy i ich rejestry, konwersja elementów
metadanych, protokół OAI/PMH,
metawyszukiwanie z wykorzystaniem standardu
Z39.50.
XVIII Seminarium Digitalizacja - 42
Warszawa, 11.01.2012
43. Metadane
• Zasada 3: Dobre metadane pozwalają
na kontrolę autorytatywną i stosowanie
standardów: zasad katalogowania i
odwzorowania treści.
– Słowniki nazw osobowych, korporatywnych,
geograficznych, tytułów, haseł przedmiotowych;
– Wielość różnych narzędzi, brak rozwiązań do
stosowania we wszystkich przypadkach;
– Łączenie rozwiązań uniwersalnych z lokalnymi.
XVIII Seminarium Digitalizacja - 43
Warszawa, 11.01.2012
45. Metadane
• Zasada 4: Dobre metadane zawierają
warunki i zasady wykorzystania obiektu
cyfrowego.
– Należy opisać prawa własności, niezbędne
pozwolenia na wykorzystanie i jego warunki;
– Użytkownik powinien być poinformowany o
sposobie uzyskania pozwoleń;
– Cele: opis uprawnień, warunki licencji, opis
transakcji.
XVIII Seminarium Digitalizacja - 45
Warszawa, 11.01.2012
46. Warunki stosowania
XVIII Seminarium Digitalizacja - 46
Warszawa, 11.01.2012
47. Metadane dla praw
XVIII Seminarium Digitalizacja - 47
Warszawa, 11.01.2012
48. Warunki dla całej strony
XVIII Seminarium Digitalizacja - 48
Warszawa, 11.01.2012
49. Metadane
• Zasada 5: Dobre metadane ułatwiają
długoterminowe zarządzanie, ochronę i
archiwizację obiektów w kolekcji.
– Metadane administracyjne: jak i kiedy obiekt
utworzono, kto odpowiada za kontrolę dostępu lub
archiwizację, jak obiekt był przetwarzany,
ograniczenia użytkowania;
– Metadane techniczne: format, rozmiar pliku itp.;
– Metadane archiwizacyjne: opis zmian, przetwarzania
i przechowywania;
– Metadane strukturalne: powiązanie części danych.
XVIII Seminarium Digitalizacja - 49
Warszawa, 11.01.2012
50. Metadane
opisowe
XVIII Seminarium Digitalizacja - 50
Warszawa, 11.01.2012
52. Metadane
• Zasada 6: Rekordy dobrych metadanych
także są obiektami, więc dotyczą je te same
zasady, co obiektów: autorytatywność,
autentyczność, dostępność, archiwizacja,
niezmienność i unikalna identyfikacja.
– Meta-metadane: autoryzacja metadanych;
– Pomijanie metadanych przez wyszukiwarki z powodu
spoofingu i spammingu;
– Automatyczna kontrola jakości metadanych.
XVIII Seminarium Digitalizacja - 52
Warszawa, 11.01.2012
53. Inicjatywy
• Inicjatywy: połączenie projektów i
programów.
• Programy: połączenie ludzi, polityki i
narzędzi.
• Projekty: działania w ramach
programów, z określonymi celami i
czasem trwania.
XVIII Seminarium Digitalizacja - 53
Warszawa, 11.01.2012
54. Inicjatywy
• Zasada 1: Ważnym elementem dobrej
inicjatywy jest właściwe projektowanie i
planowanie.
– Planować należy wszystkie aspekty od
planowania poszczególnych działań do
projektowania strony Web biblioteki cyfrowej;
– Planowanie: celów, ograniczeń (czasowych,
zasobów, politycznych), selekcji, digitalizacji,
problemów copyright’u, metadanych, dostępu,
zarządzania, upowszechniania i oceny.
XVIII Seminarium Digitalizacja - 54
Warszawa, 11.01.2012
55. Inicjatywy
• Zasada 2: Dobra inicjatywa cyfrowa
posiada odpowiedni poziom zatrudnienia
osób z niezbędnym doświadczeniem dla
osiągnięcia jej celów.
– Stałe zadania: zarządzanie (w tym projektami),
budżetowanie, programowanie i administrowanie
systemem, selekcja zasobów, tworzenie
metadanych;
– Trzy strategie: zatrudnianie własnych pracowników,
outsourcing, współpraca z inną organizacją.
XVIII Seminarium Digitalizacja - 55
Warszawa, 11.01.2012
56. Inicjatywy
• Zasada 3: Dobra inicjatywa cyfrowa
uwzględnia najlepsze praktyki dotyczące
zarządzania projektami wszelkiego
rodzaju.
– Zarządzanie projektami: etap planowania, realizacji i
oceny wyników;
– Istnieje wiele programów wspomagających
zarządzanie (np. MS Project, dotProject).
XVIII Seminarium Digitalizacja - 56
Warszawa, 11.01.2012
57. Inicjatywy
• Zasada 4: Dobra inicjatywa ma plan
oceny wszelkich elementów projektu.
– Ocena procesu i/lub wyników;
– Miary oceny: rozmiary, jakość, wykorzystanie,
funkcjonalność, użyteczność strony Web;
– Ocena dostarcza solidnych danych dla utrzymania
projektu w długim czasie.
XVIII Seminarium Digitalizacja - 57
Warszawa, 11.01.2012
58. Inicjatywy
• Zasada 5: Dobra inicjatywa cyfrowa
posiada strategię marketingową oraz
szeroko rozpowszechnia informacje o
postępach prac i ich wynikach.
– Marketing w stosunku do potencjalnych
użytkowników; rozpowszechnianie wyników w
stosunku do specjalistów informacji naukowej;
– Metody: publikacje, prezentacje, media,
Facebook, YouTube, Google, Wikipedia.
XVIII Seminarium Digitalizacja - 58
Warszawa, 11.01.2012
61. Inicjatywy
• Zasada 6: Dobra inicjatywa cyfrowa
uwzględnia potrzeby związane z
realizacją całego cyklu życia kolekcji
cyfrowej oraz utworzonych usług
powiązanych.
– Biblioteka cyfrowa podlega tym samym reżimom,
co inne usługi i kolekcje organizacji;
– Różne wymogi na różnych etapach realizacji
inicjatywy.
XVIII Seminarium Digitalizacja - 61
Warszawa, 11.01.2012