Sapienza Università di Roma
Anno Accademico 2012 – 2013
Informatica per gli Archivi e le Biblioteche
Prof.ssa Linda Giuva
Prof. Maurizio Caminito
Lezione 1
1. La digitalizzazione: progetti europei e standard
1. La digitalizzazione:
Progetti europei
e standard
Sapienza Università di Roma
Anno Accademico 2012 – 2013
Informatica per gli Archivi e le Biblioteche
Prof.ssa Linda Giuva
Prof. Maurizio Caminito
1
Lezione 1
2. Il quadro di riferimento europeo
L'iniziativa
eEurope - Una società dell'informazione per tutti
varata dalla Commissione europea nel dic. 1999
e approvata dal Consiglio Europeo di Lisbona nel marzo
2000.
La "strategia di Lisbona", aveva l'obiettivo di fare
dell'Unione europea entro il 2010 l'economia della
conoscenza più competitiva e dinamica del mondo.
2
3. eEurope 2002
Consiglio Europeo di Feira (giugno 2000): viene adottato il
Piano d’azione eEurope 2002, che definisce le misure
necessarie per conseguire gli obiettivi di eEurope:
1. Accesso più economico, più rapido e più sicuro ad Internet
2. Investire nelle risorse umane e nella formazione
3. Promuovere l'utilizzo di Internet, e in particolare:
d) Contenuti europei digitali per reti globali
Gli Stati membri e la Commissione europea
vengono invitati a creare un meccanismo di
coordinamento per le politiche e i programmi di
digitalizzazione.
3
4. Principi di Lund - 1
La Commissione europea organizza a Lund
(4 aprile 2001)
un incontro fra rappresentanti ed esperti degli Stati
membri per mettere in atto un meccanismo di
coordinamento di politiche e programmi di
digitalizzazione negli Stati membri e incentivare i
contenuti culturali europei sulle reti globali.
A conclusione del meeting di esperti vengono redatti i
Principi di Lund, a partire dai quali è stato poi
sviluppato il Piano d’azione di Lund.
4
5. Principi di Lund - 2
“Le conoscenze culturali e scientifiche europee formano un
patrimonio esclusivo di pubblico valore che riflette la memoria
collettiva in perenne evoluzione delle diverse società d’Europa,
fornendo una solida piattaforma per lo sviluppo dell’industria
europea dei contenuti digitali nella società della conoscenza”
PATRIMONIO
PUBBLICO ACCESSO
DIGITALIZZAZIONE DEI CONTENUTI CULTURALI EUROPEI
DIVERSITÀ CULTURALE IN UN AMBIENTE GLOBALIZZATO
5
6. Piano d’azione di Lund
OSTACOLI
•Approccio frammentato delle attività di digitalizzazione.
•Obsolescenza delle tecnologie e di standard inadeguati.
•Mancanza di modalità di accesso semplici e universali per tutti
i cittadini. Mancanza di strutture e sistemi che consentano
l’accesso multilingue.
•I diritti di proprietà intellettuale (DPI).
•Mancanza di sinergie tra i programmi culturali e quelli basati
sulle nuove tecnologie.
•Necessità di investimenti e di un impegno da parte delle
istituzioni. 6
7. Nascita dell’NRG
La Commissione Europea chiede
agli Stati membri di nominare ufficialmente dei
rappresentanti nazionali per la digitalizzazione.
L’insieme di tali rappresentanti costituisce
il Gruppo dei Rappresentanti Nazionali
(NRG - National Representatives Group). 7
8. Compiti dell’NRG
Il NRG si riunisce ogni 6 mesi,
ospite della Presidenza di turno dell’Unione.
Compiti del NRG:
•garantire una stretta collaborazione tra i Ministeri e le
istituzioni governative e la Commissione Europea;
•essere portavoce delle politiche e dei programmi
nazionali e assicurare la diffusione delle politiche e dei
programmi comunitari a livello locale;
•dare visibilità alle iniziative nazionali;
•promuovere e monitorare l’attuazione dei principi di
Lund.
8
9. Il progetto Minerva
MINERVA è lo strumento operativo del NRG.
•progetto finanziato dalla Commissione Europea
nell’ambito del programma IST (Information Society
Technologies) nel 5° PQ.
•supporta l’attuazione del Piano di azione di Lund
MINERVA ha costituito una rete dei ministeri della
cultura europei. Ne sono membri tutti e 15 (e poi vi
aderiscono tutti gli altri) gli Stati dell’Unione.
L’Italia coordina il progetto.
9
10. La rete MINERVA (2002-2008)
• MINERVA
− finanziamento IST - FP5
− 2002-2005
• MINERVAeC
− 7 paesi europei
− finanziamento
eContentplus
•MINERVAplus − 2006-2008
− finanziamento IST – FP6 − 21 paesi europei
−2004-2006
− 14 paesi europei www.minervaeurope.org
−+ Russia e Israele
10
11. Parole chiave MINERVA
Condivisione di buone pratiche di
digitalizzazione Rete di centinaia di esperti
Stretto legame con i programmi nazionali di
digitalizzazione Coordinamento tra
Stati membri Monitoraggio dei
progressi Promozione degli
standard di digitalizzazione
11
12. Parole chiave MINERVA
APPROCCIO CROSS DOMAIN
Interscambio tra ambiti differenti
(archivi, biblioteche, musei) 12
13. Strumenti e pubblicazioni
• MINERVA – MINERVA Plus – MINERVA EC
BP: più di 150.000 download!
Buone pratiche di digitalizzazione
Cost reduction in digitisation
Multilinguismo
Qualità, accessibilità, usabilità dei
contenuti
Linee guida tecniche
relazione annuale sulla digitalizzazione
Museo & Web
Linee guida sull’IPR
Disponibili su 13
www.minervaeurope.org
14. La Carta di Parma (2003)
Riprende e rinforza e i Principi di Lund.
“Il Gruppo dei Rappresentanti Nazionali (NRG) nominati dalle
Autorità nazionali si è riunito a Parma il 19 novembre 2003 e si è
accordato sulle seguenti premesse ed articoli, che tutti insieme
costituiscono il Documento. La Carta va intesa come un documento
in evoluzione. La sua attuazione sarà portata avanti nel quadro
fornito dal Piano di Azione di Lund e dagli incontri regolari dell'NRG,
14
con il supporto operativo della Rete europea di Minerva.”
15. La Carta di Parma (2003)
• L'enorme ricchezza del patrimonio culturale e scientifico
europeo richiede che si rivolga la massima attenzione alla sua
conservazione e valorizzazione. L'avvento della società
dell'informazione e la diffusione delle nuove tecnologie
dell'informazione e della comunicazione influenzano fortemente
le politiche degli Stati Membri per quanto attiene alle iniziative
nel settore del patrimonio culturale e scientifico.
• La digitalizzazione è un passo essenziale che le istituzioni
culturali europee devono compiere, allo scopo di tutelare e
valorizzare il patrimonio culturale comune dell'Europa, di
salvaguardare la diversità culturale, di fornire ai cittadini un
migliore accesso a quel patrimonio, di sviluppare la formazione
e il turismo e contribuire allo sviluppo delle imprese nel settore
15
dei nuovi contenuti digitali e dei servizi.
16. La Carta di Parma (2003)
Articolo 10 - Costruire il futuro insieme: in prima linea verso la
società della conoscenza
Gli emergenti portali culturali on-line rappresentano un elemento di grande
importanza nello sviluppo di una società dell'informazione inclusiva. Occorre
che questi portali vengano progettati sulle solide fondamenta offerte da siti
web culturali di buona qualità, interoperabili, sviluppati per incontrare le reali
esigenze dei cittadini europei. […]
Il Gruppo dei Rappresentanti Nazionali svolgerà un ruolo guida/centrale in questo
processo, incoraggiando e supportando iniziative mirate a:
• promuovere la collaborazione fra servizi nazionali e regionali,
• incoraggiare l'adozione di modelli di successo in altri Paesi e regioni,
• sviluppare servizi on-line (e-services) per la cultura che soddisfino esigenze di
studio, del turismo e dei cittadini, nonché delle imprese del settore culturale e
creativo;
• avviare portali culturali e scientifici transeuropei basati su sistemi distribuiti.
16
17. MICHAEL (2004-2008)
Multilingual Inventory of Cultural Heritage in Europe
Censimento delle collezioni culturali di musei,
biblioteche e archivi
Creazione di servizi di
accesso nazionali
Creazione del portale europeo
17
18. Una rete, 20 nodi, migliaia di istituzioni culturali
•20 portali nazionali che condividono la stessa
filosofia
•Invio automatico dei dati al portale europeo
•Condivisione della piattaforma open source e degli
standard
•Campagne nazionali e locali per il censimento e la
catalogazione delle collezioni digitali
•Coinvolgimento di istituzioni culturali di ogni
settore e livello 18
19.
20. La rappresentazione di un documento
presente in biblioteca è unica, ma
essa può essere ricuperata in vari
modi.
Nell’universo delle schede cartacee
questo dava origine a più cataloghi.
Nel catalogo elettronico invece, una
Oltre 10.000 collezioni digitali di 4.000
sola registrazione può essere
istituzioni culturali europee
individuata attraverso più opzioni di
ricerca. http://www.michael-culture.org
20
21. Un modello di collaborazione su tre livelli
Coordinamento
europeo Europeana
Coordinamento
Aggregatore
nazionale
nazionale
Servizio
tematico
Coordinamento
regionale
Servizio regionale Servizio locale
21
22. MICHAEL: il modello dei dati
Descrive la collezione e il suo contesto
• Collezione digitale
• Istituzione (che crea, conserva e gestisce la c.d.)
• Progetto / programma (finanziamento)
• Servizio / prodotto (che rende possibile l’accesso alla c.d.)
• Collezione fisica (rappresentata in tutto o in parte)
22
23. Accesso multilingue
Traduzione delle pagine
statiche e dei contenuti
editoriali.
Traduzione delle
terminologie standard: gli
utenti possono navigare
nel portale europeo nella
loro madrelingua.
Strumenti di traduzione
automatica dei campi a
testo libero.
23
24. MICHAEL-IT: la struttura organizzativa
• Coordinamento
• MiBAC
• Collaborazioni
• 20 Regioni
• Conferenza dei Rettori Italiani (CRUI)
• Istituzioni coinvolte
• Oltre 600 istituzioni culturali afferenti al MiBAC
(biblioteche, musei, archivi, siti archeologici, uffici di tutela,
istituti centrali…
• 20 Regioni: migliaia di musei, biblioteche e archivi di
interesse locale
• Biblioteche e musei delle 77 università italiane (CRUI) 24
26. Le Istituzioni presenti in MICHAEL - IT
Per comprendere la portata dei cambiamenti proposti da REICA
e
FRBR, occorre visualizzare il tipo di catalogo che si intende
ottenere.
Quando si esegue una ricerca nei cataloghi attuali, considerato
che
si tratta ormai di cataloghi collettivi di grosse dimensioni, quello
che si ottiene il più delle volte è una gran quantità di record fra i
quali è difficile districarsi.
Esempio: cercando Goffredo Parise nel catalogo SBN si
ottengono
304 risultati, in ordine di titolo, senza distinzione fra le opere
vere e
proprie di Parise e opere in cui Parise è autore secondario
perché
parte del suo materiale è stato usato in saggi di varia natura o 26
perché ha dato un contributo secondario in opere di altri autori.
27. MICHAEL IT
Benefici per ministeri e enti locali
MICHAEL è uno strumento efficace per:
• costruire una mappa del digitale
• pianificare attività di digitalizzazione
• monitorare lo stato di avanzamento
dei programmi
• valorizzare i risultati della digitalizzazione
in un contesto europeo
27
28. MICHAEL – IT: BENEFICI
Benefici per le istituzioni culturali
• raggiungere un pubblico più vasto, nazionale e
internazionale
• ampliare le modalità di accesso alle proprie
collezioni
28
29. MICHAEL – IT
Benefici per gli utenti
Raggiungere informazioni
• di ogni settore culturale: archivi, biblioteche,
musei, patrimonio, audiovisivo, paesaggio…
• di istituzioni di ogni tipo: nazionali, regionali,
locali, piccole e grandi, pubbliche e private
• su base multilingue
• per soggetto, periodo, copertura geografica, tipo
di istituzione, full text
29
31. Gli STANDARD APERTI
• Piattaforma Open source
• Modello dati allineato al Dublin Core metadata
element set e al Dublin Core Collection Description
Application Profile
• Data base XML
• Harvesting dei metadati attraverso OAI-PMH
• Terminologie basate su standard internazionali
(ISO, UNESCO, Dublin Core, W3C…)
• I record sono pubblicati su licenza Creative
Commons ‘Attribution Non-commercial’
31
32. Open source
CODICE SORGENTE APERTO
software i cui autori (più precisamente i detentori dei diritti) ne
favoriscono il libero studio e l'apporto di modifiche da parte di
altri programmatori indipendenti. Questo è realizzato mediante
l'applicazione di apposite licenze d'uso.
Permette a programmatori geograficamente distanti di lavorare
allo stesso progetto.
Alla filosofia dell’open source si ispira il movimento open
content (contenuti aperti): in questo caso ad essere liberamente
disponibile non è il codice sorgente di un software ma contenuti
editoriali quali testi, immagini, video e musica.
Wikipedia è un esempio dei frutti di questo movimento.
32
33. Gli standard 1 – Il modello dei dati
Dublin Core metadata element set e
Dublin Core Collection Description:
sistema di metadati costituito da un nucleo di
elementi essenziali ai fini della descrizione di
qualsiasi materiale digitale accessibile via rete
informatica.
33
34. Gli standard 1 – Il modello dei dati:
Il Dublin Core
Il nucleo, proposto nel dicembre 1996, era costituito da quindici elementi di
base e si è poi esteso anche a sottoelementi o qualificatori, pur mantenendo,
nonostante gli sviluppi, una struttura stabile.
Titolo (Title)
Autore (Creator)
Soggetto (Subject)
Descrizione (Description)
Editore (Publisher)
Autore di contributo subordinato (Contributor)
Data (Date)
Tipo (Type) Natura o genere del contenuto della risorsa. L'elemento "Tipo"
include termini che descrivono categorie generali, funzioni, generi, o livelli di
aggregazione per contenuto presi generalmente da un vocabolario
controllato.
Formato (Format) Manifestazione fisica o digitale della risorsa.
34
35. Gli standard 1 – Il modello dei dati
Il Dublin Core
Identificatore (Identifier) Riferimento univoco alla risorsa. Solitamente le
risorse sono identificate per mezzo di una sequenza di caratteri alfa-
numerici.
Esempi di tali sistemi di identificazione: l’Uniform Resource Identifier (URI) (incluso l’Uniform Resource Locator
o URL), il Digital Object Identifier (DOI) e l’International Standard Book Number (ISBN).
Fonte (Source) Riferimento a una risorsa dalla quale è derivata la risorsa in
oggetto. La risorsa in questione potrebbe derivare, in tutto o in parte, da
un’altra risorsa fonte.
Lingua (Language)
Relazione (Relation) Riferimento ad una risorsa correlata.
Copertura (Coverage) Estensione o scopo del contenuto della risorsa. Include
la localizzazione spaziale (il nome o le coordinate geografiche di un luogo), il
periodo temporale (l’indicazione di un periodo, una data o una serie di date)
o una giurisdizione (ad esempio il nome di un’entità amministrativa).
Gestione dei diritti (Rights Management) Informazione sui diritti esercitati
sulla risorsa. Normalmente un elemento "Diritti" contiene un’indicazione sulla
gestione dei diritti sulla risorsa, o un riferimento al servizio che fornisce
questa informazione. Questo campo comprende gli Intellectual Property
Rights (IPR), il copyright, e vari diritti di proprietà.
35
36. Gli standard 2 – Data base XML
In seguito alla guerra dei browser (negli anni '90 tra Microsoft e Netscape)
si diffondono diverse versioni del linguaggio HTML.
Il World Wide Web Consortium (W3C), definisce un linguaggio HTML
standard e si crea un linguaggio di markup che dia maggiore libertà nella
definizione dei TAG, pur rimanendo all’interno di uno standard.
Nel 1998 le specifiche prendono il nome di
Extensible Mark-up Language.
L'XML è oggi molto utilizzato come mezzo per
lo scambio di dati tra diversi DBMS
(Database Management System). 36
38. TAG
Il tag è un testo racchiuso tra ‘<‘ e ‘>’ che
contiene informazioni circa il testo,
costituisce quindi un meta-dato circa il
dato vero e proprio che è nel testo 38
39. HTML : scrivere con le tag
<html>
<body>
Note: <br>
To: <i> Mario</i><br>
From: <i> Luca</i><br>
Title: <b>Appuntamento</b><br>
Ci vediamo domani
</body>
</html>
Note:
To: Mario
from: Luca
Title: Appuntamento
Ci vediamo domani 39
40. Dall’HTML all’XML
XML (eXtensible Markup Language) nasce
dall’intento di applicare il paradigma dei tag in
campi diversi dalla presentazione di ipertesti
•Si basa sul markup in modo simile ad HTML
•XML è pensato per descrivere dati
•I tag XML non sono predefiniti
•XML non è un linguaggio, ma un insieme di
regole per costruire particolari linguaggi
(metalinguaggio) 40
41. Gli standard 2 – XML
L’HTML definisce una grammatica per la descrizione e
la formattazione di pagine web e di ipertesti
L’XML è un metalinguaggio utilizzato per descrivere
documenti strutturati.
Mentre l'HTML ha un insieme ben definito e ristretto
di tag, con l'XML è invece possibile definirne di propri
a seconda delle esigenze
L’XML può essere usato nella definizione della
struttura di documenti, nello scambio delle
informazioni tra sistemi diversi, nella definizione di
formati di dati.
41
42. Gli standard 3 – OAI - PMH
OAI-PMH (Open Archives Initiative Protocol for
Metadata Harvesting o Protocollo per il raccoglimento
dei metadati dell'Open Archive Initiative)
La Open Archives Initiative, nota anche con l'acronimo OAI, nasce come idea
di rendere facilmente fruibili gli archivi che contengono documenti prodotti
in ambito accademico. L'intento è di promuovere strumenti semplici per
consentire di ricercare e creare servizi che rendano utilizzabili tutti i
contenuti dell'attività di ricerca.
Dopo alcuni anni lo schema OAI è stato generalizzato anche per altri tipi di
materiali digitali non strettamente legati alla ricerca accademica.
42
43. Gli standard 3 – OAI - PMH
Il modello OAI può essere descritto a due livelli:
1) Modello funzionale che ha a sua volta due componenti:
data provider: gestiscono uno o più archivi (repositories) di collezioni di oggetti digitali e
sono responsabili del loro mantenimento e della generazione dei metadati che li
caratterizzano. Supportano il protocollo OAI per consentire l'accesso ai metadati sul
contenuto.
Il data provider, al tempo stesso, mette a disposizione i metadati e ne cura la qualità e la
completezza.
service provider: gestiscono i servizi a valore aggiunto per l'aggregazione e
l'indicizzazione dei metadati (ricerca, scoperta, localizzazione degli oggetti digitali) e
interrogano gli archivi dei data provider usando le richieste del protocollo OAI per catturarne i 43
metadati.
44. Gli standard 3 – OAI - PMH
2) Modello tecnico o "Harvesting di metadati“
I service provider interrogano i data provider da cui prelevano i metadati
tramite il protocollo OAI-PMH, ("Protocol for Metadata Harvesting") e
confezionano servizi di valore aggiunto ponendosi più vicino all'utente finale
perché ne facilitano la ricerca, l'individuazione e la localizzazione di oggetti
digitali in rete.
L'informazione digitale viene vista su tre livelli:
risorsa: è l'oggetto contenuto nei digital repository mantenuti
dai data provider;
item: contenitore di tipo logico a partire dal quale vengono
diffusi i metadati;
record: sono i metadati espressi in sintassi XML secondo lo
schema DUBLIN CORE
44