Digital library for librarians - Biblioteca digitale per bibliotecari.
1. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Associazione Bibliotecari
Ecclesiastici Italiani
PROGETTI DIGITALI
standard, problematiche, soluzioni
L’esperienza dell’ABEI
relatore dr. Paolo Tentori
novantiqua multimedia
2. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
WEB 2.0
definizione sintetica
Rispetto al web di prima generazione pone l’accento
sulla collaborazione,
sulll’incorporazione multipla di tecnologie internet,
sul trasferimento facilitato dal desktop al web e viceversa.
Bibliografia di riferimento:
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
3. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
WEB 2.0
obbiettivo a cui tende
Architettura della partecipazione:
creare e contribuire (YouTube, Flickr, MySpace, Wikipedia)
su un’architettura di servizi web based
in modalità dinamica.
Bibliografia di riferimento:
Lattanzio Paolo, Il WEB 2.0, Università degli Studi di Teramo, 2008
http://www.slideshare.net/paololattanzio/introduzione-al-web-20-new-release-presentation
4. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
WEB 2.0
è un insieme di approcci, in modalità composita
Bibliografia di riferimento:
Lattanzio Paolo, Il WEB 2.0, Università degli Studi di Teramo, 2008
http://www.slideshare.net/paololattanzio/introduzione-al-web-20-new-release-presentation
5. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
WEB 2.0
è un acceleratore di conoscenza
Libertà di condividere e riusare i contenuti.
Bibliografia di riferimento:
Lattanzio Paolo, Il WEB 2.0, Università degli Studi di Teramo, 2008
http://www.slideshare.net/paololattanzio/introduzione-al-web-20-new-release-presentation
6. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Qual’è l’obbiettivo
Qual’è il tipo più importante da tener
di web application presente nel mio progetto
che posso scegliere considerato dal punto
di sviluppare? di vista dell’utente?
Cosa significa “utente web”?
Chi sono io? E’ una singola persona, un tipo,
un profilo, un account o qualcosa
di simile?
Che tipo di servizio web
interattivo e quali procedure
devo offrire ai miei utenti?
Qual’è il sistema migliore
per comprendere le necessità degli
utenti, modi d’uso, grado
di soddisfazione?
7. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
Struttura informatica collegata a sistemi informativi generali che fa-
cilita l’accesso universale tramite standard di fruizione nel contesto
del web ontologico.
La base di una BD a norma è formata da:
RISORSA ELETTRONICA + METADATI
La BD raccoglie documenti permanenti, si basa su tecnologie digitali, usa standard di creazione e
gestione normati, è usata da un pubblico vasto.
La BD ha quindi dei CONTENUTI (materiale in formato digitale, in raccolte identificabili di
documenti che vanno conservati) e offre dei SERVIZI (cataloghi, strumenti per la ricerca, servi-
zi integrati).
Bibliografia di riferimento:
AA.VV., Handbook on cultural web user interaction, MINERVA EC Working Group, 2008.
http://www.minervaeurope.org/publications/Handbookwebuserinteraction.pdf
Tammaro A.M., Biblioteche digitali in Italia, Fondazione Rinascimento Digitale, 2006.
http://www.culturadigitale.it/Schede/BibliotecheDigitaliItalia2006.pdf
8. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
1 - Pensare e valutare punti di forza e debolezza del proprio progetto:
studio di fattibilità
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Creative Commons, Sherpa
3 - Rispettare le buone pratiche tecniche in fase di acquisizione e gestione delle risorse:
progetto Minerva, Biblioteca Digitale Italiana, specifiche ICCU e SBN
4 - Usare strumenti omologati (anche Open Source) per il lato client e server della biblioteca
digitale:
regole W3C, protocolli OAI-PMH
5 - monitorare in continuazione i cambiamenti tecnologici e approntare le modifiche:
Protocolli di migrazione standard (XML)
Bibliografia di riferimento:
De Robbio Antonella, Terzo Modulo dello Studio Biblioteconomico per lo Studio di fattibilità della BEIC
Biblioteca Europea di Informazione e Cultura: Digitalizzazione e Copyright, BEIC, 2002.
http://eprints.rclis.org/archive/00000085/
9. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
1 - Pensare e valutare punti di forza e debolezza del proprio progetto:
studio di fattibilità
di Antonella de Robbio
10. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Creative Commons, Sherpa
11. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Creative Commons
Creative Commons (CC) è un’organizzazione non-profit dedicata all’espansione della portata delle
opere di creatività offerte alla condivisione e all’utilizzo pubblici. Essa intende altresì rendere pos-
sibile, com’è sempre avvenuto prima di un sostanziale abuso della legge sul copyright, il ricorso
creativo a opere di ingegno altrui nel pieno rispetto delle leggi esistenti.
Quando un autore decide di avvalersi di una licenza Creative Commons per una sua opera d’in-
gegno, nel suo sito comparirà un’icona specifica con la dicitura “Alcuni diritti riservati” (“Some
rights reserved”). Da lì, ogni visitatore potrà puntare al link del sommario della licenza specifica,
in modo che tutti possano conoscerne gli estremi esatti ed attenersi ad essi.
Le licenze di tipo Creative Commons permettono a quanti detengono dei diritti di copyright di
trasmettere alcuni di questi diritti al pubblico e di conservare gli altri, per mezzo di una varietà
di schemi di licenze e di contratti che includono la destinazione di un bene privato al pubblico
dominio o ai termini di licenza di contenuti aperti (open content). L’intenzione è quella di evitare
i problemi che le attuali leggi sul copyright creano per la diffusione e la condivisione delle infor-
mazioni.
Il progetto fornisce diverse licenze libere che i detentori dei diritti di copyright possono utilizzare
quando rilasciano le proprie opere sulla Rete. Il progetto fornisce anche dei metadata RDF/XML
che descrivono la licenza ed il lavoro così da rendere più facile il trattamento automatico e la ricer-
ca delle opere concesse con licenza creative commons.
Bibliografia di riferimento:
Voce Creative Commons sul sito Wikipedia
http://it.wikipedia.org/wiki/Creative_Commons
12. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Creative Commons
Le licenze Creative Commons attualmente disponibili in Italia sono quattro. Queste licenze danno la massima
garanzia dei diritti d’autore e di libera circolazione così come ripensati dall’organizzazione. Al tempo stesso, sono
perfettamente rispondenti alle normative giuridiche italiane. Le quattro licenze possono essere anche utilizzate in
combinazione tra di loro, là dove ciò non crei problemi d’interpretazione. In questo modo le possibilità comples-
sive di tutela del diritto d’autore salgono a sei. Vediamo in dettaglio le quattro licenze base.
Attribution / Attribuzione della paternità. L’autore permette il massimo uso dell’opera: la sua copia, la sua
distribuzione, la sua pubblicazione. Vale anche per le opere derivate, ossia opere che utilizzano e rielaborano il
materiale originale. Il tutto, però, deve avvenire soltanto sotto la condizione che chi compie tale azione citi chiara-
mente autore e fonte dell’opera.
Non commercial / Non commerciale. Vale come la precedente licenza, ma la condizione posta in essere que-
sta volta è che il licenziatario non abbia propositi commerciali. Se li ha (anche in maniera indiretta) è necessario
che ottenga l’autorizzazione dall’autore dell’opera originale. Se per esempio si vogliono utilizzare delle fotografie
tutelate da questa licenza per una rivista in vendita al pubblico o su abbonamento è necessaria l’autorizzazione
dell’autore delle foto.
No derivative works / Inalterabilità dell’opera. L’autore permette la copia, la distribuzione o la riproduzione
dell’opera soltanto a condizione che la copia sia letterale e nell’interezza dell’opera. Eventuali modifiche dell’opera
non sono concesse ed è necessaria l’autorizzazione dell’autore originale.
Share alike / Stessa licenza. Riguarda le opere derivate e in pratica permette che l’opera sia rielaborata e riutiliz-
zata soltanto a condizione tutte le opere che ne derivano siano distribuite tramite l’identica licenza dell’originale.
Bibliografia di riferimento:
Sito di Creative Commons Italia
http://www.creativecommons.it/
13. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Sherpa
Rispetto a Creative Commons (CC) Sherpa è un progetto non-profit dedicato all’espansione della
portata delle opere di creatività offerte alla condivisione e all’utilizzo pubblici nell’ambito della
comunicazione scientifica.
Cos’è l’Accesso Aperto (Open Access)?
La libera disponibilità in rete della letteratura scientifica e la possibilità per ogni utente di leggere,
scaricare, copiare, stampare, distribuire, ricercare, creare dei link ai full text, indicizzare, passarne i
dati al software, o utilizzarla per ogni altro scopo legale.
Le sole restrizioni poste alla riproduzione e distribuzione, così come per il copyright, in questo
ambito, attengono all’esigenza di mantenere il controllo dell’autore sull’integrità dell’opera e il di-
ritto dell’autore ad essere riconosciuto e citato correttamente.
Romeo-Rights Metadata for Open Archiving, sito oggi aggiornato dal progetto SHERPA in
UK e sul sito di E-prints offre servizi di help desk presso gli archivi istituzionali sulle questioni
relative al copyright, supporto agli autori per il contratto editoriale.
Bibliografia di riferimento:
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
14. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Sherpa - Romeo
Sul sito di Sherpa vengono riportate le politiche editoriali relative al copyright dei principali edi-
tori internazionali.
Agli editori vengono assegnati dei colori diversi a seconda della politica adottata:
Bianco: non viene autorizzata l’autoarchiviazione.
Giallo: consentita l’auto-archiviazione del pre-print (bozza prereferaggio)
Blu: consentita l’autoarchiviazione del post-print (bozza della versione finale dell’articolo che sarà
pubblicata dal sito).
Verde: consentita sia l’archiviazione del pre-print che del post-print.
Bibliografia di riferimento:
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
15. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
2 - Valutazione e acquisizione dei diritti d’uso e divulgazione:
Sherpa - Juliet
Raccoglie le politiche per l’Open Access e per l’archiviazione dei contributi scientifici formulate
dalle più importanti istituzioni internazionali che finanziano la ricerca scientifica.
Juliet intende fornire risposte certe in merito ad una serie di interrogativi, quali:
cosa le politiche indicano debba essere fatto;
cosa gli autori dovrebbero archiviare;
quando dovrebbero archiviare;
dove dovrebbero archiviare i risultati della propria ricerca.
Bibliografia di riferimento:
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
16. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
3 - Rispettare le buone pratiche tecniche in fase di acquisizione e gestione delle risorse:
progetto Minerva, Biblioteca Digitale Italiana, specifiche ICCU e SBN
17. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
4 - Usare strumenti omologati (anche Open Source) per il lato client e server della biblioteca
digitale: regole W3C, protocolli OAI-PMH, standard metadati DC, MAG, METS.
18. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE (BD)
5 regole pratiche per costruire una buona biblioteca digitale
5 - monitorare in continuazione i cambiamenti tecnologici e approntare le modifiche:
Protocolli di migrazione standard (XML e metadati).
19. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
Da planetari, macchine digitali, dorsi fotografici
Per le buone pratiche e le specifiche tecniche dei sensori (CCD, CMOS) si vedano le dispense dei
corsi precedenti. In generale per la prassi: attenzione alle luci e al fuoco (per le DM in particolare
mai fuoco automatico). La risoluzione in acquisizione è direttamente proporzionale al numero di
pixel del sensore.
Esempi di acquisizione da Canon EOS 350D (8 milioni di pixel) con set di luci differenti.
Bibliografia di riferimento:
Gruppo di lavoro del Progetto Minerva, Manuale di buone pratiche per la digitalizzazione del patrimonio
culturale, Progetto Minerva, 2004.
http://www.minervaeurope.org/structure/workinggroups/goodpract/document/buonepratiche1_3.pdf
20. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
Da scanner piano
Per le buone pratiche e le specifiche tecniche degli scanner si vedano le dispense dei corsi prece-
denti (scaricabili dalla pagina formazione del sito novantiqua). In generale per la prassi: non tutto
il materiale librario può essere digitalizzato a scanner piano. La qualità delle scansioni a scanner
piano è comunque ancora a tutt’oggi ineguagliabile in confronto alle altre tecnologie digitali.
Esempio di acquisizione da Epson Scan A4.
Bibliografia di riferimento:
Gruppo di lavoro del Progetto Minerva, Manuale di buone pratiche per la digitalizzazione del patrimonio
culturale, Progetto Minerva, 2004.
http://www.minervaeurope.org/structure/workinggroups/goodpract/document/buonepratiche1_3.pdf
21. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
Pensare da subito “quanto peserà” in rete il vostro patrimonio
Lo sturt up di Europeana, il più grande progetto di biblioteca digitale dell’Unione Europea è an-
dato subito in tilt per il grande numero di accesi (10.000.000 di occorrenze alla prima apertura).
In progetti anche più piccoli, come MOdiSCA (montagne di scatti) abbiamo fatto il calcolo
che solo la gestione delle riviste storiche (circa 25.000 scansioni) avrà ‘un peso’ di circa 120 Gb
nell’archivio di conservazione, 20 Gb in rete su pdf di buona risoluzione, comunque una mas-
sa di bit troppo ‘rischiosa’ e costosa per la gestione a lungo termine. Una buona soluzione è la
compressione dei file in DjVu che abbatte di circa 10 volte, a stessa parità di qualità in fruizione,
il peso di un pdf.
L’archivio di MOdiSCA per le riviste storiche peserà quindi in totale circa 2Gb per tutto il patri-
monio storico on line (25.000 pagine).
Bibliografia di riferimento:
Gruppo di lavoro del Progetto Minerva, Manuale di buone pratiche per la digitalizzazione del patrimonio
culturale, Progetto Minerva, 2004.
http://www.minervaeurope.org/structure/workinggroups/goodpract/document/buonepratiche1_3.pdf
23. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
provare DjVu
E’ possibile testare on line le funzionalità di DjVu tramite il server di DjVuZone e il servizio di Any2DjVu. Pagi-
na internet: http://any2djvu.djvuzone.org/ . Il sito processa sia file pdf, che file tif, che foto.
Bibliografia di riferimento:
Cos’è DjVu, Sito Biblioteca Digitale di Biblioteca Augusta di Perugia
http://cdwdoc.demo.alchimedia.it/guida.aspx
24. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
provare DjVu
Fatto individuare il file che ci interessa sul nostro computer il processo di conversione inizia in modo automati-
co.
Bibliografia di riferimento:
Cos’è DjVu, Sito Biblioteca Digitale di Biblioteca Augusta di Perugia
http://cdwdoc.demo.alchimedia.it/guida.aspx
25. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
provare DjVu
Una volta creato il file DjVu è pronto per essere scaricato sul nostro computer.
Bibliografia di riferimento:
Cos’è DjVu, Sito Biblioteca Digitale di Biblioteca Augusta di Perugia
http://cdwdoc.demo.alchimedia.it/guida.aspx
26. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
provare DjVu
Tramite il viewier di DjVu o il plug-in del browser possiamo vedere e confrontare il risultato paragonandolo col
file sorgente.
Bibliografia di riferimento:
Cos’è DjVu, Sito Biblioteca Digitale di Biblioteca Augusta di Perugia
http://cdwdoc.demo.alchimedia.it/guida.aspx
27. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
ACQUISIRE LE RISORSE
provare DjVu
Si noti nella tabellina a sin. la differenza di KB tra i file djvu e quelli originali in tif.
Bibliografia di riferimento:
Cos’è DjVu, Sito Biblioteca Digitale di Biblioteca Augusta di Perugia
http://cdwdoc.demo.alchimedia.it/guida.aspx
28. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
Esistono (generalizzando) due grandi gruppi di biblioteche digitali:
quelle rivolte alla letteratura scientifica (Open Access Repository) che
coinvolgono principalmente le università italiane che hanno firmato la di-
chiarazione di Messina sull’Open Access. Comprende almeno 32 archivi
istituzionali, 1 service provider (PLEIADI curato da CILEA-CASPUR).
I software base per la gestione della biblioteca sono EPrints e DSpace.
Bibliografia di riferimento:
Tajoli Zeno, DOI: uno strumento per costruire la biblioteca digitale. Bollettino AIB 45(1), 2005
http://eprints.rclis.org/archive/00003981/
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
29. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
quelle rivolte alla gestione di collezioni digitali fotografiche che coin-
volgono archivi, biblioteche (anche piccole come quelle dell’ABEI).
I software base per la gestione di queste biblioteche digitali sono molte-
plici. Per il tipo di obbiettivo di questo corso valuteremo Greenstone e la
possibilità di una biblioteca digitale posta su un CMS: Plone.
Bibliografia di riferimento:
Tajoli Zeno, DOI: uno strumento per costruire la biblioteca digitale. Bollettino AIB 45(1), 2005
http://eprints.rclis.org/archive/00003981/
Gargiulo Paolo, L’Open Access come risorsa, Università degli Studi di Trieste, 2007
http://www.openstarts.units.it/dspace/bitstream/10077/2542/1/Gargiulo.pdf
30. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
Un esempio di biblioteca digitale: Picture Australia della National Library
of Australia.
Bibliografia di riferimento:
Tajoli Zeno, DOI: uno strumento per costruire la biblioteca digitale. Bollettino AIB 45(1), 2005
http://eprints.rclis.org/archive/00003981/
Ridi Riccardo, La biblioteca digitale: definizioni, ingredienti e problematiche. Bollettino AIB 44(3), 2004.
http://eprints.rclis.org/archive/00002535/
31. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
La scheda on line segue i criteri della catalogazione classica (vocabolari
normati, buone pratiche, standard di classificazione).
Bibliografia di riferimento:
Ceccato Evelina, La biblioteca digitale tra progetti e realtà, Bibliotime anno III (2), 2000.
http://didattica.spbo.unibo.it/bibliotime/num-iii-2/ceccato.htm
32. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
Aprendo semplicemente il “source” dal browser identifichiamo modelli e
tecniche specifiche (ad. es. schema del W3C tramite dtd) per la costruzione
della pagina on line.
Bibliografia di riferimento:
Diodati Michele, Cos’è una DTD e perché occorre dichiararne una, diodati.org, 2008.
http://www.diodati.org/scritti/2004/guida/ele_acc19.asp
33. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
L’informazione bibliografica che vediamo on line possiede quindi tutta una
serie di collegamenti invisibili interni ed esterni a formati e a schemi di vali-
dazione così da divenire significativa e pertinente.
Bibliografia di riferimento:
Ciotti Fabio, XML e la biblioteca digitale, Uni Sapienza - Uni Pavia, 2007.
www.storia.unina.it/perfez/ XML_e_la_biblioteca_digitale.ppt
34. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
Rispettare la grammatica base (xhtml, css) per la validazione e l’accessibili-
tà. E’ possibile far eseguire in automatico test di validazione dal W3C.
35. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
Usare strumenti semplici per farsi trovare e per identificare le proprie risor-
se. Ad es. META names nell’head del documento html.
36. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
Usare strumenti semplici per farsi trovare e per identificare le proprie risor-
se. Ad es. i nuovi strumenti di google webmaster.
37. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
breve introduzione ad XML
Per dimostrare in modo pratico l’uso e l’utilità di XML abbiamo riscritto il
sito novantiqua da html in xml (per provare on line e vedere il source basta
scrivere http://www.novantiqua.it/index.xml).
38. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
breve introduzione ad XML
Facciamo validare il sito dal W3C per eventuali errori di logica.
39. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL LINGUAGGIO DI INTERNET
breve introduzione ad XML
XML DEFINIZIONE
XML è un metalinguaggio.
XML serve per creare documenti marcati (delimitati da tag).
XML è puro testo, quindi facilmente leggibile sia dalle macchine che da un utente.
XML definisce e crea strutture dati indipendenti dalla piattaforma (WIN, MAC, UNIX) ed autodescrittive
(per cui autonome nella logica di creazione ed esecuzione).
XML può usare il protocollo HTTP.
Bibliografia di riferimento:
AA.VV., Guida XML di base, Sito xmlhtml.it, 2008
http://xml.html.it/guide/leggi/58/guida-xml-di-base/
40. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
STRUTTURA DI UN DOCUMENTO XML
prologo
Contiene una dichiarazione XML obbligatoria che definisce gli attributi del tag.
Questi attributi sono:
version: versione dello XML usato;
encoding: codifica dei caratteri usata nel documento;
standalone: riferimento o meno ad altri file esterni.
Opzionale ma importante è la dichiarazione DOCTYPE, cioé il riferimento a specifiche o a schemi (DTD, XML-
Schema) che definiscono formalmente il linguaggio utilizzato nel documento e le sue regole sintattiche.
Bibliografia di riferimento:
AA.VV., Guida XML di base, Sito xmlhtml.it, 2008
http://xml.html.it/guide/leggi/58/guida-xml-di-base/
41. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
STRUTTURA DI UN DOCUMENTO XML
corpo
Il corpo contiene:
testo;
tag (delimitatori di struttura);
annotazioni;
istruzioni di processo e di elaborazione automatica;
entità (macro testuali);
attributi e namespaces.
Bibliografia di riferimento:
AA.VV., Guida XML di base, Sito xmlhtml.it, 2008
http://xml.html.it/guide/leggi/58/guida-xml-di-base/
42. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
STRUTTURA DI UN DOCUMENTO XML
corpo
ELEMENTI
Gli elementi stanno alla base della struttura dei documenti XML.
Un elemento è un frammento di dati, limitato ed identificato (tramite un nome) da un tag.
Il contenuto di un elemento è tutto ciò che appare tra il suo tag di apertura e il suo tag di chiusura.
Gli elementi possono essere nidificati, cioé degli elementi possono far parte del contenuto di un elemento più
esterno.
Gli elementi, nidificandosi, creano la struttura ad albero tipica dei documenti XML.
Bibliografia di riferimento:
AA.VV., Guida XML di base, Sito xmlhtml.it, 2008
http://xml.html.it/guide/leggi/58/guida-xml-di-base/
43. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
CARATTERISTICHE BASE
DEL DOCUMENTO DIGITALE
- Identificabile in modo univoco
- Coerente rispetto all’insieme della raccolta
- Significativo dal punto di vista dell’informazione che contiene
- Accessibile
44. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
CARATTERISTICHE
DELLA COLLEZIONE
- Coerenza (nell’insieme)
- Significato (informativo)
- Controllo (tramite standard)
- Accesso (tramite descrizione ed analisi)
45. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
STRUMENTI FONDAMENTALI
DELLA BIBLIOTECA DIGITALE
- A livello di sistema: interfaccia lato client (utente) e lato server.
- A livello informativo: organizzazione del sapere (metadati e sistemi
di reference)
- A livello sociale: fattori umani, organizzativi, di politica dell’informazione.
Bibliografia di riferimento:
Leombroni Claudio, Appunti per un’ontologia delle biblioteche digitali: considerazioni sulla Biblioteca
digitale italiana, Bollettino AIB (2), 2004.
http://www.aib.it/aib/boll/2004/0402115.htm
46. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
SCHEMA FUNZIONALE
DI UNA BIBLIOTECA DIGITALE
- Infrastruttura di rete
- Database bibliografico - metadati (data e metadata repository)
- Deposito oggetti digitali (digital repository)
- Storage (fonti digitali e modalità mirror)
- Interfaccia ( per l’accesso)
- Periferiche
- OPAC / WEB OPAC (compatibilità con basi esterne Z39.50, SRU-SRW)
- CMS (Content Management System)
- Grafica, statistica, sicurezza....
Bibliografia di riferimento:
Leombroni Claudio, Appunti per un’ontologia delle biblioteche digitali: considerazioni sulla Biblioteca
digitale italiana, Bollettino AIB (2), 2004.
http://www.aib.it/aib/boll/2004/0402115.htm
47. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BIBLIOTECA DIGITALE
in sintesi
Componenti di una biblioteca digitale:
- la collezione
- servizi per l’accesso
- utenza
Bibliografia di riferimento:
Leombroni Claudio, Appunti per un’ontologia delle biblioteche digitali: considerazioni sulla Biblioteca
digitale italiana, Bollettino AIB (2), 2004.
http://www.aib.it/aib/boll/2004/0402115.htm
48. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
Universal versus Uniform
Una delle problematiche nella gestione di risorse on line è quella di poter identificare in modo univoco e disambi-
guo ogni singolo file. Allo scopo esistono protocolli di assegnazione di identificativi da parte di enti deputati che
gestiscono i registri dei numeri assegnati ad enti ed imprese (registration Authority come IANA, agenzie di regi-
strazione DOI - Digital Object Identifier come mEDRA ) o identificatori OAI (che puntano più ai metadati
che alla risorsa usando tecnologie dell’Handle System).
Dominio dei nomi: spazio dei nomi con una sola autorità amministrativa per la denominazione e il controllo
(centro responsabile dell’assegnazione).
Bibliografia di riferimento:
Sebastiani Mario, Identificatori persistenti per gli oggetti digitali, ICCU, 2005
http://digitalia.sbn.it/upload/documenti/digit00_sebastiani.pdf
49. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
Nomi, indirizzi
Tipi di nomi: indirizzi (fisici e logici); porte, processi, gruppi; testuali: utente (nomi propri, login, id, indrizzi email,
computer); servizi (file service, printer service); file (librerie, programmi, codici,directories).
Esempio: URL (Uniform Resource Locator) usato per identificare le risorse sul web.
Bibliografia di riferimento:
Balsamo Simonetta, Reti di calcolatori. Names services, Università Ca’ Foscari di Venezia, 2005
sara.unile.it:16080/~epicoco/lingue/page3/files/DNS.pdf
50. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
URL, URI, URN
URL (Uniform Resource Locator) si identifica meglio tramite URI (Uniform Resource Identifier) o
URN (Uniform Resource Name): nome persistente anche in caso di rilocazione perché registrato in un servizio
di gestione di ricerca URN: <nome risorsa, URL>. Una URN, a differenza di una URL, esprime il nome di un
oggetto in un dato spazio.
urn: spazio_nomi: nome_specifico_nello_spazio_nomi. Un URN può essere usato per parlare di una risorsa senza
lasciar intendere la sua ubicazione o come ottenerne la rappresentazione.
Es: l’URN: ISBN:88-901456-255-1 (dove ISBN è lo spazio nomi libri; 88-901456 l’identificatifo di Novantiqua
Multimedia) è un URI che consente di individuare univocamente un libro mediante il suo nome nel namespace dei
codici ISBN, ma non suggerisce dove e come possiamo ottenere una copia di tale libro.
Altro es.di URN: IANA: 322669 (dove IANA è lo spazio nome imprese; 322669 è il codice PEN (Private Enter-
prise Number) di Novantiqua Multimedia.
Bibliografia di riferimento:
Balsamo Simonetta, Reti di calcolatori. Names services, Università Ca’ Foscari di Venezia, 2005
sara.unile.it:16080/~epicoco/lingue/page3/files/DNS.pdf
51. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
URL - percorso
Con il termine percorso (in inglese path) si intende la parte che comprende cartelle e nome file in un URL.
Nel caso ad esempio dell’URL
http://www.novantiqua.it/document.htm il percorso corrisponde a document.htm.
La prima parte http:// indica il tipo di server
La seconda parte www.novantiqua.it indica il nome del dominio, ovvero il nome del sito web in cui la pagina è
ospitata.
La terza parte (il percorso visto sopra) indica il nome e la posizione della singola pagina o file a cui si vuole acce-
dere (questa pagina è anche un URI: Uniform Resource Identifier).
Bibliografia di riferimento:
Balsamo Simonetta, Reti di calcolatori. Names services, Università Ca’ Foscari di Venezia, 2005
sara.unile.it:16080/~epicoco/lingue/page3/files/DNS.pdf
52. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
URL - dominio
Con il termine dominio si identifica il nome che si dà ad un indirizzo web ed è composto da due parti: il
nome e l’estensione. Ad es. tuodominio.it. I nomi a dominio e le sue estensioni sono attribuite ad un unico organi-
smo, chiamato Registro del ccTLD.it (country code Top Level Domain “it” - ISO 3166) che ha sede presso il CNR
di Pisa. Quindi l’URL nel caso dei siti internet è quasi sempre preceduto da http:// seguito dal nome del dominio e
dai nomi di cartelle e files che vogliamo riportare. Essendo il dominio un idetificativo registrato presso un pubblico
registro può essere una buona base per l’identificazione normata delle nostre risorse. Per cui un URI (Uniform
Resource Identifier) è una stringa che identifica univocamente una risorsa generica che può essere basato su un
URL come un indirizzo web. Un URL è quindi un URI che, oltre ad identificare una risorsa, fornisce i mezzi per
agire su o per ottenere una rappresentazione della risorsa descrivendo il suo meccanismo di accesso primario o la
sua ubicazione (location) in una rete.
Bibliografia di riferimento:
Balsamo Simonetta, Reti di calcolatori. Names services, Università Ca’ Foscari di Venezia, 2005
sara.unile.it:16080/~epicoco/lingue/page3/files/DNS.pdf
53. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
Un buon sistema per gestire le risorse ed identificarle in modo univoco è l’uso di RDF. Resource Description
Framework (RDF), raccomandazione del W3C, è un’applicazione di XML, una base per il trattamento dei me-
tadati e fornisce interoperabilità tra le applicazioni che scambiano informazioni comprensibili alle macchine sul
Web. Il modello dei dati RDF offre una struttura concettuale, astratta, per la definizione e l’uso di metadati. Per
creare e scambiare questi metadati sarà necessaria anche una sintassi concreta. Questa specifica RDF usa la
codifica XML come sintassi di interscambio. RDF richiede inoltre l’utilizzo di namespaces XML per asso-
ciare ciascuna proprietà allo schema in cui è definita la proprietà.
Bibliografia di riferimento:
De Robbio Antonella, URI, URN e URL, una questione di definizioni: Universal versus Uniform, 2001
eprints.rclis.org/archive/00000212/01/UR.pdf
54. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
RDF può essere utilizzato in diverse aree di applicazione: nella ricerca di risorse, per migliorare le capacità dei
motori di ricerca; nella catalogazione, per descrivere il contenuto e le relazioni tra le risorse disponibili in un
particolare sito Web, in una pagina o in una biblioteca digitale; può essere usato da agenti software intelligenti, per
facilitare la condivisione e lo scambio di conoscenza; nella valutazione di contenuto; per descrivere i diritti
di proprietà intellettuale di pagine Web e per esprimere le preferenze sulla riservatezza da parte di un utente; RDF,
associato alla firma digitale può contribuire alla costruzione di un “Web affidabile” per il commercio elettronico,
per la collaborazione e per altre applicazioni.
Bibliografia di riferimento:
De Robbio Antonella, URI, URN e URL, una questione di definizioni: Universal versus Uniform, 2001
eprints.rclis.org/archive/00000212/01/UR.pdf
55. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
RDF identifica univocamente le proprietà mediante il meccanismo dei namespace XML [XMLns], che for-
niscono un metodo per identificare in maniera non ambigua la semantica e le convenzioni che regolano l’ utilizzo
delle proprietà, identificando l’authority che gestisce il vocabolario. Uno degli esempi più noti è la Dublin Core
Initiative [DC]. Si può utilizzare un namespace XML per identificare in maniera non ambigua lo schema per
il vocabolario Dublin Core puntando alla risorsa Dublin Core che ne definisce la semantica. La descrizione
di una risorsa può utilizzare le proprietà definite nel namespace Dublin Core, o alcune di esse, eventualmente
aggiungendo altre proprietà che rispondano a esigenze specifiche, semplicemente puntando al namespace che ne
definisce la semantica.
Ogni risorsa viene definita attraverso gli URI (Uniform Resource Identifier) ossia delle stringhe che le
identificano in maniera univoca. Gli URI superano le limitazioni degli URL (Uniform Resource Locator) che
definiscono risorse specifiche della rete, quali immagini, pagine web, documenti, e che si riferiscono alla loro lo-
calizzazione e protocollo. Infatti tramite gli URI possono essere definiti anche elementi non accessibili in rete o
concetti astratti.
Bibliografia di riferimento:
ICCU, Sezione Bib, 2008
http://www.iccu.sbn.it/directories/Addenda%20Manuale%20MAG%202.0.1%20per%20archivi/addenda_re-
ference_MAG_archivi.pdf
56. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
Anche nel caso di RDF esistono in rete programmi a disposizione gratuita per la generazione di file ben formati e
validati dal W3C. Facciamo un esempio descrivendo il file di un codice del sec. XI ospitata sul sito del Museo Vir-
tuale del Romanico a Civate. Photo RDF-Gen ci chiederà di specificare l’URL del file e di descriverne i contenuti
più importanti in un modulo a campi semplice e logico. Alla fine della compilazione cliccando su un tasto verrà
generato il file che possiamo copiare ed archiviare per i nostri bisogni.
Bibliografia di riferimento:
De Robbio Antonella, URI, URN e URL, una questione di definizioni: Universal versus Uniform, 2001
eprints.rclis.org/archive/00000212/01/UR.pdf
57. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
Il file che ne deriva è quello riportato sotto che possiamo così descrivere:
dalla riga 3 alla riga 15 vengono definiti gli schemi di riferimento dei name spaces. I nomi di proprietà devono es-
sere associati con uno schema. Ciò può ottenersi qualificando i nomi degli elementi con un prefisso di namespace
per connettere in modo non ambiguo la definizione della proprietà con il corrispondente schema RDF .
La riga 17 fa riferimento in modo univoco alla risorsa descritta, quella che noi abbiamo scelto specificandone
l’URL.
Bibliografia di riferimento:
De Robbio Antonella, URI, URN e URL, una questione di definizioni: Universal versus Uniform, 2001
eprints.rclis.org/archive/00000212/01/UR.pdf
58. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF
In seguito vengono definite tutta una serie di proprietà quali “titolo”, “descrizione”, “soggetto”, ecc. che fanno
riferimento allo schema di interpretazione normato di Dublin Core (DC). Come abbiamo già detto in RDF il
significato è espresso attraverso il riferimento ad uno schema. Si può immaginare lo schema come una sorta di
dizionario. Uno schema definisce i termini che saranno usati nelle asserzioni RDF ed assegna ad essi un significato
specifico. In RDF può essere adoperata una serie di forme di schemi, compresa quella definita in un altro docu-
mento (RDFSchema) che presenta caratteristiche particolari per l’implementazione automatica di processi che
utilizzano RDF.
Bibliografia di riferimento:
De Robbio Antonella, URI, URN e URL, una questione di definizioni: Universal versus Uniform, 2001
eprints.rclis.org/archive/00000212/01/UR.pdf
59. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Identificare le risorse
RDF, riassumendo...
L’RDF si basa su tre principi chiave:
- Qualunque cosa può essere identificata da un Universal Resource Identifier (URI).
- The least power : utilizzare il linguaggio meno espressivo per definire qualunque cosa.
- Qualunque cosa può dire qualunque cosa su qualunque cosa.
Il modello di dati RDF è formato da risorse, proprietà e valori. Le proprietà sono delle relazioni che legano tra
loro risorse e valori, e sono anch’esse identificate da URI. Un valore, invece, o è una risorsa o è un tipo di dato
primitivo.
L’unità base per rappresentare un’informazione in RDF è lo statement. Uno statement è una tripla del tipo:
Soggetto – Predicato – Oggetto
dove il soggetto è una risorsa, il predicato è una proprietà e l’oggetto è un valore.
ES: http://www.museovirtualedicivate.it è stato creato da Claudio
Soggetto Predicato Oggetto
Risorsa Struttura Istanza
Risorsa Attributo Valore
Bibliografia di riferimento:
Signore Oreste, Semantic web: il futuro è già qui?, JEKPOT srl, 2005.
www.weblab.isti.cnr.it/publications/publications.pdf
60. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
SISTEMI DI BIBLIOTECA DIGITALE
OPEN SOURCE
Sistema Piattaforma Tecnologia Standard supportati
EPrints Unix mySQL, PERL Open Archives
DSpace Java su Unix postgreSQL Open Archives
Mac OSX, Win
Greenstone Unix, Win GDBM, MG Z39.50, Open Archives
Mac OSX PERL, C++
Koha Unix, Win mySQL, PERL Z39.50, MARC
Koha più che una DB (Digital Library) è un ILMS (Integrated Library Management System).
Si veda al riguardo il contributo riportato sotto in bibliografia.
Bibliografia di riferimento:
Kumar Vimal, Open source Library Management Systems, Slideshar, 2005.
http://www.slideshare.net/vimal0212/open-source-library-management-systems
61. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Architettura logica di una biblioteca digitale
- Repository dei documenti primari
- Repository dei metadati
- Sistema di immissione dei matadati
- Modulo di interfaccia basato sul web
Bibliografia di riferimento:
Ciotti Fabio, Biblioteca Italiana: predisposizione delle fonti per l’utilizzo degli studiosi, Parma, 2007.
https://dspace-unipr.cilea.it/handle/1889/580
62. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Biblioteca digitale come deposito istituzionale
Contiene: copia degli articoli pubblicati, degi interventi a conferenze, lavori svolti nell’ambito dell’attività accade-
mica, strutturazione di risorse documentarie di qualsiasi tipo.
Un deposito istituzionale serve per:
MEMORIZZARE in un archivio stabile e sicuro.
Bibliografia di riferimento:
Ciotti Fabio, Biblioteca Italiana: predisposizione delle fonti per l’utilizzo degli studiosi, Parma, 2007.
https://dspace-unipr.cilea.it/handle/1889/580
63. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
STRUMENTI DELLA BIBLIOTECA DIGITALE
il database, i pacchetti software client e server
Una delle difficoltà principali che un bibliotecario medio trova nell’accostarsi al mondo delle biblioteche digitali è
quella di capire la struttura della biblioteca.
In soldoni possiamo dire che una biblioteca digitale ha sempre due settori base:
il lato SERVER e il lato CLIENT.
Sempre semplificando:
sul lato SERVER c’è il DATABASE della biblioteca (risorse digitali e metadati);
sul lato CLIENT ci sono gli STRUMENTI di creazione delle risorse (file digitali e metadati).
In sintesi:
sia che lavoriate OFF LINE (cioé solo sul vostro computer), sia che lavoriate ON LINE (cioè interagendo diret-
tamente col server) troverete sempre (“ACCESO” o da “ACCENDERE”):
un DATABASE: mySQL, tomcat, PostgreQL, database dedicati...
l’applicativo client della BIBLIOTECA DIGITALE che avete scelto (Greenstone, DSpace, Fedora, EPrint,
ecc.).
NON tutti i pacchetti client sono banali nell’installazione e nella configurazione. La scelta va fatta in base ai bisogni
e agli obbiettivi della vostra struttura.
Esistono comunque buone soluzioni Open Source, standardizzate, gratuite per costruire una biblioteca
digitale.
Facciamo qualche esempio e un po’ di esperimenti insieme per prendere confidenza col mondo dei metadati e
delle risorse sui repository.
Bibliografia di riferimento:
Pasqui Valdo, Portali: funzionalità e tecnologie nel contesto bibliotecario, unipr.cilea.it, 2006
https://dspace-unipr.cilea.it/bitstream/1889/509/1/Portali_appunti_dispensa_Valdo_Pasqui.pdf
64. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ UN DATA BASE?
Un Data Base (traducibile in italiano come “base di dati”) non è altro che un insieme di dati logicamente correlati
fra loro.
I Data Base Management System (DBMS) sono quindi i prodotti software in grado di gestire i database; le loro
caratteristiche sono:
capacità di gestire grandi quantità di dati;
condivisione dei dati fra più utenti e applicazioni;
utilizzo di sistemi di protezione e autorizzazione per l’accesso ai dati stessi.
Si possono idetificare diversi tipi di database, in base alla loro struttura logica:
database gerarchici; database reticolari; database relazionali; database ad oggetti.
Il modello gerarchico, basato su strutture ad albero nelle quali ogni dato che non sia a livello radice ha uno e un
solo padre, è quello che ha conosciuto il maggior utilizzo fino agli anni ‘80.
Il modello reticolare deriva da quello gerarchico, rispetto al quale supera la rigidità della struttura ad albero
nell’interdipendenza dei dati, ma la cui complessità ne ha impedito una larga diffusione.
Il modello relazionale organizza i dati in tabelle, basandosi sulle relazioni fra essi.
Il modello ad oggetti infine, il più recente, estende i concetti del modello relazionale adattandoli alla program-
mazione ad oggetti.
Bibliografia di riferimento:
Pasqui Valdo, Portali: funzionalità e tecnologie nel contesto bibliotecario, unipr.cilea.it, 2006
https://dspace-unipr.cilea.it/bitstream/1889/509/1/Portali_appunti_dispensa_Valdo_Pasqui.pdf
Della Penna Giuseppe, XML e database, Universita degli Studi L’Aquila, 2008
http://www.di.univaq.it/gdellape/students.php?crs=mwtxml08
65. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ IL WEB HOSTING?
- Per essere visibile un sito internet necessita di uno spazio fisico dove essere pubblicato.
Il servizio di HOSTING consiste nella locazione di uno spazio sul disco di un computer “server “ di un provider
(fornitore di servizi internet) ad un cliente per permettergli memorizzare le pagine del proprio sito e permetterne
l’accesso ad altri utenti da Internet (server e client possono però essere anche sulla stessa macchina, come per gli
esempi di questo corso).
In altre parole il web hosting, è l’ affitto dello spazio e larghezza di banda attraverso una società in modo da poter
pubblicare il tuo sito web on-line.
web hosting significa ospitare siti web di aziende, persone o istituzioni o siti di informazione in un server web
(computer) connesso ad internet per permettere ad altre imprese o a consumatori di accedere a questi siti web
tramite internet.
Puoi scegliere un hosting gratuito, che di solito contiene banner pubblicitari e pop up di altre aziende anche con-
correnti e serie limitazioni nello spazio e banda, o puoi scegliere il web hosting a pagamento che dà il controllo
completo dei contenuti del sito e maggiori garanzie.
L’hosting o spazio web è necessario anche ad ospitare la posta elettronica che vuoi ricevere ad indirizzi eMail con
un tuo nome di dominio privato o aziendale come ad esempio : info@NomeTuaBiblioteca.it
66. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ MySQL?
- MySQL (si pronuncia My Ess Que Ell) è il più diffuso database Open Source basato sul linguaggio SQL. Questo
prodotto viene fornito dall’azienda MySQL AB che sviluppa il proprio business erogando servizi basati su MySQL
stesso.
MySQL è un RDBMS, ossia un sistema di gestione per database relazionali. Un database è un insieme strutturato
di dati, dalla lista della spesa, all’elenco dei titoli presenti in una grossa libreria. MySQL si occupa della struttura-
zione e della gestione a basso livello dei dati stessi, in modo da velocizzarne l’accesso, la modifica e l’inserimento
di nuovi elementi. L’acronimo RDBMS significa “Relational DataBase Management System” e sta ad indicare che
MySQL offre la possibilità di conservare i dati non in un enorme “storeroom” ma in diverse tabelle, in modo di
velocizzarne l’accesso.
L’acronimo SQL significa “Structured Query Language” ed indica il linguaggio standard di interrogazione dei
DataBase.
Perchè molti applicativi utilizzano MySQL:
è veloce: basta dare un’occhiata ai benchmarks ufficiali per rimanerne impressionati;
è affidabile: essendo stato progettato per manipolare molti dati;
è scalabile: può funzionare utilizzando da 2 MegaByte di RAM fino a 4GigaByte;
è versatile: la sua natura Open Source garantisce una versione per ogni piattaforma.
67. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ JAVA (JSP)?
- JSP (Java Servlet Pages) è la risposta basata sulla tecnologia Java alle Common Gateway Interface. Questa tecno-
logia produce dei processi di generazione automatica delle pagine web. Gli svariati vantaggi nell’utilizzo di JSP,
rendono questo linguaggio di programmazione molto efficente e robusto (anche se decisamente ‘pesante’ nell’oc-
cupare spazio dedicato).
E’ efficiente: la Java Virtual Machine, essendo sempre caricata in RAM rende i tempi di accesso alle risorse molto
più limitati rispetto alla tradizionale programmazione CGI. E’ portabile: Java è un linguaggio “universale”, gira su
tutte le piattaforme grazie alla JVM. E’ praticamente gratuito: essendo distribuite con il web server Apache, l’ap-
plication server Tomcat è utilizzabile sia dalle grandi aziende sia dalle piccole e medie imprese.
COSA E’ PERL?
- PERL è un linguaggio multi-purpose. Può essere utilizzato per programmare qualsiasi processo, sia remoto, che
locale. Tuttavia il campo dove ha ottenuto maggior popolarità è lo scripting Web per la scrittura di CGI.
Adatto, e quindi molto potente, alla manipolazione di stringhe e quindi, di informazioni presenti sul server o in-
viate tramite moduli FORM dagli utenti di Internet.
Bibliografia di riferimento:
Cromathic, A Beginner’s Introduction to Perl Web Programming, O’Reilly, 2008
http://broadcast.oreilly.com/2008/09/a-beginners-introduction-to-pe.html
Spieghiamo cos’è java, javaopenbusinness, 2008
http://www.javaopenbusiness.it/JobEditorial/newsCategoryViewProcess.jsp?editorialID=3088
68. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ PYTHON?
- Python è un linguaggio portabile, interpretato e molto potente. La sua struttura ed eleganza lo rende adatto a
scrivere e gestire funzioni di ogni tipo. Tuttavia come è elegante, è altrettanto difficile. Python è un linguaggio
orientato agli oggetti e ciò lo rende adatto in particolari frangenti, dove la OOP (Object Oriented Programming)
è necessaria. E’ alla base di Zope e quindi di Plone, il CMS che vedremo in seguito.
COSA E’ PHP?
- PHP: Hypertext Preprocessor è un linguaggio completo di scripting, sofisticato e flessibile, che può girare
praticamente su qualsiasi server Web, su qualsiasi sistema operativo (Windows o Unix/Linux, ma anche Mac,
AS/400, Novell, OS/2 e altri), e consente di interagire praticamente con qualsiasi tipo di database (SQLite, My-
SQL, PostgreSQL, SQL Server, Oracle, SyBase, Access e altri). Si può utilizzare per i più svariati tipi di progetti,
dalla semplice home page dinamica fino al grande portale o al sito di e-commerce.
PHP è un preprocessore di ipertesti. Si tratta quindi di un linguaggio che permette a chi costruisce un sito web di
eseguire qualsiasi operazione sul server. Il linguaggio si basa principalmente sulle sintassi dei suoi illustri predeces-
sori: Java, C, PERL. Da essi eredita molte delle funzionalità che lo hanno reso il più versatile veloce e completo
linguaggio di programmazione server-side attualmente disponibile.
E’ veloce: bisognerebbe dire velocissimo;
è affidabile: le sue radici affondano nella storia degli elaboratori;
è orientato ai database: possiede al suo interno tutte le funzionalità per gestire le informazioni estrapolate dai da-
tabase;
è una buona base per qualsiasi collezione digitale bibliotecaria on line.
Rende però il sito molto vulnerabile se non si conoscono i procedimenti base ‘di difesa’ contro accessi indeside-
rati.
69. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
XML COME STRUTTURA DATI?
I documenti XML sono per loro natura contenitori perfetti per strutture dati gerarchiche.
I dati che vengono scambiati sotto forma di documenti XML sono in continua crescita.
Molto spesso la vista XML sui dati è quella preferita dagli utenti delle applicazioni.
Sorge quindi la necessità di gestire questi dati all’interno dei database tenendo conto della loro struttura XML
di origine.
Bibliografia di riferimento:
XML database, Wikipedia, 2008
http://en.wikipedia.org/wiki/XML_database
70. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
XML COME STRUTTURA DATI?
DBMS (DataBase Management System) con supporto XML.
Un DBMS è un software che gestisce database
I documenti XML possono essere gestiti in maniera document-centric o data-centric. Nella modalità data-
centric gli elementi XML sono gestiti come oggetti.
DBMS XML nativi
I prodotti nativi per XML permettono di gestire documenti XML come collezioni di dati indicizzati, interrogan-
doli tramite XPath e XQuery.
In molti casi è disponibile una integrazione con database relazionali standard, tramite schemi che mappano la
struttura relazionale su documento XML.
Il leader tra i prodotti di questo tipo è Tamino di SoftwareAG.
Bibliografia di riferimento:
Della Penna Giuseppe, Documenti base dei corsi su XML, Università degli Studi L’Aquila, 2008
http://www.di.univaq.it/gdellape/xml/XMLDoc.php
71. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
XML COME STRUTTURA DATI?
Nel mondo del software free, i database XML a disposizione sono
XIndice: progetto del gruppo Apache
eXist: progetto indipendente disponibile su sourceforge.
Attualmente eXist è il progetto più sviluppato e stabile. Supporta interrogazioni tramite il linguaggio XUpdate e
accesso da codice tramite l’interfaccia standard XML:DB.
Bibliografia di riferimento:
Della Penna Giuseppe, Documenti base dei corsi su XML, Università degli Studi L’Aquila, 2008
http://www.di.univaq.it/gdellape/xml/XMLDoc.php
72. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
XML COME STRUTTURA DATI?
Categorie dei prodotti XML-DB
Esistono tre tipi fondamentali di software trattabili in questo contesto:
Middleware: strati software che permettono di scambiare dati XML tra database e applicazioni.
Database con supporto XML.
Database nativi per XML.
Inizialmente lo sviluppo di middleware ha permesso l’adattamento dei due mondi. In seguito sono stati sviluppati
DBMN (DataBase Network Management) nativi, ma attualmente si sta investendo molto nel supporto XML dei
più diffusi DBMS commerciali.
Bibliografia di riferimento:
Della Penna Giuseppe, Documenti base dei corsi su XML, Università degli Studi L’Aquila, 2008
http://www.di.univaq.it/gdellape/xml/XMLDoc.php
73. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
XML COME STRUTTURA DATI?
Struttura Data Centric
La struttura del documento XML è parte fondamentale dei dati da conservare.
In questo caso la struttura gerarchica dei documenti XML viene mappata su una serie di tabelle relazionali.
Le relazioni tra tabelle permettono di ricostruire la struttura originaria del documento XML.
Si possono applicare query molto raffinate su questa struttura, ma di solito il numero di join implicati è molto
alto.
La struttura del DB può venir creata in relazione allo schema dei documenti da immagazzinare.
Si può utilizzare una struttura DB generica adatta a tutti i tipi di documenti XML.
Struttura Document Centric
Il documento XML come tale è il dato da inserire nel DB.
In questo caso gli interi documenti XML sono inseriti in campi del database, o riferiti da essi.
Sui documenti possono essere eseguite rudimentali operazioni di ricerca tramite XPath o espressioni regolari.
Bibliografia di riferimento:
Della Penna Giuseppe, Documenti base dei corsi su XML, Università degli Studi L’Aquila, 2008
http://www.di.univaq.it/gdellape/xml/XMLDoc.php
74. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Prendere confidenza col server e i database
Archivists’ Toolkit
E’ un sistema Open Source multipiattaforma per dati archivistici orientato alla descrizione e
gestione delle risorse tramite record. Richiede sia un applicativo ‘client’ che un database re-
lazionale (un server MySQL). L’applicativo ‘client’ è munito di un’interfaccia per l’immissione,
l’edizione, la ricerca e la cancellazione dei dati stoccati nel database. Al momento non gestisce an-
cora risorse digitali ma è interessante ai fini del nostro corso perché ci aiuta a prendere confidenza
con alcuni standard di descrizione e migrazione nell’ambito dei metadati, ci fa vedere in pratica
che cos’è un repository, come compilare e gestire un repository record secondo gli schemi EAD
(Encoded Archive Description), MODS (Metadata Object Description Schema), METS (Meta-
data Encoding and Transmission Standard), DC (Dublin Core).
Bibliografia di riferimento:
Sito ufficiale per scaricare programma e tutorial:
http://www.archiviststoolkit.org/
75. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Prendere confidenza col server e i database
Archivists’ Toolkit
In base alla piattaforma (WIN, MAC, LINUX) esistono diversi pacchetti open source o free che
facilitano l’installazione del server MySQL (o PostgreQL o Tomcat secondo i casi richiesti).
Per WIN si consiglia WAMPSERVER, per MACOSX MAMP.
Bibliografia di riferimento:
Sito ufficiale per scaricare programmi e tutorial:
http://www.wampserver.com/en/
http://www.mamp.info/en/index.php
76. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
L’interfaccia base
La prima schermata che compare con AT è divisa in tre parti:
- In alto il menu dei comandi generali;
- a sinistra i comandi di navigazione,
- la parte centrale del video in cui appaiono le schermate dei menu.
77. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
L’interfaccia base
Archivists’ Toolkit possiede diversi tipo di record che supportano descrizione, gestione di risorse
archivistiche. La maggior parte di questi comandi è raggiungibile attraverso la zona di navigazione
di sinistra. Tuttavia il repository (luogo di stoccaggio) e gli utenti dei record sono accessibili dal
menu Setup.
78. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
In breve la descrizione dei tipi di record in AT:
- Repository record: custodisce le risorse descritte inclusi sub-records per le istruzioni dei dati
usati, così come le caratteristiche base sul repository (suo possessore, staff di lavoro).
- User record: per creare e gestire gli account degli utenti AT.
- Location record: indica la localizzazione sia presente che futura. Un location record va definito
per primo e linkato alla risorsa.
- Accession record: registra l’accesso e i dati base di gestione della collezione.
- Resource record: descrive un item o una collezione di items in modo multilivello standard.
- Name record: registra il nome (personale, ente pubblico, famiglia) associato all’acquisizione e/o
risorse come un creatore, fonte o soggetto. I name records servono nell’ heading (parte dell’inte-
stazione nel source del file) in esportazione negli standard EAD, MARCXML e MODS.
- Subject record: descrive termini topici associati a un’acquisizione o a una risorsa. I subjest re-
cords servono come heading del soggetto in esportazione quali EAD, MARCXML e MODS.
Bibliografia di riferimento:
Sito ufficiale per scaricare programma e tutorial:
http://www.archiviststoolkit.org/
79. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
componenti base di un record
Barra del
titolo
Inserimento
Lista
dati
dell’
elemento
Comandi
dell’ Comandi
Comandi
elemento di conferma
di navigazione
Bibliografia di riferimento:
Sito ufficiale per scaricare programma e tutorial:
http://www.archiviststoolkit.org/
80. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
componenti base di un record
- Barra del titolo: appare per ogni record in alto a sinistra del record con il titolo del tipo di record
(ad es. risorsa, acquisizione). Ogni tipo di record ha un suo colore specifico.
- Lista dell’elemento: lista di comandi che appare solo con risorsa, componente della risorsa e
record dell’oggetto digitale. Abilita il listato gerarchico dei componenti comresa una risorsa o un
oggetto digitale.
- Inserimento dati: la finestra dove si inseriscono i dati per creare un certo tipo di record.
- Accession record: registra l’accesso e i dati base di gestione della collezione.
- Comandi di navigazione: sevono per andare avanti e indietro in una lista di record.
- Comandi di conferma: per cancellare un record, salvarlo, salvarlo e aprire una nuova finestra
record.
- Subject record: descrive termini topici associati a un’acquisizione o a una risorsa. I subjest re-
cords servono come heading del soggetto in esportazione quali EAD, MARCXML e MODS.
81. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
L’interfaccia base
La schermata di migrazione metadati, che è quella che ci interessa per questo corso si presenta
così. Una volta riempiti i campi di descrizione della risorsa basta cliccare su un tasto di esportazio-
ne per avere il documento xml secondo lo schema EAD, MARC o DC.
82. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Archivists’ Toolkit
L’interfaccia base
Ed ecco l’esempio dei documenti generati in automatico.
83. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
REGOLE DI CATALOGAZIONE
PER IL CONTROLLO BIBLIOGRAFICO
I metadati servono nel recupero delle risorse elettroniche on line.
Anche lo schema di descrizione più semplice (Dublin Core) dovreb-
be rispettare le regole di catalogazione (evitare l’inserimento di testo
libero non qualificato e non controllato).
Protocolli e standard comuni nella catalogazione:
Z39.50 (protocollo di comunicazione informatica client-server per ricercare attraverso una rete
informatica informazioni in database).
SRU-SRW (Search/Retrieve via the Web or URL).
MARC (Machine Readable Catalogoing).
Bibliografia di riferimento:
Gorman Michael, Metadati o catalogazione? Una falsa alternativa, Biblioteche Oggi, giugno 2001.
http://www.bibliotecheoggi.it/2001/20010500801.pdf
Tajoli Zeno, Da UNIMARC a MARC21, Bollettino del Cilea (95), 2004.
http://eprints.rclis.org/archive/00002819/01/conversioneunimarc.pdf
84. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL WEB CON O SENZA METADATI
PAGINA SENZA METADATI
Punto d’accesso
singolo
CONTENT UTENTE
Sito web
PROVIDER FINALE
PAGINA CON METADATI
Punto d’accesso
singolo
CONTENT Sito web
PROVIDER
VALORE
AGGIUNTO
Contenuto PER
accessibile L’UTENTE
tramite FINALE
aggregatori,
portali,
METADATI motori di ricerca
Bibliografia di riferimento:
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org, 2008.
http://www.digital-scholarship.org/sepb/lbcat.htm
85. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA SONO I METADATI?
Nel mondo digitale, l’esistenza stessa della risorsa elettronica dipen-
de dai metadati. I metadati consentono una conoscenza strutturata
delle risorse tramite schemi e formati standardizzati.
Alcuni schemi di descrizione standard:
ISBD(ER) - International Standard Bibliographic Description for Electronic Resources,
ISAD(G) - General International Standard Archival Description,
METS - Metadata Encoding and Transmission Standard,
MPEG21 - Moving Picture Experts Group ISO21000,
AUDIO MD
Alcuni formati standard:
MARC - Machine Readable Cataloging,
UNIMARC,
MPEG7.
Bibliografia di riferimento:
Lunati G. - Bergamin G., Manuale virtuale per la gestione digitale, Regione Toscana, 2004.
http://www.ifnet.it/lunati/toscana/manuale/5-01-metadati.html
AA.VV., Digital Moving Images and sound archiving study, AHDS, 2006.
http://ahds.ac.uk/about/projects/archiving-studies/moving-images-sound-archiving-final.pdf
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org,
2008. http://www.digital-scholarship.org/sepb/lbcat.htm
86. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
TIPOLOGIE DI METADATI
- descrittivi
- amministrativi
- strutturali
Alcuni schemi di metadati descrittivi: DC (Dublin Core)
MPEG21 (Moving Picture Experts Group
ISO21000)
XMP (eXtensible Metadata Platform)
Alcuni schemi di metadati amministrativi: MAG (Metadati Amministrativi e Gestionali)
Alcuni schemi di metadati strutturali: METS (Metadata Encoding and Transmission
Standard)
PREMIS (PREservation Metadata: Implementa
tion Strategies)
Gli schemi non sono chiusi negli ambiti di applicazione. Si guardi la bibliografia in cal-
ce per comprendere come uno schema possa interagire in ambiti diversi.
Bibliografia di riferimento:
AA.VV. ,Tutorial METS. Quadro generale, THE LIBRARY OF CONGRESS, 2006.
http://www.loc.gov/standards/mets/METSita.html
AA.VV., Digital Moving Images and sound archiving study, AHDS, 2006.
http://ahds.ac.uk/about/projects/archiving-studies/moving-images-sound-archiving-final.pdf
87. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI visibili e invisibili...
Bibliografia di riferimento:
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org, 2008.
http://www.digital-scholarship.org/sepb/lbcat.htm
88. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI visibili e invisibili...
Bibliografia di riferimento:
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org, 2008.
http://www.digital-scholarship.org/sepb/lbcat.htm
89. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI visibili e invisibili...
Bibliografia di riferimento:
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org, 2008.
http://www.digital-scholarship.org/sepb/lbcat.htm
90. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI e SCHEMI PROPRIETARI
Lo schema per la creazione di metadati più in uso tra quelli proprietari è XMP di Adobe (vedia-
mo qualche esempio nelle pagine seguenti. Per le specifiche si veda il pdf del corso di Varese sul
sito novantiqua). Adobe ha concluso da poco un importante accordo con altre multinazionali
dell’informazione per lo sviluppo di XMP. Il gruppo di lavoro (Metadata Working Group) è for-
mato da Adobe, Canon, Microsoft, Nokia, Sony con la supervisione del W3C.
Bibliografia di riferimento:
Metadata Working Group http://www.metadataworkinggroup.org/
91. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI visibili e invisibili...
Bibliografia di riferimento:
Bailey CW., Library Issues: Cataloging, Identifiers, Linking, and Metadata, Digital Scholarschip.org, 2008.
http://www.digital-scholarship.org/sepb/lbcat.htm
92. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Un buon esempio di gestione di file digitali on line.
Possiede una biblioteca digitale in Greenstone, ben gestita e ricca di titoli. I protocolli e gli stan-
dard sono quelli tipici della biblioteca digitale.
93. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Possiede anche una collezione digitale di foto antiche su Flickr. Una scheda bibliografica accom-
pagna ogni foto. Le foto sono di pubbico dominio anche nell’accezione del Copyright.
94. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Se le foto vengono scaricate da internet, ad un controllo non hanno inseriti nel file metadati di
alcun tipo. E’ questo un caso molto comune. Anche nelle biblioteche digitali spesso i metadati
sono staccati dal file e non accompagnano lo stesso nelle migrazioni fuori dalla biblioteca. Seb-
bene le foto siano prive di restrizioni precise sul diritto è un peccato non poter risalire alla bi-
blioteca che possiede l’originale (e che ha fatto molto lavoro per la diffusione delle sue risorse).
95. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Impariamo tecnicamente come inserire i dati della scheda bibliografica nel file tramite la piatta-
forma XMP di Adobe che genera metadati.
96. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Ad un controllo ora i metadati sono inglobati nel file.
97. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
La Bibliothèque de Toulouse
Il modello di metadati creato può essere inserito in batch e in pochissimo tempo anche in un
numero altissimo di file.
98. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI e WEB ONTOLOGICO
Cos’è un’ontologia?
Un’ontologia è una descrizione formale di concetti in un dominio (classi), delle proprietà di
ciascun concetto (slot), comprese le restrizioni sugli slot (facets).
A cosa serve un’ontologia?
Un’ontologia consente di definire: un vocabolario, i concetti di base interpretabili da una macchi-
na, le relazioni fra i concetti.
Questo consente:
esportabilità. Il sistema è reso indipendente dall’applicazione e quindi diventa esportabile in
altri domini;
interoperabilità. Due sistemi possono fare riferimento ad una stessa ontologia anche se utiliz-
zano formati diversi di rappresentazione della conoscenza.
Le ontologie sono XML-based, quindi consentono la descrizione dei contenuti in ma-
niera strutturata.
Uno schema ontologico descrive un sistema a cui diversi utenti accedono per poter fruire di
servizi o reperire informazioni. Nel contesto del “Semantic Web” il termine semantico assume
sostanzialmente la valenza di “elaborabile dalla macchina”.
Bibliografia di riferimento:
Signore Oreste, Semantic web: il futuro è già qui?, JEKPOT srl, 2005.
www.weblab.isti.cnr.it/publications/publications.pdf
Chesani Federico, Semantic Web,
lia.deis.unibo.it/Courses/ModApplRetiCalc0708/materiale/15.semanticWeb. pdf
99. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI e WEB ONTOLOGICO
L’uso efficace dei metadati richiede che vengano stabilite delle convenzioni per la semantica,
la sintassi e la struttura. Lo strumento base per la codifica, lo scambio e il riutilizzo di metadati
strutturati è ancora RDF (Resource Description Framework). RDF permette di definire la se-
mantica dei tag XML e fornisce un modello per descrivere le risorse.
MODELLO DEI DATI DI RDF
si basa su tre tipi di oggetti
1 - RESOURCES (sempre identificate da un URI)
2 - PROPERTIES (identificate da un nome che assume un valore)
3 - STATEMENTS (composti da una risorsa, una proprietà e un valore sempre definite).
RDF e RDF schema hanno però dei limiti soprattutto in riferimento alla cardinalità delle asso-
ciazioni in ambito conoscitivo. E’ a questo livello che si inserisce il web semantico, nel creare un
linguaggio che consenta di definire la terminologia usata, le caratteristiche logiche e i vincoli di
proprietà.
Bibliografia di riferimento:
Signore Oreste, Semantic web: il futuro è già qui?, JEKPOT srl, 2005.
www.weblab.isti.cnr.it/publications/publications.pdf
Nadia De Carolis, Ontologie e rappresentazione dela conoscenza, UniBari, 2008.
http://www.di.uniba.it/~nadja/sysag/ontologie.pdf
100. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
METADATI e WEB ONTOLOGICO
Il W3C ha definito un linguaggio che permette di esportare le ontologie in modo interoperabile.
Il suo nome è OWL (Ontology Web Language) e serve appunto a rendere operativi i concet-
ti base delle ontologie: vocabolari, concetti base interpretabili da una macchina e relazione fra i
concetti.
Un editor per la creazione di ontologie è Protégé.
Caratteristiche:
- Open Source - Esporta ontologie - Si basa su Java - E’ estensibile (tramite plug-in).
Il web semantico permetterà: ricerche efficaci. Interrogazioni per concetto non più per
termine; correlazione di documenti tramite condivisione di dati aggregati.
Bibliografia di riferimento:
Giorgio Poletti, Verso la biblioteca digitale, CARID, Università degli studi di Ferrara, 2004.
http://www.provincia.campobasso.it/biblioteca/eventi/interventi/poletti.pdf
Una ricca bibliografia sull’argomento METADATI E WEB all’indirizzo
http://eprints.rclis.org/view/subjects/IE.html
101. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
Glossari e thesauri per le specifiche
Bibliografia di riferimento:
Shirley Keane, CLD Online tutorial, UKoln, 2003.
http://www.ukoln.ac.uk/cd-focus/cdfocus-tutorial/glossary.html
102. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
BASE DATI E GESTIONE
SBN SEBINA
SBN: il Servizio Bibliotecario Nazionale (SBN) è la rete delle biblioteche italiane promossa dal MiBAC, dalle
Regioni e dalle Università, e coordinata dall’ICCU, finalizzata all’erogazione di servizi agli utenti; vi aderiscono
attualmente oltre 3200 biblioteche, statali, di enti locali, universitarie, di istituzioni pubbliche e private, operanti
in diversi settori disciplinari. L’OPAC SBN (dove OPAC sta per “On line Public Access Catalogue”) consente
all’utenza di accedere con modalità di ricerca amichevoli al catalogo collettivo delle biblioteche che partecipano
al Servizio Bibliotecario Nazionale.
SEBINA: applicativo progettato e realizzato dall’Istituto per i Beni artistici culturali e naturali (IBC) della regio-
ne Emilia - Romagna e da AKROS Informatica di Ravenna.
SEBINA, che ha un’ampia diffusione sul territorio nazionale – oltre 1300 installazioni di cui una cinquantina tra
sistemi bibliotecari di intere provincie, comuni e università.
Sia SBN che SEBINA stanno sviluppando “in progress” moduli di gestione delle risorse digitali on line. Ad es.
SEBINA ha aggiunto “link multimediali” per la correlazione tra schede e files.
Bibliografia di riferimento:
OPAC SBN http://www.sbn.it/opacsbn/opac/iccu/informazioni.jsp
SEBINA http://www.iccu.sbn.it/genera.jsp?id=219 http://www.sebina.it/index.html
103. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
SEBINA OPEN LIBRARY
L’architettura di Sebina OpenLibrary è caratterizzata da componenti in grado di interagire fra loro e con altri si-
stemi informativi locali o in rete, così da consentire all’istituzione di creare il proprio sistema informativo ideale.
Sebina OpenLibrary è un software: interamente web based, scritto in Java (J2ee compliant) che si usa con un
internet browser aperto al colloquio con qualsiasi sistema operante sulla rete, grazie alla completa aderenza agli
standard della web services architecture (XML, UDDI, SOAP, WSDL) e allo standard OpenURL;
adotta: le raccomandazioni del W3C per l’accessibilità così da consentire l’accessibilità e la fruizione dei beni,
senza barriere, attraverso la rete.
I principali standard : UNIMARC e MARC21; Z39.50; SICI; EAD; Dublin Core; GEDI ed EDIFACT;
ISO-ILL; UNICODE
SIP2; RFID
SBN-MARC per la cooperazione con l’Indice2 in tutte le sue modalità.
Indipendente da: RDBMS, sistemi operativi, web e application server, lascia libera scelta fra ambienti open
source o proprietari;
internazionale: multilingua e con utilizzo del set di caratteri UNICODE (UTF-8);
implementa un’architettura multi-server (multi-tiered) in grado di rendere estremamente flessibile la configura-
zione dell’hardware e software di supporto e l’integrazione con i sistemi informativi esistenti presso l’istituzione;
scalabile, dalla piccola istituzione al grande sistema
Bibliografia di riferimento:
OPAC SBN http://www.sbn.it/opacsbn/opac/iccu/informazioni.jsp
SEBINA http://www.iccu.sbn.it/genera.jsp?id=219 http://www.sebina.it/index.html
104. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
SOFTWARE OPEN SOURCE
Negli ultimi anni è cresciuta molto la cultura informatica come condivisione di risorse. Esempi comuni di condi-
visione file sono Wikipedia, Eprints, You Tube. Anche nel campo delle biblioteche digitali istituzioni pubbliche e
private hanno confezionato pacchetti software potenti, normati e gratuiti per la comunità scientifica.
Di seguito alcune biblioteche digitali scaricabili e testabili per piattaforme WIN, LINUX e MAC OS X:
- GREENSTONE DIGITAL LIBRARY (della New Zealand Digital Library Project)
http://www.greenstone.org/
Un buon tutorial per Greenstone a cura del prof. Savino dell’UNIPISA a http://www.nmis.isti.cnr.it/savino/
- DSPACE (della DSpace Foundation) http://www.dspace.org/
Usa repositories istituzionali per la pubblicazione delle risorse.
Per approfondimenti: De Robbio Antonella, Relazione tecnica su DSpace, eprint, 2002
http://eprints.rclis.org/archive/00000032/01/DSpace.pdf
Bibliografia di riferimento:
Sanio Jose, Adoption of Open Source Digital Library Software Packages. A Survey, eprint, 2007
http://eprints.rclis.org/archive/00008750/01/Sanjojose.pdf
Cassella Maria, Digital libraries à la carte 2007, eprint, 2007
http://eprints.rclis.org/archive/00012488/01/aibnotizietilburg.pdf
105. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ UN CMS?
Un Content Management System (CMS) è un sistema per la gestione di contenuti informativi (articoli, rubri-
che, notizie, faq, etc) per la gestione di siti o portali e rappresenta uno strumento di pubblicazione flessibile e
multiutente.
Tecnicamente il CMS è un’applicazione lato server, divisa in due parti: il back end, ovvero la sezione di ammini-
strazione, che si occupa di organizzare e supervisionare la produzione del contenuto, e il front end, cioè la sezio-
ne dell’applicazione con cui l’utente è a contatto e che usa per realizzare fisicamente modifiche, aggiornamenti
ed inserimenti.
Un CMS mantiene rigorosamente separati: il codice software; la descrizione del layout (con fogli di stile CSS);
i contenuti.
Un CMS può essere costruito partendo da un FRAMEWORK (set di strumenti e servizi);
o da un APPLICATION SERVER (Rifacendosi alla definizione di Wi-
kipedia: un application server è un software che fornisce l’infrastruttura e le funzionalità di supporto, sviluppo
ed esecuzione di applicazioni e componenti server in un contesto distribuito. Si tratta di un complesso di servizi
orientati alla realizzazione di applicazioni per il web, multilivello ed enterprise, con alto grado di complessità).
Bibliografia di riferimento:
Fabio Bottega, CMS Open Source: il caso Plone-Zope, Tecnoteca, 2007
http://www.tecnoteca.com/profilo/fatto/Slide_Alsi_2007_R04.pdf
106. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
COSA E’ UN CMS?
Un Content Management System (CMS) è un sistema per la gestione di contenuti informativi (articoli, rubri-
che, notizie, faq, etc) per la gestione di siti o portali e rappresenta uno strumento di pubblicazione flessibile e
multiutente.
Tecnicamente il CMS è un’applicazione lato server, divisa in due parti: il back end, ovvero la sezione di ammini-
strazione, che si occupa di organizzare e supervisionare la produzione del contenuto, e il front end, cioè la sezio-
ne dell’applicazione con cui l’utente è a contatto e che usa per realizzare fisicamente modifiche, aggiornamenti
ed inserimenti.
SOFTWARE OPEN SOURCE
- PLONE E’ un CMS (Content Management System) modulabile per le esigenze di una BD (ad es. col pacchet-
to SILVA o tecnologie AJAX). E’ il software testato attualmente dall’ABEI per le proprie BD.
Per approfondimenti: materiale cartaceo consegnato durante il corso con una proposta tecnica per costruzione
della BD MOdiSCA.
Tentori Paolo, PLONE: un’ipotesi di portale per biblioteche digitali on line, antiquonline, (2) 2007
http://www.antiquonline.com/magazine/2_2007/index.html
Bibliografia di riferimento:
McKay Andy, The Definitive Guide to Plone, Apress 2004 (tr. italiana)
http://www.artiemestieri.tn.it/info/lp/cap02.rst
Pasqui Valdo, L’officina della biblioteca digitale, Rinascimento Digitale, 2006
http://www.rinascimento-digitale.it/index.php?ID=74&CERCA=pasqui#74
107. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL PROTOCOLLO OAI-PMH
- L’OAI-PMH introduce gli elementi portanti che servono a strutturare gli Open Archives:
- Repository:
un repository (Data Provider) è un server di rete normalmente interfacciato ad un database contenente i record
dei metadati.
- Harvester:
un harvester (Service Provider) è un’applicazione client tramite la quale il Service Provider può inviare delle
richieste OAI-PMH al repository del Data Provider per effettuare l’harvesting (raccolta) dei metadati.
- Record:
L’ultima versione del protocollo OAI-PMH riferisce lo scambio di metadati tra open archive come mezzo di
accesso a un resource (documento, immagine, servizio, collezione di altri resource) ossia risorse in generale e
non solo documenti di eprint.
Un resource all’interno di un repository viene riferito attraverso l’item ad esso relativo il quale a sua volta è
univocamente individuato attraverso un identificatore unico.
L’item ha infatti la funzione di “contenitore di metadati”, in quanto può contenere uno o più record ognuno
dei quali riferito ad un metadato in uno specifico formato.
- Identificatore unico:
L’identificatore unico permette di referenziare in maniera univoca un item dentro un repository ed è usato nelle
richieste OAI-PMH per estrarre i relativi metadati. Con l’attuale versione 2.0, le organizzazioni che aderiscono
all’iniziativa dell’OAI devono scegliere un nome di dominio “registrato” come namespace-identifier,
mantenendo, anche in questo caso, il rispetto delle maiuscole e delle minuscole in maniera permanente.
Questo nuovo approccio permette di evitare la necessità di un servizio di registrazione per gli oai-identifier in
quanto un identificatore a cui è associato un domain name registrato “univoco”, diventa esso stesso univoco.
- Set: un set è quindi un costrutto utilizzato dal Data Provider per raggruppare item.
Bibliografia di riferimento:
Amelotti Ercole, Protocollo OAI-PMH negli Open Archive e applicazione CDSware per la rappresentazio-
ne dei relativi dati bibliografici, Università Di Messina, Tesi di Laurea 2004.
http://eprints.rclis.org/archive/00002343/03/cap_2.PDF
108. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
IL PROTOCOLLO OAI-PMH
Per il livello transport: HTTP
Per il formato minimo dei metadati DC
Per la validazione delle risposte ricevute dal Service Provider: XML
Bibliografia di riferimento:
Hunter Philip, OAI and OAI-PMH for absolute beginners: a non-technical introduction [Introduction to
OAI and Harvesting], CERN, 2005.
109. Bologna dicembre 2008 Progetti digitali: standard, problematiche, soluzioni. L’esperienza dell’ABEI
GREESTONE
Greenstone è una suite di software adatti a gestire collezioni di biblioteche digitali ed a creare nuo-
ve collezioni. Fornisce un nuovo modo di organizzare informazioni e di pubblicarle su internet o
su cd-rom. Greenstone è prodotto dal New Zealand Digital Library Project presso l’Università di
Waikato, ed è distribuito in cooperazione con l’UNESCO e lo Human Info NGO. E’ un softwa-
re open-source, disponibile da http://greenstone.org sotto i termini della GNU General Public
License.
Esiste una versione 2.xx (collaudata) e una versione 3 (ancora beta e non collaudata in alcune par-
ti). La differenza principale è che la versione 3 è scritta in java ed è concepita a moduli XML. Al
momento (novembre 2008) viene consigliato dal sito stesso della Greenstone di usare la versione
2.xx per la costruzione di biblioteche digitali.
Bibliografia:
Un buon tutorial on line su Greenstone:
Savino Pasquale, Informatica umanistica - Biblioteche digitali, Università di Pisa, 2008
AA.VV., The design of Greenstone 3: An agent based dynamic digital library, University of Waitako, 2007
http://www.greenstone.org/manuals/gs3design.pdf