Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Metadati2008
1. Metadati
Antonella De Robbio
Firenze,
Firenze gennaio 2008
ICCU- Progetto Centri E-Learning2
Corso di Specializzazione in Esperti
p p
per la Documentazione Avanzata e la
Promozione del Patrimonio Culturale
2. Cosa sono i metadati
A cosa servono i metadati
Strutturare metadati
Schemi di metadati ed insiemi di
S h i t d ti d i i i
elementi
Dublin Core, TEI, METS, MODS, EAD, LOM.
Core TEI METS MODS EAD LOM
‹indecs›, ONIX, CDWA, VRAMPEG, FGDC, DDI
Creare metadati
Interoperabilità e scambio di metadati
Antonella De Robbio – Corso Metadati 2
3. Dati i f
D ti o informazioni?
i i?
derobbio
I metadati contestualizzano
aHUn1l5
HU 1l5 i dati trasformandoli in informazioni
120657
Una sintassi li rende comprensibili
Username Etichette per condividere le informazioni
Passwd
Data di nascita
Antonella De Robbio – Corso Metadati 3
4. M t d ti e metatag
Metadati t t
Metadato (dal greco meta- quot;oltre, dopoquot;
e dal latino datum quot;informazionequot; -
informazione
plurale: data), letteralmente quot;dato su un
(altro) dato , è l'informazione che descrive
datoquot; l informazione
un insieme di dati.
I meta tag sono metadati presenti nel
d i i l
linguaggio HTML utilizzati per fornire
informazioni sulle pagine agli utenti o ai
motori di ricerca.
Antonella De Robbio – Corso Metadati 4
5. Che cosa significa metadato?
Definizione di metadato
letteralmente definito come quot;dato sul dato”
inteso nel significato di quot;dato strutturato
g
sulle risorse
Tim Berners-Lee lo definisce quot;informazione
Berners Lee informazione
comprensibile alla macchina su risorse Web
o altri oggetti .
oggettiquot;
l'assioma è questo: il metadato è un dato
un metadato può descrivere un metadato
Antonella De Robbio – Corso Metadati 5
6. I metadati possono descrivere risorse
a qualsiasi livello di aggregazione
Possono descrivere una collezione una singola risorsa o
collezione,
un componente di una risorsa più grande (per esempio,
una fotografia all’interno di un articolo).
g )
Nello stesso modo in cui i catalogatori prendono decisioni
sul fatto di creare un record di catalogo per l’intero
insieme di volumi o per ogni singolo volume dell’insieme, i
dell’insieme
creatori di metadati prendono le stesse decisioni.
I metadati possono anche essere utilizzati per la
descrizione di risorse a tutti i livelli del modello
d’informazione Functional Requirements for Bibliographic
Records: opera, espressione manifestazione o articolo
opera espressione, articolo.
Per esempio, un metadato può descrivere un relazione,
una particolare edizione di quella relazione o una copia
specifica di quella edizione della
Antonella De Robbio – Corso Metadati 6
7. I metadati sono la chiave per assicurare la sopravvivenza
delle risorsee la loro accessibilità in futuro
I metadati possono essere inseriti in un oggetto digitale
o possono essere depositati separatamente.
Spesso i metadati sono inseriti in documenti HTML e
nelle testate dei files di immagini.
Depositare i metadati con l’oggetto che descrivono
l oggetto
assicura che i metadati non vengano persi, elimina i
problemi di collegamento tra dati e metadati a assicura
che i metadati e l’oggetto siano aggiornati insieme.
l oggetto insieme
Altre volte, il deposito separato dei metadati può
semplificare la gestione stessa dei metadati a facilitare
al ricerca e il recupero dei metadati
metadati.
In sintesi: i metadati sono di soliti immagazzinati in un
sistema di database e collegati agli oggetti che
g g gg
descrivono.
Antonella De Robbio – Corso Metadati 7
8. D fi i i
Definizione di risorsa
i
Dalla RFC 2396:
“A resource can be anything that has identity. Familiar examples
include an electronic document, an image, a service (e.g.,
quot;today's weather report for Los Angelesquot;), and a collection of
other resources. Not all resources are network quot;retrievablequot;;
e.g., human beings, corporations, and bound books in a
g, g , p ,
library can also be considered resources. The resource is the
conceptual mapping to an entity or set of entities, not
necessarily the entity which corresponds to that mapping at
any particular instance in time. Thus, a resource can remain
constant even when its content---the entities to which it
currently corresponds---changes over time, provided that the
conceptual mappin is not changed in the process”.
Antonella De Robbio – Corso Metadati 8
9. Metadati: una visione ingenua
Metadati = dati che descrivono altri
dati
i record del catalogo di una biblioteca
i record di un database
Spesso piu’ facili da trattare dei dati
che rappresentano
h
Il formato dei metadati dipende dal
catalogo
il formato dei dati dipende da molti
p
fattori
Antonella De Robbio – Corso Metadati 9
10. Con i metadati si descrivono e si
etichettano gli oggetti
Noi usiamo già i metadati nella vita reale
p
per trovare informazioni o cose
per organizzare informazioni o cose
Sono le o e 10 00 del mattino
ore 10.00
A Firenze ci sono 13 gradi (Celsius)
Oggi è il giorno 16 (del mese di ?)
gg g ( )
Condivisione di un linguaggio/schema per condividere i
significati (vocabolari controllati per differenti comunità =
g )
ontologie)
dal libro Cent’anni di solutidine ...
Antonella De Robbio – Corso Metadati 10
11. accanto ad una visione ingenua...
… vi sono percezioni più scientifiche
… visioni del metadato correlate alle
tecniche dell’Information Retrieval
… interpretazioni meramente tecniche …
… nel nostro settore bibliotecomico ...
Antonella De Robbio – Corso Metadati 11
12. Metadati
M t d ti come etichette descrittive
ti h tt d itti
Registrano le informazioni sull’oggetto
(catalografiche o altro)
Autore
Titolo
Co
Copyright
i ht
Informazioni di autenticazione
Protezioni e permessi d accesso
d’accesso
Prezzo
esprimono:
Struttura e semantica dei dati
Antonella De Robbio – Corso Metadati 12
13. Quando sono nati i metadati?
Origini e nascita dei metadati
origine e primi usi del termine trovano
radici nell'ambiente basi di dati.
Metadata Workshop 1995 Stu Weibel
OCLC: nascita del Dublin Core nella
comunità dei bibliotecari
mancanza del termine nei testi sulle
biblioteche digitali fino a dopo il 1997
il termine quot;metadataquot; è un marchio
registrato dal 1986 di proprietà di The
Metadata Company
Antonella De Robbio – Corso Metadati 13
14. A cosa servono i metadati
t d ti
Utilizzo di metadati per le seguenti attività
Catalogazione dei dati
Elaborazione automatica dei dati da
parte di agenti software
p g
Controllo degli accessi
Filtraggio dei flussi informativi
Antonella De Robbio – Corso Metadati 14
15. Tipico metadato tradizionale
Il MARC
Machine eadable
Ma hi
M chine Readabl Cataloguing
d l i
da un formato di scambio ad un formato
di lavoro cooperativo
metadato entro gli OPAC
t d t t li
USMARC, MARC21, DEMARC, ANNAMARC,
, , , ,
UNIMARC, …
Esperienza CORC (MARC21/DublinCore)
Antonella De Robbio – Corso Metadati 15
16. Accesso alle risorse elettroniche: il campo 856
p
856 Localizzazione elettronica ed
accesso 856$k Password
Indicatore 1: Metodo di 8 6$l Login/login
856$l L i /l i
accesso 856$m Contact for access assistence
# = Non sono fornite 856$n Nome of location of host in
informazioni subfield $a
0 = Email 856$o Operating system
1 = FTP 856$p Port
2 = Remote login (Telnet) 856$q Electronic format type
3 = Dial-up 856$ S tt
856$r Settngs
4 = HTTP 856$s File size
7 = Metodo specificato in $y 856$t Terminal emulation
856$a Host name 856$u Uniform resource locator
856$b Access number 856$v Hours access method available
856$c Compression information 856$w Record control number
856$d Path 856$x Nonpublic note
8 6$f Electronic name
856$f El i 856$y Access method
856$ A th d
856$g Uniform resource name 856$z Public note
856$h Processor of request
856$i Instruction
856$j Bits per second
Antonella De Robbio – Corso Metadati 16
17. MARC e Ruolo dell’autore
Acquafortista Designer della legatura • Libraio
Annotatore Designer della • Librettista
Antecedente bibliografico sovraccoperta • Litografo
Arrangiatore Destinatario • Miniatore
Artista Detentore del privilegio • Narratore
Autore di sceneggiatura, etc. Direttore • Paroliere
Autore incerto Direttore d’orchestra, di • Precedente proprietario
Calcografo coro, di gruppo musicale, • Produttore
ecc.
Calligrafo • Recensore
Disegnatore dei caratteri
Cartografo • Responsabile del
Donatore montaggio
Censore
Editore • Rubricatore
Commentatore
Fabbricante della carta • Sceneggiatore
Compositore
C it
Falsario • Scrittore del materiale
Compositore di musica
Finanziatore / sponsor allegato
Copista
Firmatario • Segretario
Coreografo
Fotografo
g • Sottoscrittore
C
Correttore
tt
Grafico • Stampatore
Correttore di opera
manoscritta Illustratore • Stampatore di tavole
Datore del privilegio Incisore • Tecnico della registrazione
Dedicante
D di t Interprete • Titolare del copyright
Dedicatario Intervistato • Traduttore
Designer del libro Intervistatore • Xilografo
Designer dell’ex-libris Legatore
Antonella De Robbio – Corso Metadati 17
18. Come si esprimono i metadati?
La biblioteca ibrida presenta le sue risorse
Documenti e collezioni di documenti, nella
biblioteca tradizionale e in quella digitale,
hanno in associazione ai loro contenuti
qualcosa che è noto come metadato
La rappresentazione di forme e contenuti
avviene attraverso i metadati
Un'efficace gestione dell'informazione
digitale deve necessariamente includere la
presentazione delle risorse
Antonella De Robbio – Corso Metadati 18
19. Biblioteca digitale e metadati
Fornisce i propri documenti di metadati
appropriati
Creare collezioni di metadati a fianco delle
collezioni di documenti
ll i i d ti
Espone le proprie collezioni di metadati
p p p
Congloba le tecniche documentarie e
biblioteconomiche tradizionali con le nuove
applicazioni per il trattamento delle risorse
elettroniche
Antonella De Robbio – Corso Metadati 19
20. Elaborazione automatica
Grazie ai metadati un programma può
elaborare un documento come se ne
conoscesse il significato
Tre
T scenari diversi (in ordine di difficoltà)
i di i (i di diffi ltà)
- applicazione che gestisce metadati che conosce
- applicazioni che si scambiano metadati
concordati
- applicazioni che si scambiano metadati senza
accordo preventivo (tipico di Internet)
Antonella De Robbio – Corso Metadati 20
21. A bi t Internet ...
Ambiente I t t
Per internet occorre quindi sviluppare dei
modelli che permettano alle applicazioni di
interagire anche in assenza di un accordo
p
preventivo
Per questo servono degli standard per:
rappresentare i metadati
scambiare i metadati
estrarre
est a e significati dai metadati t amite
tramite
motori inferenziali
Antonella De Robbio – Corso Metadati 21
22. Ri
Risorse e URI
URI= Uniform Resource Identifier
Le risorse sono identificate da URI
La risorsa identificata da una URI
puo’ essere astratta = non
’
recuperabile in Rete
p
Antonella De Robbio – Corso Metadati 22
23. Id tifi t i
Identificatori
La maggior parte degli schemi di metadati prevedono
degli elementi, come i numeri standard, che servono ad
g , ,
identificare in maniera univoca il lavoro o l’oggetto al
quale il metadato si riferisce. La localizzazione di un
oggetto digitale può essere indicata anche usando il
nome di un file, URL (Uniform Resource Locator), o
qualche identificatore più permanente come il PURL
(P i
Persistent URL) o il DOI (Di i l Object Identifier)
Digital Obj Id ifi ).
Si preferiscono gli identificatori permanenti perché
spesso le localizzazioni degli oggetti vengono cambiate e
il tradizionale URL –con il record di metadati- non risulta
più valido.
Antonella De Robbio – Corso Metadati 23
24. identificatori
Tradizionali: ISBN; ISSN, SICI, BICI
; , ,
ampliamento e revisione delle strutture per
ospitare le RER
Emergenti: International Standard Work Codes ISWC
si International alle quot;operequot; intese come (ISTC)
1. riferiscono Standard Textual Work Code FRBR
riuniscono, sottoStandard Audiovisual Number (ISAN)
2. International un unico identificatore, le differenti
manifestazioni inStandard Musical Work Code (ISWC)
3. International cui un'opera può manifestarsi.
La gestione di questi identificatori è demandata
ai quot;resolversquot; o quot;risolutoriquot;
Antonella De Robbio – Corso Metadati 24
25. I metadati possono essere
t d ti
Interni alla risorsa
utili ai motori di ricerca
Esterni alla risorsa
entro collezioni di metadati
esposizione di metadati
p
metadati in banche dati integrate con
altri contenitori
collezioni a modello distribuito (DoIS)
servizi di accesso ai contenuti
i i i t ti
Antonella De Robbio – Corso Metadati 25
26. Dove sono collocati i metadati?
Dove sono collocati i metadati?
Dentro alladocumento
Interni
al risorsa: Fuori dal documento
utili ai motori di ricerca
Esterni alla risorsa:
metadato •entro collezioni di
metadati
t d ti
metadato
•esposizione di metadati
risorsa
•in basidati integrate con
in
risorsa
altri contenitori
•collezioni a modello
distribuito (OA)
•servizi di accesso ai
Non tutti gli oggetti possono
includeretmetadati: opere d’arte,
contenuti ti
sculture …
Antonella De Robbio – Corso Metadati 26
27. <!DOCTYPE HTML PUBLIC quot;-//W3C//DTD HTML 3.2//ENquot;>
<HTML>
<head>
<title>Intervento di Maurizio Messina al 9. Seminario Vinay</title>
<META NAME= DC.Title Intervento di Maurizio Messina al 9. Seminario Vinay quot;>
NAME=quot;DC Titlequot;Intervento 9 >
<META NAME=quot;DC.Creatorquot; CONTENT=quot;Messina, Maurizioquot;>
<META NAME=quot;DC.Creator.Addressquot; CONTENT=quot;quot;>
<META NAME DC.Subject CONTENT=quot;Libraries, Multimedia, Biblioteche,
META NAME=quot;DC.Subjectquot; CONTENT Libraries,
Multimedialit`quot;>
<META NAME=quot;DC.Descriptionquot; CONTENT=quot;Relazione 9. Seminario Vinayquot;>
<META NAME=quot;DC.Publisherquot; CONTENT=quot;AIB- Associazione Italiana Biblioteche
- Sezione Venetoquot;>
<META NAME=quot;DC.Datequot; CONTENT=quot;1998-06-24quot;>
<META NAME=quot;DC.Typequot; CONTENT=quot;Textquot;>
yp Metadato embedded
<META NAME=quot;DC.Formatquot; CONTENT=quot;text/htmlquot;>
<META NAME=quot;DC.Identifierquot;
CONTENT=quot;http://www.aib.it/aib/sezioni/veneto/messina.htmquot;>
<META NAME=quot;DC.Sourcequot; CONTENT=quot;http://www.aib.itquot;>
<META NAME=quot;DC.Languagequot; CONTENT=quot;italianquot;>
<META NAME=quot;DC.Relationquot;
CONTENT=quot;http://www.aib.it/aib/sezioni/veneto/vinay9.htmquot;>
</head>
Antonella De Robbio – Corso Metadati 27
30. Quanti sono i formati di metadati?
Popolazioni di metadati e infodiversità.
L’indagine DESIRE d l 1996 id tifi
L’i d i del identificava e
descriveva oltre 20 quot;popolazioniquot; diverse
I metadati sono numerosi e di
t d ti i diversi per
i
natura tipologica,
implementazione,
ambiti di provenienza
p
descrivono oggetti di natura/specie diverse
scopo
tipologia
funzione
Antonella De Robbio – Corso Metadati 30
31. Popolazioni di metadati e infodiversità
come i biologia ...
in bi l i
Il termine quot;metadiversità”coniato da Clifford Lynch
i i i
con significato di
quot;metadato in un contesto di biodiversità
metadato
che può relazionarsi con un'ampia gamma
di tipi di informazione che includono dati bibliografici,
p f g f ,
dati su modellizzazioni di oggetti di musei,
tassonomie sviluppate da biologi, prodotti della ricerca
e i d i i geospaziali
indagini i li
[Michael Day]
Antonella De Robbio – Corso Metadati 31
32. Come sono strutturati i metadati?
1. tipologico strutturale, o
intraspecifico al record
2. funzionale, correlato alla funzione
stessa del metadato in relazione
all'ambiente
ll' bi t
3. di comunità, in una suddivisione in
domini sulla b
d i i ll base d ll specifiche
delle ifi h
attività di comunità di utenti.
Antonella De Robbio – Corso Metadati 32
33. Perché usare sistemi di metadati?
Biblioteca ibrida: servizio di accesso all'informazione
Il sistema di metadati è la componente
logica di qua s as biblioteca, digitale o
og ca d qualsiasi b b oteca, d g ta e
tradizionale
l’organizzazione informativa è
g
fondamentale
I metadati possono essere usati p molti
p per
scopi non solo catalografici:
diritti di proprietà intellettuale, e ce
e co
e-commerce
firma digitale,
PICS
tariffazione servizi,
livelli di riservatezza di un documento, MMIR
metadescrizioni diDe Robbio – Corso Metadati
Antonella oggetti non testuali 33
34. Un sistema di metadati
consente
Ricerca, che consiste nell’individuare l’esistenza di un
documento;
Localizzazione, ovvero rintracciare una particolare
occorrenza del documento;
Selezione,
Selezione realizzabile analizzando, valutando e
analizzando
filtrando una serie di documenti;
Interoperabilità semantica, che consiste nel
permettere la ricerca in ambiti disciplinari diversi grazie
a una serie di equivalenze fra descrittori;
Gestione risorse, ossia gestire le raccolte di documenti
g
grazie all’intermediazione di banche dati e cataloghi;
Disponibilità, ovvero ottenere informazioni
sull effettiva
sull’effettiva disponibilità del documento.
Antonella De Robbio – Corso Metadati 34
35. A cosa servono i metadati?
In relazione al contesto In relazione alle risorse
Documentare Presentazione
Contestualizzare Localizzazione
Conservare Selezione
Gestire adeguata all’uso
date, persone,
p Acquisizione
strutture … termini
Gestire Manipolazione
profili e accessi Utilizzazione
Antonella De Robbio – Corso Metadati 35
36. Cosa si dice sui metadati?
You call it corn as we call it maize
quot;Poi c'è il problema della più che dati sui dati:
quot;I metadati sono nulla di catalogazione e dei metadati.
Su questideimio punto sono metadati:
i record il cataloghi di vista è che siano
tentativo
così t ti sconsiderato di tqualsiasi altra t
un t come un header TEI, otrovare una sorta di terza via tra
id t t i t
forma di descrizione.
il deserto dei motori di ricerca e della ricerca a testo libero
Potremmo chiamarla catalogazione,
e la per alcuni tale termine porta in sébibliografico eccessivo,
ma grande architettura del controllo un bagaglio eccessivo
che i bibliotecari hanno sviluppato negli ultimi centocinquant'anni.
come le Anglo-American Cataloging Rules e USMARC.
Così alcuni lo estendono adiluna situazione del che,
Penso che i metadati siano prodotto di quelli tipo
senzachiamatelo granturco, noicatalogazione, maisquot;,
quot;Voi alcuna conoscenza della lo chiamiamo
mariguardo per essa, come alchimistineutrale
né i metadati sono un buon termine bibliografi
cercano la pietrale basi” che ci offrirà una catalogazione
per coprire tutte filosofale
[Priscillasenza spese e accesso efficace senza vocabolari controllati.
efficace Caplan, 1995]
Non esiste nessuna cosa del genere e prima si abbandona meglio èquot;. è .
[Michael Gorman, Roma novembre 2001]
Antonella De Robbio – Corso Metadati 36
37. La nuova terminologia ci aiuta
g
Martin Dill
M ti Dillon diff
differenzia i metadati per:
i t d ti
Presentazione delle risorse
(resource discovery)
D
Descrizione delle risorse
i i d ll i
(resource description).
Nella lingua inglese il termine
quot;discoveryquot; ha un significato dup ce, d
d sco e y a u s g cato duplice, di
scoperta, ma anche di quot;presentazionequot;.
Antonella De Robbio – Corso Metadati 37
38. L legge d l metadato
La l del t d t
Non esiste solo il Dublin Core
Anche il MARC è un metadato
Ad ogni metadato il suo utente
Ad ogni comunità di utente il proprio
i ità t t i
metadato specifico
;-)
Antonella De Robbio – Corso Metadati 38
39. If
formati di metadati sono
ti t d ti
Numerosi
Differenti per
scopo
tipologia
ti l i
funzione
Possono essere
automatici
creati manualmente
Antonella De Robbio – Corso Metadati 39
40. Gli schemi di metadati
h i t d ti
Chiamati anche “Schema” sono set di metadati progettati per un
obiettivo specifico, come quello di presentare un tipo particolare di
risorsa informativa
informativa.
La semantica dello schema è la definizione o il significato degli
elementi stessi.
I valori assegnati agli elementi di metadati sono il contenuto.
contenuto
Generalmente, gli schemi di metadati specificano il nome degli
elementi e la loro semantica.
In maniera facoltativa, gli schemi di metadati possono specificare le
regole di contenuto ossia come il contenuto deve essere formulato
(per esempio, come identificare il titolo principale), le regole di
rappresentazione del contenuto (per esempio, le regole sulla
itt in i l ) l i titi t t (
scrittura i maiuscolo) e i valori consentiti di contenuto (per
esempio, la terminologia usata deve appartenere ad un vocabolario
specifico e controllato).
Antonella De Robbio – Corso Metadati 40
41. Schemi più diff i
S h i iù diffusi
Antonella De Robbio – Corso Metadati 41
42. D bli Core
Dublin C
Il Dublin Core Metadata Element Set è il frutto delle
discussioni di un workshop tenutosi nel 1995 e
sponsorizzato d OCLC e dal N ti
i t da d l National C t f
l Center for
Computing Application (NCSA).
Poiché il workshop si è svolto a Dublin, nell’Ohio, il set di
p , ,
elementi fu chiamato Dublin Core.
Il contenuto sviluppo del Dublin Core e le sue
individuazioni specifiche sono gestite dal Dublin Core
Metadata Initiative (DCMI).
L’obiettivo iniziale del Dublin Core era quello di stabilire
un set di elementi che potessero essere usati dagli
autori per presentare le loro risorse nel Web.
Antonella De Robbio – Corso Metadati 42
43. D bli Core
Dublin C
Abbreviazione di Dublin Metadata Core Element Set
Formato di metadata definito dal OCLC/NCSA
Metadata Workshop (marzo 1995)
Dublin Core è anche uno standard
DC definisce un set minimo di elementi per descrivere le
risorse di rete a sintassi indipendente di
p
15 elementi con qualificatori
Il set minimo degli elementi DC comprende: title, creator,
g p , ,
subject, description, publisher, contributor, date, type,
format, identifier, source, language, relation, coverage,
rights
i h
Antonella De Robbio – Corso Metadati 43
44. Scopi del Dublin Core
Nato per descrivere pagine web attraverso
etichette da applicare alla risorsa informativa
ti h tt d li ll i i f ti
Convivenza con altri schemi di metadati
Facilita i motori nella raccolta delle
informazione in rete
– limitazione del rumore
–iinserimento del metadato entro i TAG in HTML e
i t d l t d t t i
XML
Antonella De Robbio – Corso Metadati 44
45. P
Perché è nato il Dublin Core
hé t D bli C
Creazione di metadati da parte degli stessi
creatori delle risorse
Rappresentazione degli aspetti essenziali
relativi alla descrizione di una risorsa/oggetto
Definizione della semantica della descrizione
(HTML non bsta, non ne tiene conto)
Miglioramento “resource discovery”
resource discovery
Collaborazione attraverso consenso
Antonella De Robbio – Corso Metadati 45
46. Caratteristiche principali del
Dublin Core
Ciascun elemento può essere:
opzionale
p
ripetibile
Indipendenza della sintassi
Enstensione
Interdisciplinarietà
Internazionale
Antonella De Robbio – Corso Metadati 46
47. D bli Core
Dublin C
15 etichette
Metadato di tipo descritivo
record bibliografici
Campi tipizzati
vocabolario controllato
ISO 8601 (date)
tipi di risorse
URLs, ISBNs
,
RC 1766 Antonella De Robbio – Corso Metadati
(lingue) 47
48. Elementi D bli Core (1)
El i Dublin C
Titolo Pubblicatore
Creatore
C t C t ib t
Contributore
(persona, Data
organizzazione,
i i Tipo (e.g.
servizio) collezione, evento,
, ,
Soggetto (lista di immagine, oggetto
parole chiave dal fisico, software,
, ,
vocabolario suono, …)
controllato) Formato
Antonella De Robbio – Corso Metadati 48
49. El
Elementi D bli Core (2)
i Dublin C
Identificatore Diritti (proprieta’
F t
Fonte intellettuale
intellettuale,
Lingua (lingua) copyright)
Relazione Descrizione
D i i
(collegamento a una
( g (riassunto, indice, o
risorsa correlata) testo libero)
t t lib )
Copertura (es.
luogo, tempo, a
giurisdizione)
Antonella De Robbio – Corso Metadati 49
50. <head>
<meta http-equiv=quot;Content-Typequot; content=quot;text/html; charset=iso-8859-1quot;>
p q yp ;
<meta name=quot;DC.Creatorquot; content=quot;Solimine, Giovanniquot;>
<meta name=quot;DC.Datequot; content=quot;2000-08-10quot;>
<meta name=quot;DC.Descriptionquot; content=quot;Relazione 11. Seminario Angela Vinayquot;>
p g y
<meta name=quot;DC.Formatquot; content=quot;text/htmlquot;>
<meta name=quot;DC.Identifierquot;
content=quot;http://www.aib.it/aib/sezioni/veneto/vinay11/solimine00.htmquot;>
<meta name=quot;DC.Languagequot; content=quot;italianquot;>
<meta name=quot;DC.Publisherquot; content=quot;AIB - Associazione Italiana Biblioteche -
Sezione Venetoquot;>
<meta name=quot;DC.Relationquot;
content=quot;http://www.aib.it/aib/sezioni/veneto/vinay11.htmquot;>
<meta name=quot;DC.Sourcequot; content=quot;http://www.aib.itquot;>
<meta
< t name=quot;DC.Subjectquot; content=quot;Biblioteche, Bibli t
quot;DC S bj tquot; t t quot;Bibli t h Biblioteconomia, E
i Economia,
i
Finaziamenti, Cooperazione, Bilancio,
Servizi, Costi, Ricavi, Acquisti librariquot;>
<meta name=quot;DC.Typequot; content=quot;Textquot;>
name=quot;DC Typequot;
<meta name=quot;DC.Titlequot; content=quot;AIB. Sezione Veneto. Seminario Angela
Vinay. 11. BibliotECONOMIA: L'economia della cooperazione
bibliotecaria >
bibliotecariaquot;>
<title>11° Seminario Angela Vinay - BibliotECONOMIA</title>
</head> Antonella De Robbio – Corso Metadati 50
51. I qualificatori DC
lifi t i
Sono di due tipi
scheme=contesto per i
h interpretazione di un valore
i l
basato su standard esterni (DDC) e regole di
codifica
difi
ISO 8601 per data, ISO 639/1 per la lingua
type=raffina la semantica di un elemento
DC.CREATORE.MUSICISTA
Ogni elemento ha un qualificatore raccomandato
Antonella De Robbio – Corso Metadati 51
52. DC e lo spazio dei nomi
DC può essere esteso con altri elementi
all’interno del modello DC
ll’i t d l d ll
Si possono utilizzare altri elementi definiti
p
in namespaces diversi
I namespaces servono ad identificare in
maniera univoca il set di metadati che
stiamo utilizzando
Antonella De Robbio – Corso Metadati 52
53. METS Metadata Encoding and
Transmission Standard
Antonella De Robbio – Corso Metadati 53
54. Un documento METS contiene
sette sezioni principali:
1. METS Header – contiene metadati che descrivono il documento METS incluse
le informazioni riguardanti l’autore e l’editore ecc.
2. Metadati descrittivi – si riferiscono ai metadati descrittivi esterni al documento
METS (per esempio, un record MARC in un OPAC o un Encoded Archival
esempio
Description, un finding aid conservato in un webserver) o si riferiscono ai
metadati inseriti all’interno del documento o a entrambi.
3. Metadati Amministrativi – forniscono informazioni riguardanti la creazione e il
g
deposito del file, i diritti di proprietà intellettuale, la risorsa originale dalla
à
quale è stato creato l’oggetto per la biblioteca digitale e la provenienza dei
files dai quali è composto l’oggetto digitale.
4
4. Sezione di file – elenca tutti i files di contenuto che contengono la versione
elettronica dell’oggetto digitale.
5. Mappa strutturale – delinea una struttura gerarchica dell’oggetto digitale e
collega gli elementi di questa struttura con i files di contenuto e i metadati
che si riferiscono a ciascun elemento
elemento.
6. Links strutturali – permettono ai creatori di METS di registrare i nodi della
struttura gerarchica tracciata nella mappa strutturale.
7. Comportamento – associa comportamenti effettuabili con il contenuto di un
oggetto METS.
Antonella De Robbio – Corso Metadati 54
55. MODS Metadata Object
Description Schema
D i ti S h
E’ uno schema XML
E
E’ costituito da elementi a carattere bibliografico
che può avere svariate applicazioni,
specialmente in ambito bibliotecario.
bibliotecario
Deriva dal formato bibliografico MARC 21
(MAchine Readable
(MAchine-Readable Cataloging)
comprende un certo numero di campi le cui
etichette sono espresse in chiaro anziché in
forma numerica.
Antonella De Robbio – Corso Metadati 55
56. MODS: Struttura
MODS St tt
Si compone di
elementi principali
elementi secondari (sottoelementi)
attributi degli elementi
attributi dei sottoelementi
Il contenuto è incluso nell’elemento di livello
inferiore per evitare forme di “contenuto
inferiore, contenuto
misto”. Per esempio
<titleInfo> [elemento principale]: non contiene dati;
funge solo da “wrapper”
⌧<title> [sottoelementi]: contengono i dati
⌧<partNumber>
⌧<partName>
Antonella De Robbio – Corso Metadati 56
57. MODS Att ib ti
MODS: Attributi
Possono essere associati ad elementi di
qualunque livello e vengono definiti
congiuntamente all’elemento al quale sono
associati.
associati
Modificano l’elemento
Gli attributi più comuni sono:
type
encoding
authority
Antonella De Robbio – Corso Metadati 57
58. MODS Namespace
MODS: N
Lo schema di MODS viene dichiarato nel
seguente modo:
<mods xmlns:mods: quot;http://www.loc.gov/mods/quot;>
Antonella De Robbio – Corso Metadati 58
61. TEI Text Encoding Initiative
Antonella De Robbio – Corso Metadati 61
62. LOM Learning Object
Metadata
Il IEEE Learning Technology Standard
Committee (LTSC) ha creato uno standard (IEEE
( ) (
1484.12.1-2002) di metadati per la descrizione
di learning object (Learning Object Metadata -
LOM) che consente l uso e il ri-uso di risorse per
l’uso ri uso
l’e-learning, l’insegnamento supportato dalla
tecnologia come come il computer-based
g p
training e l’insegnamento a distanza.
Il LOM definisce un set minimo di attributi per la
ti l li
gestione, localizzazione e valutazione dei
i l t i d i
learning objects.
Antonella De Robbio – Corso Metadati 62
63. LOM l otto categorie
LOM: le tt t i
Categoria Generale: contiene informazioni sull’oggetto nella sua
interezza;
Categoria Ciclo Vitale: contiene metadati riguardanti l evoluzione
l’evoluzione
di un oggetto;
Categoria Tecnica: contiene le descrizioni delle caratteristiche
tecniche e dei requisiti;
Categoria Didattica: contiene gli attributi didattico pedagogici;
Categoria Diritti: descrive i diritti di proprietà intellettuale e le
condizioni d uso;
d’uso;
Categoria Relazione: identifica gli oggetti correlati;
Categoria Annotazione: contiene I commenti e l’autore e la data
dei commenti;
Categoria Classificazione: individua altri identificatori dei sistemi di
classificazione per gli oggetti.
Antonella De Robbio – Corso Metadati 63
64. EAD The Encoded Archival
Description
Antonella De Robbio – Corso Metadati 64
65. EAD e finding aids
EAD fu creato per marcare i dati contenuti nei finding aids per gli
archivi e collezioni speciali in modo che questi possano essere
visibili e consultabili on line.
on-line
i finding aids sono uno strumento importantissimo per la descrizione
delle risorse. Sono differenti dai semplici records per tre ragioni:
sono più lunghi,
sono più narrativi ed esplicativi,
sono fortemente strutturati in maniera gerarchica.
i finding aids
presentano all’inizio una descrizione della collezione nella sua interezza
indicano che tipo di materiali contiene e perché sono rilevanti.
descrivono le serie nelle quali sono organizzate le collezioni, per
q g ,p
esempio corrispondenza, records di business, documenti personali,
discorsi di propaganda
presentano in maniera articolata i contenuti dei contenitori fisici e delle
cartelle che costituiscono la collezione.
collezione
Antonella De Robbio – Corso Metadati 65
67. O
Oggetti visivi – CDWA
tti i i i
I metadati utilizzati per descrivere oggetti visivi come
pitture o sculture richiedono dei requisiti particolari.
L’Art Information Task Force (AITF) ha creato una
struttura concettuale, chiamata Categories for the
Descriptions of Works of Art (CDWA), che permettere di
p ( ), p
descrivere e consente l’accesso agli oggetti visivi e alle
immagini. Sono state definite circa 30 categorie e la
maggior parte di queste sotto st uttu ate in
agg o pa te d strutturate
sottocategorie multiple.
Alcuni esempi di elementi descrittivi specifici per le
opere d’arte sono: Orientazione Dimensioni Condizione
d arte Orientazione, Dimensioni, Condizione,
Iscrizione, Trattamento di Conservazione e Storia
dell’Esibizione e del Prestito.
Antonella De Robbio – Corso Metadati 67
68. VRA per slide e foto di opere
d’arte
I metadati per questi materiali devono essere in grado di
t d ti ti t i li d i d
descrivere i livelli molteplici delle risorse visive, per esempio
un dipinto originale, una slide del dipinto o un’immagine
digitalizzata d ll lid
di it li t della slide.
The VRA Core Categories sviluppa ed espande la struttura
concettuale CDWA e stabilisce un unico set di elementi di
metadati che può essere utilizzato sia per descrivere l’opera
d’arte originale (il dipinto vero e proprio, la fotografia, la
scultura, l architettura ecc.) sia l’immagine di essa (le
l’architettura l immagine
rappresentazioni visive).
VRA Core Categories è costituita da 17 elementi di metadati
che possono essere utilizzati ed applicati per descrivere
ciascuna di queste versioni e per collegarle l’una con l’altra:
Tipo di Record, Tipo, Titolo, Misure, Materiale, Tecnica,
Creatore, Data, Localizzazione,
Creatore Data Localizzazione Codice ID, Stile/Periodo,
ID Stile/Periodo
Cultura, Soggetto, Relazione, Descrizione, Risorsa e Diritti.
Antonella De Robbio – Corso Metadati 68
69. MPEG Multimedia Metadata
L’ISO/IEC Moving Picture Experts Group (MPEG) ha
creato un set di standards per la rappresentazione
p pp
codificata dei files audio e video digitali.
I due standards che prevedono metadati sono:
MPEG-7, Multimedia C t t D
MPEG 7 M lti di Content Description Interface (ISO/IEC
i ti I t f
15938): stabilisce gli elementi di metadati, la struttura e le
relazioni utilizzati per descrivere oggetti audiovisivi tra cui
immagini fisse, g afi i , modelli 3D, musica, audio, discorsi, video
fisse grafici 3D m si a a dio dis o si ideo
e collezioni multimediali. È uno standard composto da diverse
parti
MPEG-21, Multimedia F
MPEG 21 M lti di Framework (ISO/IEC 21000): è stato creato
k 21000) t t t
per rispondere all’esigenza di avere una struttura centrale che
assicuri l’interoperabilità degli oggetti digitali multimediali
Antonella De Robbio – Corso Metadati 69
70. PICS Platform for Internet
Content Selection
www.w3.org/PICS/
Recommendation dal 1996
Condivisione e interscambio di valutazioni
su siti e pagine Web
p g
etichette PICS trasportate negli header HTTP
o come marcatori META
⌧from document server
⌧f d
⌧or an independent label bureau
firmati elettronicamente e associati con un
digest
Antonella De Robbio – Corso Metadati 70
71. PICS: Esempio
<html>
<head>
<META http equiv quot;PICS Labelquot; content '
http-equiv=quot;PICS-Labelquot; content='
(PICS-1.1 quot;http://www.gcf.org/v2.5quot;
labels on quot;1999.11.05T08:15-0500quot;
until ”2001.12.31T23:59-0000quot;
for quot;http://w3.org/PICS/Overview.htmlquot;
ratings (suds 0.5 density 0 color/hue 1))
05
'>
</head>
<body>
<p>qui va il documento</p>
/
</body>y
</html>
Antonella De Robbio – Corso Metadati 71
72. PICS: Applicazioni
PICS A li i i
Protezione dei minori
CyberPatrol, EvalWeb NetNanny,
CyberPatrol EvalWeb, NetNanny …
Utente genera o ottiene un profilo
L’applicazione confronta rating e profilo e
L applicazione
compie una delle seguenti azioni:
suggest
search
monitor
warn
block
Antonella De Robbio – Corso Metadati 72
73. Etichette Recreational Software
Advisory Council (RSAC): Violenza
(category (transmit-as quot;vquot;) (name quot;Violencequot;)
(
(label (
(name quot;Conflictquot;) (
) (description quot;Harmless
p
conflict; some damage to objectsquot;) (value 0))
(label (name quot;Fightingquot;) (description quot;Creatures
injured or killed; damage to objects; fighting )
fightingquot;)
(value 1)) (label (name quot;Killingquot;) (description
quot;Humans injured or killed with small amount of
bloodquot;) ( l
bl dquot;) (value 2)) (l b l (
(label (name quot;Bl d and
quot;Blood d
Gorequot;) (description quot;Humans injured or killed;
blood and gore ) (value 3)) (label (name
gorequot;)
quot;Wanton Violencequot;) (description quot;Wanton and
gratuitous violence; torture; rapequot;) (value 4)))
Antonella De Robbio – Corso Metadati 73
74. PICS P bl
PICS: Problemi
i
Chi sceglie le etichette?
Chi ne definisce la sintassi?
Come determinarne il
significato?
A quale dato sono associate?
Antonella De Robbio – Corso Metadati 74
75. R
Regole di sintassi
l i t i
Ci sono anche regole di sintassi su come devono essere codificati gli
elementi e il loro contenuto.
Un sistema di metadati che non prevede regole prescritte di sintassi
è chiamato sintax independent.
I metadati possono essere codificati in qualsiasi tipo di sintassi
determinabile.
determinabile
La maggior parte degli schemi di metadati attuale usa SGML
(Standard Generalized Mark-up Language) o XML (Extensible Mark-
Up Language).
p g g )
XML è una forma estesa di HTML, creata dal World Wide Web
Consortium (W3C), che tiene conto di sets di etichette definite
localmente e consente un facile scambio di informazione
strutturata. SGML è un macro-insieme di HTML e XML che consente
t tt t i i h t
un ricco mark-up (marcatura) del documento. Poiché XML ha ormai
un ruolo cruciale nello scambio di varietà di dati nel Web, gli
strumenti XML stanno diventando sempre più disponibili su larga
scala.
Antonella De Robbio – Corso Metadati 75
76. Standard, profilo e registro
Standard: documento riconosciuto con generale
consenso,
consenso o con approvazione organismo ufficiale
Profilo:
Profilo sottoinsieme di specifiche che
caratterizzano una particolare applicazione di un
i i l li i
formato, protocollo…fornisce maggiori specifiche
per i l
implementatori (Bath Profile Z39.50, DC
t t i (B th P fil Z39 50
Euler Profile)
Registro:
Registro un sistema che registra la semantica, la
struttura e i formati di scambio di ogni tipo di dato
(database, messaggi, documenti)
Antonella De Robbio – Corso Metadati 76
77. Progetto Euler per la matematica
Nasce nel 1998 nel quadro di “Telematics for Libraries”
Consente l’accesso integrato a specifiche risorse informative in rete nel
campo della matematica
p
Realizza una Biblioteca digitale di matematica europea con integrazione
delle eterogenee risorse già esistenti
iff
Integra differenti contenitori i f
i i i
i i informativi: basi dati bibliografiche
i i i i fi
(MATHZbl), OPACS, riviste elettroniche, archivi di pre-prints ,
letteratura grigia e risorse Internet controllate
Descrizione delle risorse eterogenee provenienti dai vari contenitori
informativi basate su DC
Utilizzo di chiave di de duplicazione
de-duplicazione
One-shop point = unico punto d'accesso utilizzando un’unica interfaccia
disponibile sul WWW.
Antonella De Robbio – Corso Metadati 77
80. Ti i di metadati
Tipi t d ti
vi sono differenti suddivisioni tipologiche
in gruppi differenti
scuole di pensiero diverse
categorie diverse di metadati:
t i di t d ti
semantici, descrittivi, di presentazione,
amministrativo- gestionali (MAG), di
i i t ti ti li (MAG)
utilizzo, tecnici, per utenze particolari …
Differenti funzionalità di metadati
p g
conducono a differenti tipologie
Antonella De Robbio – Corso Metadati 80
81. Il Getty Standards Program
suddivide i metadati in 5 categorie
Amministrativi gestionali MAG (usati
per la gestione e amministrazione delle
risorse informative)
Descrittivi (dal MARC al Dublin Core)
Conservazione (compresa migrazione)
Tecnici (comportamento dei metadati e
funzionamento dei sistemi))
Utilizzo (relativi al livello e al tipo di
utilizzo dell’utente)
dell utente)
Antonella De Robbio – Corso Metadati 81
82. 1. Suddivisione dei metadati per tipologia strutturale
Antonella De Robbio – Corso Metadati 82
83. Qual è la funzione dei metadati?
Suddivisione dei metadati per tipologia funzionale
Amministrativi
utilizzati nella gestione e amministrazione delle risorse informative
Descrittivi
utilizzati per descrivere o identificare risorse informative
Di conservazione
riferiti alla gestione della conservazione delle risorse informative
Tecnici
riferiti al funzionamento di un sistema e al comportamento dei metadati
Di utilizzo
riferiti al livello e al tipo di utilizzo delle risorse informative
Antonella De Robbio – Corso Metadati 83
84. Amministrativi: metadati utilizzati nella
gestione e nell amministrazione delle
nell'amministrazione
risorse informative
Informazioni sull'acquisizione
Tracciato storico dei diritti di proprietà intellettuale,
cessione e passaggi ai fini della riproduzione
Documentazione dei requisiti di accesso legale
Informazioni sulla reperibilità
Criteri di selezione per la digitalizzazione [= formato, set di
caratteri]]
Controllo della versione e distinguibilità fra oggetti
informativi simili
i f ti i i ili
Tracce di controllo create da sistemi di gestione di metadati
[recordkeeping]
Antonella De Robbio – Corso Metadati 84
86. Descrittivi: metadati utilizzati per descrivere o
identificare risorse informative
Registrazioni catalografiche
Indicazioni di aiuto per il reperimento
Indicizzazione su database specialistici
Connessioni fra risorse tramite link Web
Annotazioni di utenti
Metadati per sistemi di gestione
[recordkeeping] generati dai programmi di
creazione delle registrazioni
Antonella De Robbio – Corso Metadati 86
89. Conservazione: metadati riferiti alla
gestione della conservazione delle risorse
informative
Documentazione della condizione fisica delle
risorse
Documentazione delle azioni intraprese per
conservare l versioni fisiche e digitali delle
le i i fi i h di it li d ll
risorse, per esempio ripristino [refreshing] e
migrazione dei dati
Antonella De Robbio – Corso Metadati 89
91. Schemi di metadati per la
conservazione digitale
A livello internazionale: National Library of Australia, il
British Cedars Project (CURL Exemplars in Digital
Archives),
A hi ) un gruppo di lavoro unitario del OCLC
l it i d l
il Research Libraries GRoup (RLG) ha creato una
struttura che delinea tipi di presentazione di metadati.
p p
Un gruppo supplementare, PREMIS (PREservation
Metadata: Implementation Strategies)- sponsorizzato
anche da OCLC e RLG – sta creando un nucleo di
elementi e strategie per la codifica, il deposito e la
gestione di metadati di conservazione all’interno di
sistema di conservazione digitale
digitale.
Molte di queste iniziative sono basate o sono compatibili
con ISO Reference Model for an Open Archival
Information S t
I f ti System (OAIS)
(OAIS).
Antonella De Robbio – Corso Metadati 91
92. Tecnici: metadati riferiti al funzionamento
di un sistema e al comportamento dei
metadati
Documentazione sull'hardware e il software
Informazioni sulla digitalizzazione, per
digitalizzazione
esempio formati, rapporti di compressione,
procedure di graduazione [scaling routines]
d d i li ti
Tracciato storico dei tempi di risposta di
p p
sistema
Dati di autenticazione e sicurezza, per
sicurezza
esempio chiavi crittografiche, password
Antonella De Robbio – Corso Metadati 92
93. I METS websites
b it
Per quanto riguarda i metadati tecnici, i
METS websites rendono disponibili schemi
b it d di ibili h i
per testi e immagini fisse digitali. L’ultimo
standard è chiamato MIX, Metadata for
Images in XML Schema ed è basato su
uno standard NISO, Z39.87, Data
Dictionary : technical Metadata for Digital
Still Images.
Antonella De Robbio – Corso Metadati 93
94. Di utilizzo: metadati riferiti al livello e al
tipo di utilizzo delle risorse informative
Registrazioni di visualizzazione [exhibit
records]
Tracciato storico dell'uso e gestione dei
profili utenti
fili t ti
Informazioni sulla riutilizzazione del
contenuto e sull'esistenza di una pluralità di
versioni [multi-versioning information
multi versioning
Antonella De Robbio – Corso Metadati 94
95. St tt
Strutturali (SGML, XML, EAD, MOA2)
li (SGML XML EAD
collegano le varie componenti delle risorse
per un’adeguata e completa fruizione, che
un adeguata
spesso avviene attraverso la mappatura di
schemi di metadata diversi
diversi.
forniscono dati di identificazione e
localizzazione del documento, come il codice
identificativo, l’indirizzo del file sul server,
l indirizzo
l’archivio digitale di appartenenza e il suo
indirizzo Internet
Internet.
Antonella De Robbio – Corso Metadati 95
98. Comunità di metadati ...
C ità t d ti
I metadati riflettono le esigenze delle comunità dai quali
provengono
Differenti comunità producono documenti intellettuali
peculiari all’utenza specifica che vi afferisce (matematici,
fi i i chimici, …)
fisici, hi i i )
Comunità diverse parlano e necessitano di linguaggi
specifici con i quali formulano la propria produzione
intellettuale
I metadati prodotti da queste comunità riflettono
necessariamente la struttura e la forma dei documenti da
esse prodotti
p
Antonella De Robbio – Corso Metadati 98
99. Quali sono i domini di appartenenza dei metadati?
Suddivisione dei metadati per domini di appartenenza
C a t e g o r ia d i A t t iv it à d i d o m in io C a t e g o r ia d i A t t iv it à d i d o m in io
d o m in io d o m in io
In d u str ia M a n u fa t t i A c c a d e m ic o P r o g e t t i u n iv e r s it a r i e
V e n d it o r i d i s o ft w a r e a c c a d e m ic i
V e n d it o r i d i h a r d w a r e S u b ject G atew a y s
T e le c o m u n ic a z io n i I n iz ia t iv e W 3 C
I n t e r n e t S e r v ic e P r o v id e r s
S e r v i z i d e i m o t o r i d i r ic e r c a
B a n c h e e a s s ic u r a z io n i
P u b b lic it à
D e t t a g lio
E d it o r i a D is t r ib u z io n i E d u c a z io n e e C o r s i in t e r a t t iv i
M u s ic a /v id e o /m u lt im e d ia d is t r in s e g n a m e n t o E d u c a z io n e p e r m a n e n t e e
I n d u s t r ia r e g is t r a z io n i m u s ic a c o n t in u a d u r a n t e l'a r c o d e lla
R iv is t e s c ie n t ific h e v it a
A g e n z ie s t a m p a I n s e g n a m e n t o a d is t a n z a
Q u o t id ia n i S c u o la
G e s t io n e d e i d ir it t i C u r r ic u la
A u d io -v id e o I n d u s t r ia fi lm o g r a fic a R ic e r c a L a b o r a t o r i d i r ic e r c a
P r o d u z io n i b r o a d c a s t e C o m p a g n ie d i r ic e r c a
a r c h iv ia z io n e d e lle p r o d u z io n i S o c ie t à p r o fe s s io n a li
m u lt i m e d ia li
B e n i c u lt u r a li B ib lio t e c h e I n f o r m a z io n i F o r n it o r i d i in fo r m a z io n i
S e r v i z i b ib lio t e c a r i g e o g r a f ic h e g e o s p a z ia li
M u sei
P o r t a li d i m u s e i
A r c h iv i
A lt r i d o m i n i T ra sp o rti
S e r v i z i d i s p e d iz io n e p o s t a
e le t t r o n ic a
S a n it à
S e r v i z i g o v e r n a t iv i
Antonella De Robbio – Corso Metadati A m b ie n t e 99
100. Possono essere creati
Chi produce i metadati? •manualmente
Publisher side •automaticamente
autori
Agenzie catalografiche nazionali
webmaster
b
istituzioni Repository/site manager
Archivi
A hi i
Autori, Biblioteche
creatori risorse.
metadati Musei.
Editori.
Terze parti: servizi di risoluzione URN
agenzie identificatori: ISBN, ISSN, BICI, SICI, ...
i id tifi t i ISBN ISSN BICI SICI
Service side
servizi di ricerca
Antonella De Robbio – Corso Metadati 100
creatori: terze parti
101. Comunità di metadati ...
I metadati riflettono le esigenze delle comunità dai
quali provengono
Differenti comunità producono documenti intellettuali
p
peculiari all’utenza specifica che vi afferisce
(matematici, fisici, chimici, …)
Comunità diverse parlano e necessitano di linguaggi
specifici con i quali formulano la propria produzione
intellettuale
I metadati prodotti da queste comunità riflettono
necessariamente la struttura e la forma dei documenti
da esse prodotti
conseguenza dell’ampia gamma di comunità con
dell ampia
interesse nei metadati è lo sconcertante numero di
standard eDe Robbio – Corso Metadati o sotto sviluppo 101
Antonella
formati esistenti
102. I metadati sono sempre ad accesso aperto?
Formati proprietari e formati standard
molte comunità di soggetti, in numerosi
soggetti
settori di mercato, sono fortemente
attaccati ai loro formati
sui formati proprietari vi sono stati investimenti: in
termini di documentazione, conoscenza e
documentazione
apprendimento,
sono stati sviluppati entro i sistemi creati per
manipolare i dati e offrire servizi ad utenze specifiche.
Esiste tensione tra questo continuo
progredire di formati specialisti e qualsiasi
requisito per un livello di interoperabilità
Antonella De Robbio – Corso Metadati 102
103. Qual è la relazione tra metadati e interoperabilità?
Il problema della diversità
L'interoperabilità è l'abilità dei sistemi di
L'i t bilità l' bilità d i i t i
fornire/accettare servizi in termini di
comunicazione comprensione reciproca
i i i i
attuata attraverso un colloquio reso
possibile nonostante le differenze.
o ibile o o t te diffe e e
ai fini dell’interoperabilità è necessario
individuare uno schema di riferimento semplice
utilizzare terminologia controllata per una corretta
corrispondenza semantica tra elementi
implementare servizi cross-domain per l’accesso a
risorse provenienti da domini differenti
i i ti d d i i diff ti
Antonella De Robbio – Corso Metadati 103
105. La mappatura: i crosswalk
pp
da un confronto tra popolazioni diverse emergono basse
aree di sovrapposizione
i i
una risposta al problema della diversità è la produzione di
crosswalk
c oss alk o mapping di metadati t a uno o più fo mati
tra no formati
ai fini della comparazione tra formati
al fine di stabilire il loro potenziale di interoperabilità
come base per la produzione di uno specifico programma di
conversione di formati
per la produzione di sistemi di ricerca, i quali dovrebbero
permettere l'interrogazione di formati di metadati eterogenei.
centralità del Dublin Core
formato strutturato semplice
facilità di creazione direttamente dai creatori di risorse
Antonella De Robbio – Corso Metadati 105
107. Quali prospettive per i metadati?
XML ...il linguaggio flessibile
XML = eXtensible Markup Language
XML può essere definito in molti modi
diversi
XML è una sintassi per marcare i documenti
XML è una famiglia di tecnologie correlate
f i li t l i l t
XML consente di
aggiungere metadati (semantica) ai propri dati
separare il contenuto dalla presentazione
definire i i i
d fi i in maniera rigorosa il linguaggio di markup
li i k
utilizzato
utilizzare un formato neutrale e testuale
Antonella De Robbio – Corso Metadati 107
108. M t d ti basati su XML
Metadati b ti
XML Schema
RDF (Resource Description Framework)
RDF Schema
Antonella De Robbio – Corso Metadati 108
109. Lo stack XML/RDF/DC
Il modello attuale prevede l’utilizzo di tre
p
standard come strati diversi (layers
comunicativi))
XML stabilisce la sintassi di base (struttura fisica)
RDF definisce la struttura delle relazioni
(struttura logica)
DC definisce i contenuti (struttura per i
contenuti)
Antonella De Robbio – Corso Metadati 109
110. M t d ti e infrastrutture tecniche
Metadati i f t tt t i h
INTEROPERABILITA’
XML
– Metalinguaggio con regole per costruire linguaggi di
marcature
RDF
– Infrastruttura che promuove interoperabilità dei
metadata
ANSI/NISO Z39.50-1995
–PProtocollo di rete per la ricerca su un largo numero
ll l i l
di database eterogenei
Antonella De Robbio – Corso Metadati 110
111. <?xlm version=1.0”?>
<libro>
<autore>Antonella De Robbio</autore>
<titolo>Diritto d’autore</titolo>
</libro>
<XML permetterà non solo di
scambiare informazioni
<?xlm version=1.0”?>
i
tra differenti sistemi operativi,
<libro>
ma anche si superare confini
<titolo>Antonella De Robbio</titolo>
nazionali e culturali./>
<autore>Diritto d’autore</autore>
</libro>
<XML e XSL permetteranno
agli editori di scrivere
<?xlm version=1.0”?>
una sola volta
<libro autore=“Antonella De Robbio”>
e pubblicare ovunque,
<titolo>Diritto d’autore</titolo>
su carta
</libro>
</lib >
o in forma elettronica./>
Antonella De Robbio – Corso Metadati 111
112. …esempio
i
Nell’esempio precedente i tre documenti
hanno lo stesso contenuto informativo
seppure presentato con strutture diverse
Per i
P noi umani i nomi degli elementi sono
i i d li l ti
di grande aiuto per interpretare il
contenuto
Ma cosa dire del seguente esempio,
esempio
ovvero come un calcolatore vede il
documento
doc mento
Antonella De Robbio – Corso Metadati 112
114. … ma da solo XML non è
sufficiente ...
XML è troppo flessibile mentre è
necessario un modello estremamente
i d ll t t
semplice per esprimere delle conoscenze
processabili automaticamente
HTML è estremamente semplice ma non
flessibile e perciò può solo rappresentare
informazioni senza tener conto della
semantica
Antonella De Robbio – Corso Metadati 114
115. XML non è facile come HTML
Può essere un limite?
Con
C HTML chiunque poteva pubblicare in
hi t bbli i
Web
XML è complesso e non tutti saranno in
g
grado di utilizzarlo
Ritorno all’epoca pre-Web?
O selezione obbligata di ciò che verrà
pubblicato?
Antonella De Robbio – Corso Metadati 115
116. <?xlmversion=1.0”?><v><x>
aaaa</x><y>bbbb</y></v>
</ >< >bbbb</ ></ >
Cosa si può dire? che aaaa è y di bbbb o che bbbb è x di
aaaa? Dal punto di vista della macchina i nomi degli
elementi non aiutano, e non aiuta l’indentazione; quello
che serve è una struttura rigida per specificare la
“direzione” della relazione
A questo scopo il W3C ha inventato RDF (Resource
Description Framework).
D i i F k)
RDF aiuta la macchina a stabilire le relazioni
Antonella De Robbio – Corso Metadati 116
117. Resource Description Framework
(RDF)
RDF è un modello di metadati
RDF è una piattaforma per il trattamento
dei metadati
RDF costituisce una ipotesi di soluzione
tit i i t i l i
individuata dal W3C al problema della
rappresentazione dei metadati
t i d i t d ti
RDF è complementare a XML
p
<http://www.w3.org/RDF/>
Antonella De Robbio – Corso Metadati 117
118. Primi passi con RDF
I dati sono descritti da asserzioni
Un asserzione e’
Un’asserzione e composta da
Una risorsa
⌧Pagina Web o parte di essa, intero sito Web…
essa Web
⌧…sottoalbero XML …un libro … qualunque cosa dotata
di URI
una proprieta’
i t ’
⌧e.g. Titolo, Data, Tipo
un valore
⌧es. stringa, numero, frammento XML, un’altra
risorsa
Antonella De Robbio – Corso Metadati 118
119. S
Scopo e fi lità di RDF
finalità
realizzare un meccanismo per la descrizione di
risorse
definizione di un meccanismo
neutrale rispetto ai domini
adattabile alla descrizione di informazioni di
qualsiasi dominio
permettere la definizione di semantiche per dati in
formato XML
secondo modalità standardizzate e che mirano
l'interoperabilità
Antonella De Robbio – Corso Metadati 119
120. C
Cosa offre RDF
ff
RDF offre l'interoperabilità tra applicazioni
che scambiano sul Web informazioni
comprensibili dalle macchine
il modello RDF consente di rappresentare
metadati in una sintassi per la codifica e la
trasmissione di metadati
scambio secondo modalità che favoriscano
l'interoperabilità fra server e client Web,
sviluppati in modo indipendente
Antonella De Robbio – Corso Metadati 120
121. RDF può essere usato
ò t
da agenti software intelligenti per facilitare la
condivisione e lo scambio di conoscenza
nella valutazione di contenuto
nel descrivere collezioni di pagine che rappresentano un
unico quot;documentoquot; logico
pe desc e e diritti di proprietà te ettua e di pagine
per descrivere i d tt d p op età intellettuale d pag e
Web
p
per esprimere le preferenze sulla riservatezza da parte
p p p
di un utente così come le politiche di riservatezza di un
sito Web
Antonella De Robbio – Corso Metadati 121
122. Il modello RDF
d ll
Il modello dei dati RDF offre una struttura
concettuale astratta per la definizione e
l'uso di metadati
Per creare e scambiare questi metadati è
necessaria anche una sintassi concreta.
A grandi linee la sintassi di RDF usa XML
di li l i t i
(Extensible Markup Language) all'interno
di un modello che poggia su tre concetti
d ll h i t tti
base: il soggetto, l'oggetto e il predicato
Antonella De Robbio – Corso Metadati 122
123. E
Esempio
i
composizione di una frase
soggetto predicato e oggetto
(RDF fa lo stesso: è uno schema)
struttura da riempire di significati
Io catalogo un documento
Antonella De Robbio – Corso Metadati 123
124. il soggetto, l'oggetto e il predicato
soggetto l oggetto
Il Soggetto è la risorsa descritta,
L’Oggetto è quell'affermazione che
L’O tt ll' ff i h
attribuisce ad una caratteristica della
i d itt
risorsa descritta un determinato valore.
d t i t l
Il Predicato è la caratteristica o l'aspetto
p
specifico utilizzato per la descrizione del
soggetto, che determina la proprietà della
gg , p p
risorsa descritta.
Antonella De Robbio – Corso Metadati 124
125. Altre visioni di RDF
Sintassi XML standard per rappresentare grafi
etichettati diretti
Sintassi XML standard per rappresentare fatti
in logica del primo ordine senza variabili
Asserzione :=
(predicato,soggetto,oggetto)
Predicato = URI
Soggetto = URI soggetto
tt di t
predicato tt
oggetto
Oggetto = URI o costante
Oggetto =
Predicato(Soggetto)
126. RDF
RDF definisce delle terne:
Risorsa TipoDiProprietà Valore
Ciascuna terna definisce una proprietà
della risorsa
Per risorsa si intende qualunque entità
identificabile tramite una URI
http://www.aib.it/aib/lis/opac1.html
TipoDiProprietà: autore:
Ti DiP i tà t
Valore: “Antonella De Robbio”
Antonella De Robbio – Corso Metadati 126
127. Rappresentazione di RDF
Le terne di RDF possono essere
rappresentate in molti modi anche
modi,
graficamente
www.aib.it/aib/lis/opac1.htm
URI
Antonella De Robbio
XML è usato per la sua sintassi rigorosa
Antonella De Robbio – Corso Metadati 127
128. Esempio di modello RDF
Autore
http://www.aib.it/aib/lis/opac1.htm
http://www.aib.it/aib/lis/opac1.htm
“La persona il cui nome e’
Antonella De Robbio, email
A t ll D R bbi il
derobbio@aib.it
e’ l’autore di nome Email
http://www.aib.it/aib/lis/opac1.htm”
Antonella De Robbio derobbio@aib.it
Antonella De Robbio – Corso Metadati 128
129. L’ l
L’elemento RDF
t
L'elemento RDF è un semplice involucro
che delimita i confini in un documento
h d li it fi i i d t
XML entro cui il contenuto è
esplicitamente da intendere mappabile in
una istanza di modello di dati RDF
Antonella De Robbio – Corso Metadati 129
130. Si t
Sintassi
i
<?xml version=quot;1 0quot; encoding=quot;UTF-8quot;?>
version= 1.0 encoding= UTF-8 ?>
<rdf:RDF xmlns:rdf=quot;http://www.w3.org/1999/02/22-rdf-syntax-
ns#quot; xmlns:rdfs=quot;http://www.w3.org/2000/01/rdf-schema#quot;>
<rdf:description
< df d i ti
about=quot;http://www.math.unipd.it/~derobbio/home/antohp.htmquot;>
<s:Creator>Antonella De Robbio</s:Creator>
</rdf:description>
</rdf:RDF> RISORSA
SPAZIO DI DENOMINAZIONE =
PROPRIETA’ - VALORE VOCABOLARIO DI DOMINIO =
( questo caso costante) ELENCO DI PROPRIETA
(in q ) PROPRIETA’
Antonella De Robbio – Corso Metadati 130
131. S h
Schema RDF
Lo schema RDF è come una sorta di
dizionario
In RDF il significato, fondamentale per la
comprensione delle asserzioni, è espresso
asserzioni
attraverso il riferimento ad uno schema
Attraverso la condivisione degli schemi,
RDF favorirà il riutilizzo delle definizioni di
metadati
Antonella De Robbio – Corso Metadati 131
132. Il web semantico
Il progetto è stato lanciato nel 1998 dal
W3 allo scopo di rendere le informazioni
che popolano la rete
h l l t
comprensibili alle macchine
p
processabili anche da programmi progettati in
maniera indipendente
Il web non deve servire solo a visualizzare
documenti ma anche e soprattutto alla
integrazione e riutilizzo delle informazioni
tra applicazioni diverse
Antonella De Robbio – Corso Metadati 132
133. Il web semantico
In un certo senso abbiamo bisogno di un
web che sia computer-friendly per essere
più user-friendly
Più le macchine saranno in grado di
interpretare autonomamente le
p
informazioni della rete più efficaci saranno
i loro servizi a:
trovare informazioni pertinenti
prendere decisioni
d d i i i
Antonella De Robbio – Corso Metadati 133
134. Ri
Risorse utili
tili
Metadata UKOLN
http://www.ukoln.ac.uk/metadata/
Sito IFLA
http://www.ifla.org/II/metadata.htm
Dublic C
D bli Core
http://dublincore.org/
Antonella De Robbio – Corso Metadati 134
135. Ri
Risorse utili (2)
tili
Mapping between metadata formats
h // k l
http://www.ukoln.ac.uk/metadata/interoperability/
k/ d / bl /
A review of metadata: a survey of current
resource description formats Work Package 3 of
Telematics for Research project DESIRE (RE
1004)
http://www.ukoln.ac.uk/metadata/desire/overview/rev_toc.htm
Antonella De Robbio – Corso Metadati 135
136. Ri
Risorse utili (3)
tili
Gruppo di studio ICCU sugli standard e le
applicazioni di metadati nei beni culturali
li i i t d ti i b i lt li
http://www.iccu.sbn.it/metadati.htm
tradotto la versione 1.1 del quot;Dublin Core Metadata Element Set”
ha implementato il Dublin Core sul sistema SBN-on line
partecipa al progetto europeo DELOS NOE
Lista dei progetti che utilizzano i metadati
in It li
i Italia
Antonella De Robbio – Corso Metadati 136
137. Il gruppo è articolato in due
sottogruppi:
metadati descrittivi
p
predisposizione di modello di raccolta dei dati descrittivi
p
per individuare gli elementi dimetadati ritenuti essenziali
all' identificazione dell'oggetto digitale
riferimento ad un modello logico (FRBR)
mapping per confronto relativo ai Metadati o ai Profili
metadati gestionali-amministrativi e
strutturali
definizione di un set di metadati relativi
⌧modalità e politica di accesso alle risorse digitali
⌧aspetti organizzativi e di gestione degli oggetti digitali con i relativi servizi
⌧strategie di conservazione di lungo periodo degli oggetti medesimi
Antonella De Robbio – Corso Metadati 137
138. Al
Alcuni generatori...
i t i
DC-dot
http://www.ukoln.ac.uk/metadata/dcdot/
META builder
http://vancouver-webpages.com/META/mk-metas.html
DONOR metadatagenerator
http://www.kb.nl/coop/donor/mg-start.html
Automatic RDF Metadata Generator
http://www.scit.wlv.ac.uk/~ex1253/metadata.html
Antonella De Robbio – Corso Metadati 138