2. Chi siamo?
Yuri Carrer
Centro di Ateneo per le Biblioteche
Università degli Studi di Padova
yuri.carrer@unipd.it
Massimo Azzolini
RedTurtle’s co-founder and project manager
massimo@redturtle.net
3. Analisi
• materiale sparso per il web e
non
• materiale e metadati di tipo
eterogeneo
• strutture spesso senza
supporto informatico
• necessità di "accompagnare"
chi pubblica
4. Obiettivi
• poter indicizzare quelle
tipologie di risorse (web, z3950,
locali)
• catturare la tipologia dei
materiali (book, audiobook che
mappiamo a partire da
audiolibri, libri braille, a grandi
caratteri, ecc.)
• fornire il modo per importare
liste di materiali
• dare uno spazio per ogni
struttura per inserire i propri
materiali.
10. Lo schema del progetto
sorgenti
Libri
Z39.50
web site
11. Lo schema del progetto
CSV
sorgenti
Libri
Z39.50
web site
12. Lo schema del progetto
CSV
sorgenti
Libri retriever
Z39.50 retriever
web site retriever
13. Lo schema del progetto
CSV
sorgenti
Libri retriever
Z39.50 retriever populator
web site retriever
14. Lo schema del progetto
CSV
sorgenti
Libri retriever
Z39.50 retriever populator Indice
web site retriever
15. Lo schema del progetto
CSV
ricerca
sorgenti
Libri retriever
Z39.50 retriever populator Indice
web site retriever
16. Lo schema del progetto
CSV
ricerca
sorgenti
Libri retriever
Z39.50 retriever populator Indice
web site populator ...
retriever
17. Libri
• Puoi crearli nel portale
• Puoi importarli via CSV
• Hanno un flusso
• Ogni biblioteca ha i suoi
18. Z39.50
• E’ un protocollo per
effettuare ricerche su
database remoti
• Molto comune su basi dati
bibliografiche
• Tre sintassi supportate
• UNIMARC
• USMARC
• SUTRS
19. Portali pubblici
• utilizzo i loro motori di ricerca
• ottengo liste HTML di libri
• analizzo i risultati:
• default parser configurabile
• extended parser ad-hoc
20. Normalizzare!
un “Book” è un serie di dati del tipo:
• Titolo • Formato
• Descrizione • ISBN
• Autori • ISSN
• Editore • Data
21. .. anche il formato!
• ogni retriever:
• mappa i formati di una sorgente, in un unico tipo.
• mappa un formato in un certo tipo, un altro formato in un altro tipo, ecc.
22. Analisi di portali
esterni
• Occorre analizzare codice
HTML che non generiamo
• Non c’è certezza
• HTML che otteniamo non è
pensato per fornire dati
23. Analisi di portali
esterni
• Occorre analizzare codice
HTML che non generiamo
<tr>
<td>Alighieri Dante</td>
• Non c’è certezza
<td>
• HTML che otteniamo non è
<a href="index.asp?
pensato per fornire dati
scelta=dettaglio&id=3601&catalogo=1&idmenu=4">
Rime
</a>
</td>
<td>Biblioteca Italiana Ciechi</td>
</tr>
24. Analisi di portali esterni
• Un analizzatore (parser) standard parametrizzabile
• Possibilità di aggiungerne altri
25. Populator
Oggi:
• un solo populator, indicizzatore.
Domani:
• popoliamo altri siti web,
• estraiamo dati
• salviamo su database esterni
• ...
42. Come funziona
• Crei una o più pagine modello
• Usi i css e tutte le tecniche di
accessibilità che desideri
• Riempi gli spazi con contenuti
provenienti da una fonte
esterna:
• in questo caso Plone..
• ..ma non hai vincoli
tecnologici
http://www.flickr.com/photos/jenny-pics/3527749814
52. Questions!?
Yuri Carrer
Centro di Ateneo per le
Biblioteche - Università di Padova
yuri.carrer@unipd.it
Massimo Azzolini
RedTurtle Technology
massimo.azzolini@redturtle.net