2. ¿Qué pretenden las Colecciones Digitales
Complutenses?
• Facilitar el acceso al conocimiento
• Reducir barreras a la publicación y la difusión del
conocimiento garantizando los derechos de propiedad de los
autores, docentes e investigadores así como de la sociedad en
su conjunto.
• Incrementar la difusión, uso e impacto de la investigación
producida en la institución y de nuestro patrimonio.
• Compromiso de preservar este capital a largo plazo.
3. La Colección Digital Complutense
Fondo antiguo
• 120.000 libros
• 50.000 grabados
Más de 20.000 tesis
E-Prints
Complutense :
• 30.000 artículos
• libros y capítulos
• ponencias de
congresos
80 cabeceras de prensa
Portal revistas UCM
•300.000 periódicos digitalizados
•30.000 artículos de revistas
• 82 títulos de revistas
4. La apuesta por la colaboración para la digitalización y
difusión de la producción científica y el patrimonio de la UCM
• Apuesta por la difusión en acceso abierto, tanto mediante el archivo en la
denominada “vía verde” como en la “vía dorada” y la publicación por parte
de la biblioteca en colaboración con otros servicios
• Colaboración con instituciones y organismos oficiales para la difusión y
digitalización: Ministerio, Comunidad de Madrid, Madroño, Europeana,
Hathi Trust, Internet Text Archive...
• Colaboración con instituciones privadas para la difusión y digitalización:
Google, Santander Universidades, Fundación de Ciencias de la Salud,
Editorial Extramuros,
• Colaboración con editoriales y distribuidores comerciales para la
difusión: Springer, Thomson Reuters, Proquest, E‐Libro.
7. La digitalización y difusión del
patrimonio bibliográfico: Acuerdo con
Google
• En septiembre de 2006, la
Biblioteca de la UCM se suma al
proyecto Google Libros.
• Digitalización de obras de
dominio público que están en
acceso abierto en Internet.
•Se puede buscar por los
metadatos descriptivos de las
obras y por el texto completo.
• La Biblioteca de la UCM y Google
disponen de una copia digital.
8. ¿Qué puede representar para el público?
• Se está creando una gran biblioteca
universal de objetos digitales selectos
• Parte de los fondos de algunas de las
principales bibliotecas del mundo llegarán
a los ordenadores del público en general
• Los libros serán recuperados mediante la
tecnología y el interfaz de Google
• Es un motor dinamizador de proyectos
similares
• Se avanza en la preservación y difusión de
los contenidos culturales
• Herramienta esencial para la
democratización del conocimiento
9. ¿Qué otras grandes bibliotecas de investigación
han realizado acuerdos de colaboración con
Google?
• Bibliotecas Públicas de Nueva York, Lyon
• Universidades de Harvard, Princeton, Cornell, Columbia,
Oxford, California, Stanford, Michigan, Keio…
• Bibliotecas Nacionales de Austria, Holanda, Italia, Baviera,
Cataluña...
• Se estima que se digitalizarán más de 15 millones de libros
• Ya se han digitalizado más de 11 millones de libros
10. Fechas clave del proyecto
• Septiembre de 2006:
– Firma del acuerdo de colaboración
• Octubre‐Diciembre 2007:
– Organización de los Equipos de selección .
– Cursos de formación a los Equipos de selección:
• 2008:
– Comienzan los trabajos de selección de libros en los depósitos de las
bibliotecas (enero)
– Comienzan los primeros envíos de libros al Centro de Digitalización
(marzo)
– Desde el otoño, miles de obras se pueden consultar libremente en Internet
• Junio 2011:
– 120.000 libros complutenses digitalizados
11. Datos totales
Libros Libros comprobados No digitalizados %
digitalizados
120.000 150.000 23.000 17%
Manuela Palafox. Proyectos de digitalización de la Biblioteca Complutense. Ministerio de
Cultura, 10/11/2011
12. Accesos a los libros Complutenses
Período de 7 días
Accesos Título Autor Año Centro
12.490 Diccionario etimológico de la lengua castellana (ensayo) Pedro Felipe Monlau 1856 FLL-DER
12.008 Diccionario geográfico-estadístico de España y sus posesiones de ultramar Pascual Madoz 1830 VET
8.637 La Ilíada Homero 1788 FOA
8.275 Vida y viajes de Cristóbal Colón Washington Irving 1852 GHI
7.520 Enciclopedia moderna Francisco de Paula Mellado 1851 DER
7.027 Los tres reinos de la naturaleza o museo pintoresco de historia naturaleza: Georges-Luis Leclerc Buffon 1857- MED-FOA
Botánica. Mineralogía 1858
6.468 Diccionario de la lengua castellana Real Academia Española 1852 FLL
4.450 Mitología universal Juan Bautista Carrasco 1864 DER
4.205 Linajes nobles de España Juan José Vilar Psayla 1867 FLL
4.179 Diccionario de agricultura práctica y economía rural Agustín Esteban Collantes, Agustín Alfaro 1855 MED
4.035 Anatomie descriptive Jean Cruveilhier 1837 MED
3.984 Anatomia do corpo humano Bernardo Santucci 1739 FOA
3.671 Diccionario universal latino-español Manuel de Valbuena 1808 FOA
13. La preservación a largo plazo y la
difusión del patrimonio bibliográfico:
Hathi Trust
• En 2010 la UCM se convierte en el primer
socio no norteamericano de Hathi Trust
• Es una asociación de instituciones de
investigación y bibliotecas que trabajan
para asegurar la difusión y conservación
futura del patrimonio cultural
• Su fin es coordinar las estrategias de
almacenamiento compartido, lo que reduce
los costos a las bibliotecas asociadas
• Proporciona un marco técnico para la
creación de herramientas y servicios
14. Algunas instituciones miembros de Hathi
Trust
• Library of Congress
• New York Public Library
• Universidades de California, Cornell, Columbia,
Chicago, Harvard, MIT, Michigan, Princeton,
Stanford, Yale...
15. Beneficios de participar en HathiTrust
• Servicios de preservación:
– HathiTrust tiene un compromiso de conformidad con
los actuales estándares y procesos de revisión para la
preservación digital. Es conforme con:
• Trustworthy Repositories Audit & Certification
(TRAC): Criteria and Checklist (March 2007)
• Open Archival Information System (OAIS) Reference
Model (2002)
• Preservation Metadata Implementation Strategies
(PREMIS) (2005)
16. Beneficios de participar en HathiTrust
• Servicios de acceso:
– Búsqueda bibliográfica y texto completo.
– Sistema de autenticación Shibboleth. Los socios pueden
descargarse los libros que están en el dominio público.
– Creación de colecciones: se puede hacer búsquedas de
texto completo de los libros guardados en una de
nuestras colecciones.
– Además, se pueden compartir con otros y hacerlas
públicas.
17. Beneficios de participar en HathiTrust
• Disponibilidad de datos bibliográficos
– HathiTrust ofrece una variedad de métodos para
obtener los registros del repositorio en cada catálogo:
acceso a los datos bibliográficos a través del API de
HathiTrust y otros mecanismos, así como propuestas
adicionales o servicios previstos (como el acceso a
usuarios con discapacidad)
• Gobernanza
– La asociación a HathiTrust ofrece a las instituciones
miembros la capacidad de compartir el desarrollo de
nuevos servicios, a través de su participación en los
órganos de gobierno. Reunión en octubre de 2011
18. Características de HathiTrust
• El repositorio está localizado en la Universidad de Michigan, en Ann
Arbor y hay un mirror completo en la Universidad de Indianápolis, en
Indiana.
• Utiliza tecnologías de código abierto (PERL, MySQL, Linux…).
• Configuración de un espacio donde todos los socios podrán tener
acceso para hacer desarrollos y mejoras.
• Los metadatos bibliográficos se gestionan en un Sistema de Gestión de
Bibliotecas (Aleph).
• Los metadatos de preservación técnicos y estructurales están incluidos
en un fichero METS para cada objeto digital. Los metadatos de
preservación (PREMIS) se actualizan cuando las acciones se producen
en un objeto.
• Formatos: TIFF, JPG2000…
• URL permanente (servicio handle)
19. Políticas de acceso en HathiTrust
• El acceso se establece por detección geográfica,
dirección IP, y autenticación del usuario en
conjunción con el estatus de copyright de cada
ejemplar almacenado en una base de datos de
derechos de autor.
• El estatus de copyright se determina inicialmente
por la información contenida en el registro
bibliográfico. Los ejemplares publicados en USA
antes de 1923 o después de 1870 fuera de Estados
Unidos se consideran que están en el dominio
público.
20. Política de preservación en HathiTrust
• Preservación del contenido.
HathiTrust tiene el compromiso de preservar el contenido
intelectual y en muchos casos la apariencia exacta de los
materiales digitalizados y depositados en HathiTrust, lo
que incluye:
– Representaciones digitales (imágenes) del contenido tal
como aparece en su forma original.
– Representaciones textuales del contenido a través de
las tecnologías OCR (¡cuando es posible!)
21. Política de preservación en HathiTrust
• Estrategias de preservación:
– Uso de formatos de preservación estándares (ficheros
TIFF ITU G4 almacenados en 600dpi, ficheros JPEG o
JPEG2000 almacenados en varias resoluciones de
200dpi a 400dpi, texto Unicode, y ficheros XML).
– Validación rigurosa en la ingesta.
– Diseño del repositorio según los estándares OAIS y
TRAC.
– Comprobaciones regulares para verificar la integridad
del contenido almacenado.
24. Proyecto Europeana Libraries
• Participan 19 bibliotecas de investigación de 14
países europeos: Universidad de Baviera, Oxford,
Gante, Lund, Uppsala, Trinity College, etc. La BUC
es la única biblioteca española que participa en el
proyecto.
• El objetivo es incorporar a Europeana 5 millones
de objectos digitales: manuscritos, películas y
textos pertenecientes al patrimonio bibliográfico y
científico de las bibliotecas participantes.
• Crear una infraestructura para extender al resto
de las bibliotecas de investigación de LIBER.
25. Europeana Libraries: Aportación de la
Universidad Complutense
– Libros antiguos hasta 1870: Metadatos de más de 120,000 libros
digitalizados por Google.
– Grabados de la Colección Digital Dioscórides : 50,000.
– Tesis de la UCM: 6,000.
– Artículos de las revistas científicas de la UCM: 31,000
– Dibujos antiguos de la Facultad de Bellas Artes (entre1752 y 1914):
287.
– Fotos de la Guerra Civil española provenientes del Archivo
Histórico del Partido Comunista de España: 3,200.
– Archivo personal de Rubén Darío: 5,000 documentos.
– Manuscritos, incunables y material cartográfico diverso
26. ¿Cómo se accede a los libros
complutenses digitalizados?
• Google Libros
• Interfaz de búsqueda de Google
para la búsqueda exclusiva de
libros complutenses.
• Catálogo de la Biblioteca de la
Universidad Complutense.
• Portal de Colecciones Digitales
Complutenses
• HathiTrust Digital Library
• Europeana
• Biblioteca Virtual Miguel de
Cervantes
41. Recapitulando, ¿Qué pretenden las
Colecciones Digitales Complutenses?
• Facilitar el acceso al conocimiento
• Reducir barreras a la publicación y la difusión del
conocimiento garantizando los derechos de propiedad de
los autores, docentes e investigadores así como de la
sociedad en su conjunto.
• Incrementar la difusión, uso e impacto de la investigación
producida en la institución y de nuestro patrimonio.
• Compromiso de preservar este capital a largo plazo.