2. EJE TEMATICO Nº 4
Presentado por :
LILIANA LONDOÑO BECERRA
MARELBIS GAZCON TAPIAS
DIANA LUCIA MOSQUERA ROBLES
Presentado a:
Docente: JORGE MARIO ZULUAGA CAMPUZANO
UNIVERSIDAD DEL QUINDIO
PROGRAMA DE CIENCIA DE LA INFORMACIÓN Y LA DOCUMENTACIÓN
BIBLIOTECOLOGÍA Y ARCHIVISTICA
GESTION DE DOCUMENTOS DIGITALES
2014
4. 1. DIGITALIZACIÓN, QUE ES Y APLICACIONES
Es la forma como una imagen (texto, fotos, formas, sonido ,
movimiento...), se pueden convertir en un idioma comprensible
para los computadores.
Las imágenes digitales son fotos electrónicas
tomadas de una escena o escaneadas de
documentos-fotografías, manuscritos, textos
impresos e ilustraciones.
Consiste en convertir un documento físico en un
archivo digital o imagen electrónica, mediante
equipos especializados para ello, llamados
escáneres.
5. Señal de origen análoga Señal digitalizada
Se realiza una muestra de la imagen digital y se
confecciona un mapa de ella en forma de cuadrícula de
puntos o elementos de la figura (píxeles).
A cada píxel se le asigna un valor tonal (negro, blanco,
matices de gris o color), el cual está representado en
un código binario (ceros y unos).
6. • Los dígitos binarios ("bits") para cada píxel son almacenados por
una computadora en una secuencia, y con frecuencia se los reduce
a una representación matemática (comprimida). Luego la
computadora interpreta y lee los bits para producir una versión
analógica para su visualización o impresión
Valores de píxel: Como se exhibe en esta imagen bitonal, a cada píxel se le asigna un
valor tonal, en este ejemplo 0 para el negro y 1 para el blanco.
7. La “digitalización” se encuentra definida en el
Acuerdo 27 de 2006 y en el protocolo para
digitalización de documentos con fines
probatorios
8. APLICACIONES Y USOS
La digitalización, se aplica a documentos de todo tipo, especialmente a los
voluminosos archivos históricos, comerciales, y de arte, cubriendo las
siguientes áreas:
9. Usos
• O.C.R. (reconocimiento óptico de caracteres).
• Lectura de marcas.
• Lectura de Códigos de Barra.
• Lectura por zonas.
• Generación de ficheros PDF, TIF, JPG, etc
Las imágenes digitalizadas:
• Pueden ser visualizadas en un monitor.
• Impresas sobre papel.
• Enviadas a terminales remotos mediante red interna o
externa.
• Enviadas por correo electrónico.
• Guardadas en su disco duro para utilizarlas en sus
informes o trabajos.
11. 1. Preparación
• Eliminación de sobres, extraer documentos de carpetas o fundas.
• Eliminación de grapas u otros elementos .
• Eliminar documentación que no sea necesaria.
• Clasificación por tipología documental.
2. Digitalización
Digitalización de los documentos, mediante escáneres
dependiendo de la necesidad del trabajo.
12. 3. Control de Calidad
En esta fase se realizan una serie de controles de calidad, habituales, entre
estos se encuentran:
• Control del número de documentos digitalizados.
• Verificación de la calidad de las imágenes.
• Proceso de centrado del documento escaneado.
• 4. Indexación de la documentación.
Verificación de la grabación Una vez realizada la grabación de
los datos del expediente para garantizar la calidad de los datos.
Se realizan procesos de verificación, que consiste en volver a
grabar los datos más importantes (índices) para que el sistema
compare y comprueba que la información grabada es
correcta.
13. 4. Respaldo - grabación de imágenes
Una vez realizada la digitalización, y en su caso la indexación, existen
posibilidades de almacenamiento:
• Discos compactos (CD).
• Magneto ópticos.
• DVD.
• Cintas.
• Discos duros externos. Etc.
14. Es indispensable definir previamente el nivel de seguridad y
el tipo de firma electrónica que se aceptará en la
digitalización de documentos, la cual deberá tener un nivel de
seguridad alto y, en algunos casos, una larga duración.
15. 3. ASPECTOS TECNICOS
La verificación de la calidad de las imágenes se hace mediante tres
operaciones:
• La toma de las imágenes
• Su mejoramiento
• La compresión y descompresión de los datos digitalizados.
Para obtener una buena calidad de la imagen se deben respetar cuatro
reglas:
1. El equipo (unidad de disco óptico y escáner) debe ser calibrado
correctamente de acuerdo con las instrucciones del productor y
ajustado de acuerdo con las necesidades del usuario.
16. • Clasificar los documentos originales de acuerdo con los problemas
de digitalización que se presenten.
• Efectuar una prueba con un muestreo de documentos antes de iniciar
la digitalización de todo un fondo documental.
• Obtener la autorización de la persona encargada del proyecto.
2. La densidad de la digitalización se da en función de la calidad de la
imagen y de la capacidad de almacenamiento que se desean. Se debe
tener en cuenta la capacidad de memoria de los discos ópticos.
17. 3. Para mejorar una imagen se puede utilizar un algoritmo que
limpia la imagen, suprimiendo los datos de una forma selectiva o
automática.
Para los documentos que tienen valor de prueba o valor científico-
cultural, se debe conservar siempre una imagen no retocada.
4. La compresión y la descompresión de los datos. La compresión
reduce enormemente el volumen de las imágenes digitalizadas por
medio de fórmulas matemáticas. Si se utiliza una fórmula comercial,
se debe obtener del proveedor un algoritmo de compresión y
descompresión sin pérdida de datos.
18. Parámetros de la imagen digital
Algunos de los factores que se debe tener en cuenta a la hora de elegir un
formato de archivo para visualización son los siguientes:
Resolución.
Calidad de imagen.
Cantidad de memoria que ocupa.
Nivel de compresión
19. Resolución
La resolución es la frecuencia espacial a la cual se realiza la muestra de
una imagen digital. La medida de la resolución se determina por el número
de píxeles leídos en una distancia lineal de una pulgada (2,54 cm) en el
documento digitalizado.
Las unidades mas utilizadas son “puntos por pulgada” - ppp - (dots per
inch - dpi -), o “píxeles por pulgada” - ppp - (pixels per inch - ppi -). Las
resoluciones de digitalización de documentos están normalmente en el
rango de 50 a 600 ppp.
.
.
Las mejoras en las imágenes
de mayor resolución son
apreciables
20. b) Dimensiones de la imagen
Son las medidas horizontales y verticales de la misma, expresadas en píxeles.
Pueden determinarse multiplicando tanto el ancho como la altura de la imagen
(medido en pulgadas) por la resolución en ppp.
Por ejemplo, una página A4 en blanco y negro, digitalizada a resolución de 300
ppp, tendrá una dimensión total de:
A4 = 21,0 cm x 29,7 cm
Ancho: 21,0 cm = 8,27” => 8,27” x 300 ppp = 2.500 píxeles
Alto: 29,7 cm = 11,69” => 11,69” x 300 ppp = 3.500 píxeles
Dimensión total A4: 2.500 x 3.500 = 8.750.000 pixeles
21. La profundidad de bits de una imagen digitalizada se
determina por la cantidad de bits utilizados para definir
cada píxel. Así pues, la profundidad se mide en bits/píxel.
Cuanto mayor sea la profundidad de bits, tanto mayor
será la cantidad de tonos que puedan ser representados.
Las imágenes digitales se pueden digitalizar en blanco y
negro (en forma bitonal), a escala de grises o a color.
Para impresión en color de alta calidad se utiliza una
profundidad de bits suficiente para conseguir la
reproducción cuatricromática. Los cuatro colores de
proceso (CMYK) de 8 bits cada uno, totalizan 32 bits de
profundidad: cian (Cian), magenta (Magenta)
Profundidad de bits
22. Rango dinámico
Rango dinámico es el rango de diferencia tonal entre la parte más clara
y la más oscura de una imagen.
Cuanto más alto sea el rango dinámico, se pueden potencialmente
representar más matices, a pesar de que el rango dinámico no se
correlaciona en forma automática con la cantidad de tonos
reproducidos.
23. Tamaño de archivo
El tamaño del archivo se calcula multiplicando el área de superficie
(ancho x alto) del documento a ser digitalizado (en pulgadas), por la
profundidad en bits (en bits/píxel) y por el cuadrado de la resolución
(en ppp2 ). Dado que el tamaño del archivo se representa en Bytes (8
bits), dividiremos el resultado para 8
Por ejemplo, para nuestra página A4 en blanco y negro, digitalizada a
resolución de 300 ppp, el tamaño de archivo será:
A4 = 8.750.000 pixeles / 8 (bits / Byte) = 1,1 MegaBytes
24. La compresión
Se utiliza para reducir el tamaño del archivo de imagen para su
almacenamiento, procesamiento y transmisión. El tamaño del archivo para las
imágenes digitales puede ser muy grande, complicando las capacidades
informáticas y de redes de muchos sistemas. Todas las técnicas de
compresión abrevian la cadena de código binario en una imagen sin comprimir,
mediante complejos algoritmos matemáticos.
Existen técnicas de compresión estándar y otras patentadas.
25. OCR (Optical Character Recognition)
Reconocimiento óptico de caracteres.
Permite reconocer caracteres tipográficos
de tipo alfanumérico durante un proceso
de escaneo y generar un fichero de texto
que posteriormente se pueda leer y
modificar si es necesario.
26. Formatos del archivo
Los formatos de archivo consisten tanto en la configuración de bits que
comprende la imagen como en la información del encabezamiento acerca de
cómo leer e interpretar el archivo. Los formatos de archivo varían en términos
de resolución, profundidad de bits, capacidades de color, y soporte para
compresión y metadatos.
Los principales formatos gráficos de imagen son:
• Bitmap (Windows Bitmap File) .bmp
Creado por Microsoft Windows Paint. Fichero
sin compresión, típicamente de 8 bits,
soportando paletas de hasta 24 bits.
27. • TIFF (Tagged Image File Format) .tif .tiff
Desarrollado por Aldus Corp. en 1986 para guardar imágenes desde
escáneres y tarjetas capturadoras de video. Posteriormente TIFF 5 y TIFF
6 asumen imágenes con escala de grises (4 u 8 bits) y paleta de colores
(normalmente 24 bits, ampliable hasta 64 bits). Se ha convertido en
un estándar de facto en los SGED.
GIF (Graphic Interchange Format) .gif
Fue desarrollado para el intercambio de imágenes en
Compuserve. Bitonal, escala de grises o color de 1 a 8 bits.
En la versión GIF 89a: carga progresiva, máscara de
Digitalización de documentos transparencia de 1 bit y
animación simple
28. JPEG (Join Photographic Expert Group) .jpeg .jpg
Diseñado por este grupo para la compresión de imágenes fotográficas.
Formato de 8 bits en escala de grises y 24 bits en color, con alta
compresión y pérdida variable. Estándar para la representación de
imágenes en color y grises (no adecuado para imágenes bitonales o con
pequeño número de colores).
JFIF (JPEG File Interchange Format) .jfif .jif
Presentada por C-Cube Microsystems. Formato de archivo que permite
que los flujos de datos JPEG sean intercambiados entre una amplia
variedad de plataformas y aplicaciones.
29. PDF (Portable Document Format) .pdf
Lenguaje descriptor de páginas desarrollado por Adobe Corp. que contiene las
capacidades gráficas de PostScript (menos flexible, pero más eficiente) y con
capacidades hipertextuales. Profundidad de bits variable (4 a 8 bits escala de
grises y hasta 64 bits color).
30. EQUIPOS TECNICOS PARA LA CAPTURA DE INFORMACIÓN
Para un proceso de digitalización se requieren los siguientes componentes:
• Computadores conectados en red.
• Dispositivos de adquisición de imágenes (escáner, cámaras,).
• Software para tratamiento, formateo y compresión de imágenes.
• Dispositivos de almacenamiento.
• Dispositivos de visualización e impresión.
Monitores, impresoras , etc.
31. ¿Cómo funciona un escáner?
El proceso de captación de una imagen
con un escáner dispuesto con sensores
CCD, es el siguiente:
Se ilumina la imagen a digitalizar con un
foco de luz; se conduce mediante espejos
la luz reflejada hacia los sensores CCD,
que transforman la luz en señales
eléctricas, y a continuación estas señales
eléctricas se transforman en formato
digital mediante un CAD (Conversor
Analógico Digital) y el caudal resultante
de bits se transmite al computador.
32. Para tener en cuenta:
La calidad de la imagen escaneada dependerá fundamentalmente del
número de CCD en línea de que disponga el escáner y de la calidad
de estos CCDs y CADs.
Los CCDs deben ser capaces de captar con fidelidad los colores de la
imagen y los CADs de aprovechar bien la señal eléctrica producida.
Cuando se está realizando una digitalización con un escáner, los
sensores CCDs se mueven a lo largo de la longitud de la página (o la
página se mueve sobre los CCDs) a una velocidad fija. La fuente de
luz del escáner, de intensidad constante, es una lámpara
fluorescente, normalmente de color rojo o verde, aunque a veces
puede ser blanca.
33. Tipos de scanner
1. Escáner plano o de sobremesa .
Es el mas utilizado, aunque no es
recomendable para grandes volúmenes de
documentos.
2. Escáner plano con alimentadora
Trabaja igual que el plano, pero la
diferencia es su rodillo de goma, que
arrastra las hojas hasta el cristal. Su
ventaja esta en que no hay que abrir
la tapa para cambiar la hoja, y
agilizando el trabajo
34. 3. Portátil
No lleva conexiones, solo una
batería y un puerto USB, con
escaneo a dos caras , exporta a
PDF. Resolucion hasta 600 ppp
4. De mano
De poca resolución ( hasta 400
ppp) y una corta area de
escaneado (9 x12 cms)
35. 5. Escáneres de libros y documentación histórica, A1 y A0
Tamaños A1 y A0
• Captura lineal
• Muy sofisticados y costosos.
Zeutschel OS 10000 A0
36. 6. Escáneres de libros y documentación histórica
• Escáneres tamaño (A3, A2)
• Captura lineal o matricial, dependiendo marcas y modelos
Sofisticados pero menos y menos costosos.
Copybook HD I2SBook2net - Microbox
38. CONCLUSIONES
Como profesionales de la información debemos conocer los procesos
y tecnologías disponibles para la digitalización, sus usos y
aplicaciones, claro esta considerando las metodologías archivísticas
para su organización.
El aprovechamiento de estas tecnologías para una buen sistema de
recuperación de la información, cumpliendo con la normatividad y
garantizando el valor de prueba de los documentos digitalizados.
La gran ventaja de la digitalización se resume en fácil acceso, no
manipulación de los originales lo que garantiza su conservación y
almacenamiento en poco espacio.
39. CYBERGRAFIA
• BIBLIOGRAFÍA CASANOVAS, Inés. Gestión de archivos electrónicos .
Buenos Aires : Alfagrama, 2007. 246 p. DATOS, INFORMACIÓN,
CONOCIMIENTO Y BIBLIOTECA : INSUMOS BÁSICOS DE LA
ACTIVIDAD ACADÉMICA. [en línea]. [consultado 3 de marzo. 2014].
Disponible en :
http :// evirtual.lasalle.edu.co/info_basica/nuevos/guia/GuiaClaseNo.1.pdf
• FERNÁNDEZ HEVIA, José María. Guía de la información electrónica :
cómo tratar los datos legibles por máquina y la documentación electrónica.
[en línea]. Luxemburgo : Comunidades Europeas, 2000. 60 p. Disponible en
: http :// www.cornu.eu.org/files/guidelines_ES.pdf
• http :// www.hisoft.com.mx/QueeslaDigitalizacion2.htm