Presentación elaborada para mi intervención en el Webinar de Digitalización y Captura de documentos en gestión documental del próximo 1 de julio de 2014 con Tecnowebinars.
2. Digitalización vs Captura documental
Definiciones previas
Digitalización: Acto o acción de digitalizar documentos mediante el uso de escáneres u
otro tipo de hardware.
Captura documental: Incluye la digitalización de documentos e implica procesos
inteligentes de extracción de metadatos y de clasificación de documentos en el sistema.
Digitalizar documentos no va más allá en la práctica
que el hecho de subirlos a un sistema de
almacenamiento y dejarlos ahí sin que ello implique por
defecto una organización inteligente que facilite su
posterior localización.
3. Conversión de la documentación en papel a su equivalente en registros digitales (oficina
sin papeles).
Ahorro de costes de almacenamiento físico.
Ofrece garantías de preservación a largo plazo por medios digitales.
Accesibilidad universal a la documentación corporativa sin depender de
plataformas tecnológicas (ordenador, smartphone, tablets, etc).
Digitalización vs Captura documental
Aspectos comunes
4. Digitalización: Almacenamiento de documentos escaneados en una base de datos.
Procesos corporativos de gestión documental: Requiere que la Digitalización vaya
acompañada de acciones que permitan la localización posterior de los documentos en
el sistema y la recuperación de la información que contienen para ser empleada como
base en el desarrollo de otras ideas de negocio y en la resolución de proyectos de la
empresa.
Digitalización vs Captura documental
Digitalización vs Gestión documental
5. Digitalización vs Captura documental
Integración Digitalización y Gestión documental
Unir la digitalización a un sistema de gestión documental inteligente que abarque la
creación de registros digitales a partir de la documentación original en papel, y
posteriormente permita establecer rutinas de autoclasificación de documentos y de
extracción de metadatos . Con el objetivo de garantizar la máxima accesibilidad a la
documentación en cualquier momento del futuro.
La integración anteriormente descrita se identificaría más propiamente con el término
CAPTURA DOCUMENTAL, la cual es la primera de las fases del CICLO DE VIDA DE LOS
DOCUMENTOS, que constituye la base de la evolución actual de la gestión documental
corporativa, denominada GESTIÓN DE CONTENIDOS EMPRESARIALES (ECM).
7. Digitalización vs Captura documental
Captura inteligente de documentos
Autoclasificación de documentos
Extracción automática de metadatos
Hot Folder: Conectar el sistema con una carpeta local y esta con el escáner. Cada vez
que el escáner incluya un documento en esta carpeta, el sistema tendrá la capacidad de
procesarlo sin necesidad de intervención humana.
Escanear los documentos en forma de lotes y dejar que el sistema los separe
individualmente por diversos métodos.
Un conjunto de tecnologías que permiten a un sistema
de gestión documental automatizar los procesos de
clasificación y extracción de metadatos de documentos
subidos al sistema mediante digitalización.
9. Mecanismo de inteligencia en captura documental
Definición previa de modelo documental: Previamente a la captura masiva de
documentos, un operario humano digitalizará un tipo documental, el cual empleará para
informar al sistema de las características físicas y las expresiones específicas de dicho tipo
documental. A partir de la creación del tipo documental, el sistema actuará de forma
automatizada en lo que se refiere a la clasificación documental y la extracción de
metadatos.
Tecnologías de captura inteligente
10. Captura inteligente de documentos
Tecnologías semánticas.
Tecnologías de reconocimiento óptico de caracteres (OCR) y similares.
Tecnologías de autodetección (códigos de barras).
Tecnologías de captura inteligente
11. Tecnologías de captura inteligente
Reconocimiento óptico de caracteres (OCR)
Convertir un documento-imagen digitalizado en un documento-texto.
Autoclasificación documental: Identificación de tipos documentales que se incluyen en
el sistema mediante comparativa de “expresiones regulares” que contienen.
Extracción de metadatos: Extracción de información útil de los documentos una vez
son digitalizados que puede ser procesada informáticamente.
12. Tecnologías de captura inteligente
Tecnologías complementarias a OCR
ICR: tecnología con la que los escáneres y sistemas de imágenes pueden convertir
caracteres en letra manuscrita en caracteres capaces de ser interpretados o reconocidos
por un ordenador.
13. Tecnologías de captura inteligente
Tecnologías complementarias a OCR
OMR: reconocimiento de marcas ópticas como las que se emplean en un cuestionario
de respuesta múltiple. Procesamiento del tipo documental de las encuestas. Para aplicar
esta tecnología se emplea un tipo de escáner que tiene capacidad para reconocer la
existencia o no de una marca óptica, mientras que no procesa ni la letra manuscrita ni las
imágenes de los formularios.
14. Tecnologías de captura inteligente
Códigos de barras
Forma de captura de datos a través de escáneres o lectores ópticos que captan
imágenes representadas a partir de combinaciones de líneas y espacios paralelos de
distinto grosor y espaciado que contienen una determinada información.
Tipología actual
Lineales de una dimensión
Bidimensionales
QR
PDF-417, variante del código de barras de dos dimensiones
19. Tecnologías de captura inteligente
Captura semántica y data mining
Su utilización requiere que previamente sea definido un modelo documental en el
sistema para compararlo con los documentos del mismo tipo que sean subidos
posteriormente al sistema.
Criterios de color, brillo y saturación de los documentos (apariencia física) cxon
tecnologías como histograma y redes neuronales para que el sistema identifique patrones
de color o características físicas de los documentos. Para que resulte efectiva el sistema
deberá incluir desde el momento de la digitalización mecanismos de mejora y corrección
de imagen como rotación; binarización; umbral dinámico; recorte de bordes; inversión; y
suavización de ruido.
Expresiones características de un tipo documental: criterio para clasificar documentos
que se apoya especialmente en la tecnología OCR.
Análisis del texto de los documentos mediante técnicas de data mining como árboles
de decisión, Support Vector Machines, algoritmos Bayesianos o técnicas de “el vecino más
cercano”, etc., para definir esquemas de clasificación de documentos según las palabras
que aparecen en ellos.
21. Proyectos de captura de documentos
Análisis previo de la documentación a tratar y de su contexto: establecer la
metodología más adecuada de captura.
Planificación: fase clave de la que dependerá el resto de fases del proyecto. Se irá
adaptando a las necesidades del proyecto.
Identificar y analizar las necesidades de la organización respecto a su
documentación.
Conocer procesos que actualmente utiliza la organización para gestionar la
documentación.
Identificar y definir en detalle los tipos documentales.
Determinar metas y objetivos que se pretenden conseguir y los medios para
conseguirlos.
Viabilidad: análisis de la viabilidad de los objetivos y metas perseguidos y los planes de
actuación respecto a los medios (económicos, técnicos y humanos…) con los que cuenta la
organización. La organización decidirá si realiza el proyecto con personal y medios propios
o mediante outsourcing.
22. Proyectos de captura de documentos
Diseño: representación de forma diagramada los distintos procesos que se van a llevar
a cabo a lo largo de la ejecución del sistema de captura masiva.
Procesos: recepción de la documentación, manipulación, expurgo, digitalización,
captura de datos, integración en el Sistema de Gestión Documental, volcado de la
información, copias de seguridad y control de calidad en los distintos procesos.
Fase muy productiva: el momento de diseñar los procesos es el idóneo para
optimizar y rediseñar algunos de los procesos previos ya existentes en relación al
manejo de la documentación.
Fase previa de pruebas: Previo a la puesta en marcha de un proyecto, se pone en
práctica el mismo en modo de pruebas para comprobar que realmente funciona como
habíamos proyectado. Se probaran en lo posible todas las fases y procesos previstos en el
diseño desde la recepción de la documentación hasta su posterior consulta digital a través
de la plataforma informática. La duración de esta fase será proporcional a la magnitud del
proyecto.
23. ¡GRACIAS POR VUESTRA ATENCIÓN!
http://twitter.com/amaciasalegre
http://es.linkedin.com/in/adrianmaciasalegre
amaciasalegre@dokumentalistas.com
http://www.dokumentalistas.com
http://www.adrianmacias.es
http://www.slideshare.net/adrianmacias/
Seguridad en Gestión Documental: Datos personales e ISO 27001
15 de Julio de 2014 – 17 a 18 horas
http://www.tecnowebinars.com/webinar/920/seguridad-en-
gestion-documental-datos-personales-e-iso-27001/dokumentalistas
PRÓXIMO WEBINAR