Este documento presenta los resultados de un taller realizado por estudiantes del Programa de Sistemas de Información, Bibliotecología y Archivística de la Universidad de La Salle. El taller se enfocó en definir y explicar con ejemplos conceptos clave relacionados con datos como Big Data, Linked Data, Open Data y RDF. Adicionalmente, los estudiantes discutieron cómo estos conceptos se relacionan con su profesión y proveen un ejemplo de datos abiertos del sitio Data.gov.co.
1. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
TALLER 2
JUGANDO CON LA DATA
ZULLY YOLIMA RIVERA
YERALDIN MORALES
OSCAR EDUARDO TRIVIÑO
UNIVERSIDAD DE LA SALLE
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
SISTEMAS DE INFORMACIÓN Y DOCUMENTACIÓN: BIBLIOTECOLOGÍA Y
ARCHIVÍSTICA
BASES DE DATOS DOCUMENTALES
2013
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
2. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
Actividad:
A partir de las lecturas, discutir en grupo los siguientes conceptos y entre
todos lograr definirlos claramente con sus propias palabras, se debe agregar
un ejemplo por cada concepto y explicarlo detalladamente:
o BIG DATA
Tiene que ver con el tratamiento y análisis que se le da a los datos
en grandes cantidades, ya que las herramientas habituales para el
análisis de información no logran hacerlo, es por esta razón que
acudimos a la indización masiva de información en la web, de una
forma coherente y organizada para su consulta, de esta manera fue
que se dio la necesidad de crear maquinas enormes, ya que el
manejo de petabytes, exabytes, o zetabytes, requieren tratamientos
específicos por sus necesidades tanto de almacenamiento, como de
procesamiento y visualización.
LAS REDES SOCIALES Y EL USO DE LOS DISPOSITIVOS
ELECTRONICOS SON ALGUNOS EJEMPLOS DE LO QUE SE PODRIA
MANEJAR CON BIG DATA.
GENERAN VOLUMEN DE
CRECIMIENTO DE DATOS EN LAS
BIG DATA TRANSACCIONES
EXPLOSION DE NUEVOS
TIPOS DE DATOS
BIG DATA (MAYORES
VOLÚMENES, MAYOR
VARIEDAD Y MÁS
VELOCIDAD
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
3. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
El entorno del Big Data rebosa de oportunidades para conseguir un gran impacto en el
negocio y dejar atrás a la competencia. La última versión de la Plataforma de Informática
se ha diseñado específicamente para afrontar los retos y las oportunidades del Big Data. Si
está listo para hacer realidad la promesa del Big Data, obtenga más información sobre
Informática 9.5.1
o LINKED DATA
Son datos vinculados con la web semántica, interconectados y distribuidos en la
web, basados en la aplicación de principios necesarios para fomentar el
crecimiento de la misma.
A diferencia de la web de hipertextos que se relacionan entre puntos del contenido
del documento en HTML, los linken data, se enlazan cosas descritas en RDF.
o OPEN DATA
Los datos abiertos son datos cuya principal característica consiste en que dichos datos
pueden ser utilizados, reutilizados y/o distribuidos por cualquier persona, adicionalmente,
se encuentran sujetos a ser elaborados bajo términos para la reutilización o para ser
integrados con otro conjunto de datos.
1
BIG DATA. Termino de Búsqueda ejemplos Big data. Disponible en: http://www.informatica.com/la/vision/harnessing-big-data/
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
4. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
o RDF
Es actualmente uno de los vocabularios de xml, que permite el intercambio de
datos en la web. Se manifiesta con la propuesta de ser un habilitador de la web
semántica, es decir, el enlace de datos estructurados por medio de un estándar
universal para los metadatos en la web.
Identificar la relación que tiene cada uno de estos conceptos con su
profesión y su entorno de trabajo. (Colocar ideas en varios párrafos con
viñetas).
BIG DATA: Uno de los ejemplos para este aspecto son los software
utilizados para la creación de las nóminas de las entidades, ya que en ellos
se hace ingreso neto de datos como: provisiones, ingreso de novedades,
horas extras, plantillas, desprendibles de pago, liquidaciones.
LINKED DATA: en el caso de la biblioteca el servicio de bases de datos,
permite la recolección de información mediante búsquedas semánticas.
OPEN DATA: la publicación en la intranet, de herramientas que permiten
dar a conocer, ya sea una nueva estructura orgánica, un nuevo
procedimiento a seguir, un cambio de versiones y/o actualizaciones de
información que las personas deben conocer, es así, como en el caso de la
publicación de las estructuras orgánicas al interior de la entidad se puede
llegar a dar la reutilización o distribución para dar a conocer cambios
internos.
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
5. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
Ejemplo: una nueva dependencia, supresión de un área, actualización de
información permanente para que la organización conozca y difunda los cambios
realizados.
Buscar un ejemplo que se encuentre en el sitio (http://datos.gov.co/),
descargarlo, entenderlo colectivamente y explicarlo.
EJEMPLO OPEN DATA
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
6. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
PERMITE
ACCEDER A LOS
DATOS
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
7. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
DATOS
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
8. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
RDF
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
9. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
http://www.w3c.es/Divulgacion/GuiasBreves/LinkedData
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
10. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
Buscar un ejemplo que se encuentre en el sitio (http://datos.gov.co/),
descargarlo, entenderlo colectivamente y explicarlo.
Este documento construido bajo las características de un documento XML está compuesto
en primer lugar por un prólogo que permite identificar la versión XML, adicionalmente,
presenta la plantilla o schemas del documento entre otros elementos propios del prólogo.
feedxml:base="http://ogdidscolombia.cloudapp.net/v1/colpensiones/"
xmlns:d="http://schemas.microsoft.com/ado/2007/08/dataservices"
xmlns:m="http://schemas.microsoft.com/ado/2007/08/dataservices/metadata"
xmlns="http://www.w3.org/2005/Atom">
En segundo lugar, y siguiendo la estructura de los documentos XLM, contiene un cuerpo
que representa la distribución jerárquica de la información incluida en el documento, cada
una de sus categorías o divisiones contienen un nombre, autor, contenidos y atributos de
cada una de las divisiones o vínculos
<author>
<name />
</author>
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.
11. Universidad De La Salle
Facultad de Ciencias Económicas y Sociales
Programa Sistemas de Información, Bibliotecología y Archivística
<link rel="edit" title="Informe23F205"
href="Informe23F205(PartitionKey='13bc5000-0ece-451e-86b9-
4d64171bdd87',RowKey='d67dfbb2-a770-4ce9-916f-f47bde2a9517')" />
<category term="OGDI.colpensiones.Informe23F205Item"
scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme" />
<content type="application/xml">
<m:properties>
<d:PartitionKey>13bc5000-0ece-451e-86b9-
4d64171bdd87</d:PartitionKey>
<d:RowKey>d67dfbb2-a770-4ce9-916f-f47bde2a9517</d:RowKey>
<d:Timestamp m:type="Edm.DateTime">2013-01-
28T22:04:39.1787941Z</d:Timestamp>
<d:entityid m:type="Edm.Guid">13bc5000-0ece-451e-86b9-
4d64171bdd87</d:entityid>
<d:consecutivo>103</d:consecutivo>
<d:tipo_de_registro>4</d:tipo_de_registro>
<d:codigo_del_formato>205</d:codigo_del_formato>
<d:codigo_de_la_columna>5</d:codigo_de_la_columna>
<d:codigo_de_la_unidad_de_captura>2</d:codigo_de_la_unidad_de_captura>
<d:codigo_de_la_subcuenta>5</d:codigo_de_la_subcuenta>
<d:signo>+</d:signo>
<d:valor>21451</d:valor>
Zully Yolima Rivera, Yeraldin Morales, Oscar Triviño.