Este documento describe la Web Semántica y sus componentes clave como RDF, SPARQL y OWL. También describe SemanticWebBuilder, una plataforma de código abierto desarrollada por INFOTEC para crear aplicaciones y portales semánticos. SemanticWebBuilder utiliza estándares semánticos web para integrar y exponer datos de manera que puedan ser procesados por máquinas y humanos.
4. ¿Quién es INFOTEC?
• Somos un Centro Público de Innovación y Desarrollo Tecnológico enfocado en
desarrollar soluciones, productos y servicios que apoyen a las organizaciones a
implementar TI’s en beneficio de sus estrategias y objetivos, a través de la creación y
aplicación de metodologías y tecnologías.
• Asimismo, contribuimos a que todos los actores de la sociedad comprendan y
aprovechen las Tecnologías de la Información con la finalidad de apoyar a la transición
del país hacia la Sociedad del Conocimiento.
• Impulsa el crecimiento de la industria nacional de las TIC y la creación de redes y
alianzas estratégicas que contribuyan a la transición de México hacia la Sociedad del
Conocimiento.
4
5. ¿Quién es INFOTEC?
Somos un Centro Público de Innovación y Desarrollo Tecnológico que contribuye a la competitividad del Gobierno y
de las PyMEs, a través del uso estratégico de Tecnologías de Información y Comunicaciones.
INFOTEC = I + D + DT x i
Estrategia basada en
Oferta Arquitecturas Empresariales
Investigación Aplicada y Bajo
Demanda
Formación de Capital Humano
Consultoría Estratégica
Sistemas de Información Estratégica
Administración Integral de
Infraestructura
7. Situación actual de la Web
La Web ha cambiado profundamente la forma en la que nos comunicamos,
hacemos negocios y realizamos nuestro trabajo
Beneficios:
• Tenemos acceso a millones de recursos de información
• Comunicación prácticamente con todo el mundo
• Comunicación en cualquier momento y a bajo costo
Oportunidades:
• Sobrecarga de información
• Ambigüedad y falta de precisión
• Heterogeneidad de fuentes de publicación
• Información no clasificada
• Problemas de interoperabilidad
8. La Web Semántica según Tim Berners Lee
Una web semántica es una red de
datos que pueden ser procesados
directa o indirectamente por
máquinas.
Es una web extendida que permitirá a
humanos y máquinas trabajar en
cooperación mutua.
9. Predicciones de Gartner
• En 2012 el 80% de los sitios web públicos usarán algún nivel de
hipertexto semántico para crear documentos de la Web Semántica
[…] el 15% de los sitios web públicos usarán ontologías basadas en
Web Semántica más amplias para crear bases de datos semánticas
• En el 2017 esperamos la visión de la Web Semántica […] la mayoría
de las páginas web están decoradas con alguna forma de hipertexto
semántico
Fuente: “Finding and exploiting value in semantic web technologies on the web”,
Informe de Investigación de Gartner, Mayo de 2007
10. Data Web
El primer paso hacia la Web Semántica es el nacimiento de la
Data Web, el objetivo es principalmente, hacer que los datos
estructurados sean accesibles utilizando RDF. El escenario de la
Web Semántica ampliará su alcance en tanto que los datos
estructurados e incluso, lo que tradicionalmente se ha
denominado contenido semi-estructurado (como páginas Web,
documentos, etc.), esté disponible en los formatos semánticos
de RDF y OWL
La Data Web permite un nuevo nivel de integración de datos y
aplicaciones interoperables, haciendo los datos tan accesibles y
enlazables como las páginas Web. La Data Web es el primer
paso hacia la completa Web Semántica.
12. ¿Cómo funciona?
Por ejemplo, si el usuario quisiera buscar todos los vuelos a Praga mañana
por la mañana, en la Web actual carente de Semántica, los resultados
serian inexactos como se muestran en la siguiente figura
13. ¿Cómo funciona?
En esta figura se muestra los resultados obtenidos a través de un
buscador semántico. Estos resultados ofrecen al usuario la información
exacta que estaba buscando.
14. Componentes de la Web Semántica
No se trata de una inteligencia artificial mágica que permita a las máquinas
entender las palabras de los usuarios, es sólo la habilidad de una máquina para
resolver problemas bien definidos, a través de operaciones bien definidas que
se llevarán a cabo sobre datos existentes bien definidos.
Para obtener esa adecuada
definición de los datos, la Web
Semántica utiliza esencialmente
RDF, SPARQL, y OWL, mecanismos
que ayudan a convertir la Web en
una infraestructura global en la que
es posible compartir, y reutilizar
datos y documentos entre
diferentes aplicaciones y usuarios.
15. ¿Qué es RDF?
RDF (Resource Description Framework) es un modelo de datos que representa
recursos y las relaciones que se puedan establecer entre ellos.
El elemento de construcción básica en RDF es el “triple” o sentencia, que
consiste en dos nodos (sujeto y objeto) unidos por un arco (predicado), donde los
nodos representan recursos, y los arcos propiedades.
Triple:
Sujeto – Propiedad – Objeto
16. ¿Qué es SPARQL?
SPARQL es lenguaje de consulta sobre RDF, que permite hacer búsquedas
sobre los recursos de la Web Semántica utilizando distintas fuentes datos.
17. ¿Qué es OWL?
OWL (Ontology Web Language) es un mecanismo para desarrollar temas o
vocabularios específicos en los cuales asociar los recursos. Lo que hace OWL es
proporcionar un lenguaje para definir ontologías estructuradas que pueden ser
utilizadas a través de diferentes sistemas. Las ontologías incluyen definiciones de
conceptos básicos en un campo determinado y la relación entre ellos.
Específicamente OWL es un vocabulario para describir las propiedades y las clases
de los recursos RDF, ya que permite establecer jerarquías de generalización entre
dichas propiedades y clases, además de describir relaciones entre clases como
disyunción, cardinalidad (por ejemplo "únicamente uno"), igualdad, tipologías de
propiedades más complejas, caracterización de propiedades (por ejemplo
simetría) o clases enumeradas.
20. SemanticWebBuilder como Código Abierto
En INFOTEC por su naturaleza como Centro de Investigación y Desarrollo
Tecnológico del CONACYT y buscando como principal objetivo el apoyo a la
comunidad más que el beneficio económico, se tomo la decisión de liberar el
producto bajo un esquema de código abierto con la finalidad de:
– Apoyar al crecimiento de la industria de TI en el país
– Abrir una oportunidad de negocia a la iniciativa privada
– Buscar el apoyo de la comunidad para crecer y evolucionar la herramienta
– Incrementar el potencial de penetración en el mercado
Esta decisión esta encaminada a brindar a la sociedad en general la
oportunidad de contar con herramientas que le permitan el desarrollo de
nuevas oportunidades de negocio en distintos ámbitos.
21. ¿Qué es SemanticWebBuilder?
SemanticWebBuilder es
una plataforma para el
desarrollo de aplicaciones
y portales semánticos.
22. ¿Qué es SemanticWebBuilder?
El SemanticWebBuilder esta conformado por una
suite de herramientas que permitirá la evolución de
los sitios Web convencionales (sin significado), hacia
los portales que cumplan con la visión de la Web
Semántica (con significado), permitiendo exponer en
formatos estándar como RDF todo el conocimiento
generado, además de contar con un Modelo
(Ontología) que permita el intercambio de esta
información entre los diferentes sistemas.
24. SemanticWebBuilder Suite
Las herramientas que integran la suite del SemanticWebBuilder son:
SemWB Portal
• Servidor de Portales
• Administración de contenidos
• Administración de contextos de información
• Administración de Usuarios
SemWB Platform
• Plataforma Semántica
• Punto de acceso para consultas semánticas (SPARQL)
• Integración de Información (Fuentes externas)
• Persistencia de Datos (RDF)
• Generación de código basado en ontologías
SemWB Ontology Editor (Solo de consulta, por el momento)
• Modelado de Información (Definir significado)
• Editor de Ontologías (OWL)
25. SemanticWebBuilder Platform
SemWB Platform es el núcleo de la suite de herramientas, y es el
principal componente de la plataforma para la construcción de
modelos semánticos como base para la definición de una ontología
general, la cual sirva de referencia para la creación acelerada de
aplicaciones semánticas (nuevos productos).
Esta plataforma permite definir en una ontología (OWL), la
estructura de información, la arquitectura de objetos, sus
dependencias y su representación gráfica, de forma que mediante
estos elementos se pueda ejecutar un proceso automatizado que
genera el código del modelo de objetos definido y su persistencia
en una base de datos semántica (basada en RDF).
26. ¿Que hace el SemanticWebBuilder ?
SemanticWebBuilder se enfoca en la representación del conocimiento de las
organizaciones, mediante la identificación de la semántica de la información a publicar,
permitiéndonos:
• Definir una arquitectura de información del portal (mediante un modelo ontológico)
• Integrar información de diferentes fuentes por medio de componentes pre-
construidos
• Filtrar la información de acuerdo al perfil del usuario y a reglas de negocios
• Definir la interfaz gráfica para la entrega de información de acurdo a dispositivos e
idioma del usuario.
• Almacenar la información en base de datos semánticas (RDF)
• Exponer la información para su consulta por sistemas externos (WS, SPARQL)
• Incorporar funcionalidades adicionales por medio de componentes de terceros
(JSR168, JSR286, Google Gadgets) o bien utilizando el API del SWB.
• Creación acelerada componentes basados en modelos ontológicos.
27. Beneficios
• Integrar toda la información generada por la organización en un solo
modelo de datos semántico.
• Exponer la información de la organización de forma segura e integrada.
• Reduce los problemas de interoperabilidad usando estándares como RDF y
OWL para el intercambio de información, entre aplicaciones de
tecnologías diversas.
• Obtención de resultados mas precisos en las búsquedas de información
• Descentralización de la función de publicación de contenidos para que las
propias áreas proveedoras de información puedan publicar y actualizar.
• Incluir en un solo espacio de trabajo a todos los diferentes perfiles y roles
que intervienen en la construcción y mantenimiento del Portal, lo cual
permite responder rápidamente a las necesidades de generación y
publicación de información.
28. Beneficios (Continuación)
• Publicación de los contenidos en el portal, únicamente por usuarios y/o
roles autorizados a través de los flujos de publicación.
• Construcción de un portal que permita una mejor comunicación con los
diversos usuarios de acuerdo a sus perfiles y contextos (ciudadanos,
legisladores, funcionarios públicos, empleados, prensa, etc.).
• Consistencia en términos del diseño de las páginas del portal.
• Reducción del costo de propiedad de la tecnología, debido a que
SemanticWebBuilder se encuentra desarrollado bajo estándares abiertos
que permiten la comunicación e integración con productos y tecnologías de
terceros.
• Revisión y monitoreo permanentemente del comportamiento de los accesos
al portal, como insumo para el diseño de estrategias de promoción y
comunicación.
29. Características tecnológicas
Estándares Lenguajes de desarrollo
• RDF, RDFS • Java JEE (servidor)
• OWL • .Net Framework 3.5 (cliente office)
• SPARQL
• HTML Persistencia Semántica
• XHTML • Memoria
• XML • Sistema de archivos
• JSR 168: Portlet Specification • Base de Datos Relacional (HSQLDB,
MySQL, PostgreSQL, Derby, Oracle,
• JSR 170: Content Repository for JavaTM
Microsoft SQL Server)
technology API
• Base de Datos RDF Nativas (Virtuoso,
• JSR 286: Portlet Specification 2.0
Oracle 11g RDF, Allegro Graph)
• JSR-223: Script engines for many
languages
Otras tecnologías
• WSRP (Web Services for Remote Portlets)
• Dojo
• JAAS
• Jena, ARQ
• LDAP v3 (cliente)
• Java script
• XMLRPC
• Ajax
30. Funcionalidades
• Administración de múltiples portales
• Intranet, Internet, pagina corporativa, Esquema ASP
• Administración de idiomas y dispositivos de presentación
• Administración de secciones (páginas)
• Navegación basado en la Red Semántica, Control de seguridad y personalización
• Administración de contenidos, mediante repositorios y catálogos de documentos
• Flujos de publicación de contenidos
• Publicación de contenidos vía Web
• Publicación de contenidos por medio de Microsoft Office y Open Office
• Administración de Usuarios:
• Manejo de múltiples repositorios de usuarios
• Clasificación Jerárquica de Roles, Grupos
• Atributos registro de usuario configurables
31. Funcionalidades (continuación)
• Administración de plantillas
• Basadas en HTML (con la posibilidad de incorporar scripts JSP, PHP, Groovy)
• Amplia gama de componentes existentes
• Contenidos remotos, repositorios de documentos, foro, encuestas, publicación
RSS, blogs, wikis, etc.
• Administración de componentes por:
• Reglas, roles, grupos de usuario, tipo de usuarios, calendarización, filtrado,
prioridad, número de apariciones, número de votos, idioma y dispositivo.
• API para crecer la funcionalidad de la Herramienta
• Basado en componentes
• Todos los componentes heredan la funcionalidad básica de la plataforma
• Soporte a estándar JSR168, JSR 268, Google Gadgets, WSRP
• Soporte a lenguajes basados en Scripts
• PHP, Phyton, Groovy
32. Funcionalidades (continuación)
• Relación Contextual de la información:
• Uso de tecnología semántica (RDF) para: Definir la arquitectura de
información del sitio y crear contextos de información alrededor de un tema.
• Administración Personalizable
• Posibilidad de filtrar elementos para diferentes usuarios
• Posibilidad de modificar la administración de SWB para agregar funcionalidad
especifica de la empresa
• Facilidad de modificar la funcionalidad de SWB mediante la extensión de la
ontología básica del producto.
• Reportes
• De accesos, idiomas, dispositivos, sesiones, componentes, contenidos, etc.
• Posibilidad de generar reportes específicos configurables (Reporteador)
• Exportación de reportes a distintos formatos para análisis personalizados.
• Posibilidad de integración de seguimiento externo como puede ser Google
Analytics
33. Funcionalidades (continuación)
• Escalabilidad y Rendimiento
Soporte a Balanceo de cargas y manejo interno de cache de contenidos y
componentes
• Monitoreo
De accesos, memoria, conexiones a DB, usuarios, componentes, errores, etc.
• Almacenamiento de Información en RDF sobre:
– Memoria
– Sistema de archivos
– Base de Datos Relacional (HSQLDB, MySQL, PostgreSQL, Derby, Oracle,
Microsoft SQL Server)
– Base de Datos RDF Nativas (Virtuoso, Oracle 11g RDF, Allegro Graph)
• Integración de Modelos semánticos remotos
– Otros sitios desarrollados sobre SWB
– DBPedia
34. ¿Que queremos lograr?
Se espera que el SemanticWebBuilder permita la creación de
nuevas aplicaciones con un enfoque al uso de conceptos
semánticos asociados con la Web 3.0, y con ello ser una fuente
de inspiración para otras empresas o instituciones en la
aplicación de conceptos semánticos en sus sistemas, e impulsar
el desarrollo y la investigación aplicada a nuevas soluciones.