A Web Semântica vem como "carro chefe" da terceira grande onda da Web, que traz também consigo novidades como Cloud Computing, Ubiquidade e RTWApps. Esta palestra mostra o esforço tecnológico que vem sendo feito no desenvolvimento da plataforma para a mesma, as possibilidades de aplicações que se abririam, as dificuldades de sua implantação e os próximo passo em sua direção: um movimento social "open-data".
1. Um papo sobre
Web Semântica
Eduardo Nicola F. Zagari
zagari em abril com br
NIH - Núcleo de Engenharia e Pesquisa
Abril Digital
São Paulo, 09/11/2009
Monday, November 9, 2009
2. Sumário
Apresentação do NIH
Introdução
Abordagens
Aplicações
Tecnologias para Anotação de Conteúdo: RDF,
Microformatos, RDFa, OWL, SPARQL
NLP e Extração de Entidades
Considerações Finais
Eduardo Nicola Zagari
Monday, November 9, 2009
3. NIH
• Monitorar de forma sistemática novas
técnicas, linguagens, interfaces, arcabouços e
sistemas computacionais utilizados na Web que
possam ser implantados em nossos produtos;
• Desenvolver Novos Serviços de Inteligência
Computacional, de Infraestrutura de Backend
e de Interfaces Visuais para nossos produtos;
• Investigar novas soluções algorítmicas,
técnicas e de interfaces para problemas das
novas features, proposta, prototipação e
avaliação das mesmas e
• Disseminar dentro da ABD os conhecimentos
adquiridos na área, através de Tech Talks e/ou
treinamentos.
Eduardo Nicola Zagari
Monday, November 9, 2009
4. NIH
Bibliotecas compartilhadas por serviços
(Runner, HTMLParsing, Instrumentation, Stats
etc)
Flash Cassino, Veja Lua, Handler-Uploader de
Imagens
Classificador Automático
Super Robot
NER, Visualização de Grandes Massas de
Dados
Eduardo Nicola Zagari
Monday, November 9, 2009
5. NIH
Definição na Wikipedia:
a term used to describe
persistent social, corporate
or institutional culture that
avoids using or buying
already existing products,
research or knowledge
because of its different
origins. It is normally used
in a pejorative sense.
a term and label developed
in the computer industry
referring to organizations
incapable of using
technology from other
organizations.
Eduardo Nicola Zagari
Monday, November 9, 2009
6. Introdução
No começo, existia a Web e as pessoas
gostavam de surfar por suas páginas, trocar
e-mails, fazer programas para suas
empresas... A vida era boa...
Só que um dia, as “pessoas” começaram a
gostar tanto dela, que resolveram usar seu
conteúdo de novas formas...
Mas a Web foi feita para compartilhar
documentos e não os dados internos de suas
páginas... E estas “pessoas” ficaram tristes...
Aí surge a Web Semântica... e “elas” voltarão
a ser felizes em breve! :-)
Eduardo Nicola Zagari
Monday, November 9, 2009
7. Web Semântica
Eduardo Nicola Zagari
Monday, November 9, 2009
8. Web Semântica
Múltiplas faces:
Eduardo Nicola Zagari
Monday, November 9, 2009
9. Web Semântica
Múltiplas faces:
uma plataforma tecnológica de metadados da
Web
Eduardo Nicola Zagari
Monday, November 9, 2009
10. (Plataforma Tecnológica)
Computadores devem estar aptos a saber:
o que uma determinada requisição
significa;
sobre o que são dados e documentos
particulares;
o relacionamento entre tudo isto.
Eduardo Nicola Zagari
Monday, November 9, 2009
11. (Evolução das Aplicações)
Processamento de Dados
Processamento de Informação
Processamento de Conhecimento
Processamento Inteligente
inteligência
conhecimento
informação
dados
Eduardo Nicola Zagari
Monday, November 9, 2009
12. Web Semântica
Eduardo Nicola Zagari
Monday, November 9, 2009
13. Web Semântica
Múltiplas faces:
Eduardo Nicola Zagari
Monday, November 9, 2009
14. Web Semântica
Múltiplas faces:
uma plataforma tecnológica de metadados da
Web
Eduardo Nicola Zagari
Monday, November 9, 2009
15. Web Semântica
Múltiplas faces:
uma plataforma tecnológica de metadados da
Web
um movimento social de “abertura de
dados” (open-source data)
Eduardo Nicola Zagari
Monday, November 9, 2009
16. Web Semântica
Múltiplas faces:
uma plataforma tecnológica de metadados da
Web
um movimento social de “abertura de
dados” (open-source data)
uma nova encarnação da Inteligência Artificial
clássica
Eduardo Nicola Zagari
Monday, November 9, 2009
17. (Web Semântica e
Inteligência Artificial)
Segundo Sir Tim Beners-Lee:
Habilidade da máquina de resolver
problemas ‘bem definidos’, realizando
operações ‘bem definidas’ em dados
existentes ‘bem definidos’
mas...
Eduardo Nicola Zagari
Monday, November 9, 2009
18. (Inteligência Artificial)
Alan Turing, 1956
IA Forte e IA Fraca
Sistemas Especialistas, Redes Neuronais,
Lógica Fuzzy
Inverno da IA - Aprendizado de Máquinas,
Robótica, Visão Computacional
Algoritmos Genéticos, Computação Bio-
inspirada
Eduardo Nicola Zagari
Monday, November 9, 2009
19. Web Semântica
Um passo além da onda iniciada em 2004, a
Web Colaborativa (Web 2.0)
Web 3.0 ?
Web Semântica, Cloud Computing,
Ubiqüidade, WRTAp
Eduardo Nicola Zagari
Monday, November 9, 2009
20. As 3 ondas da Web
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
21. As 3 ondas da Web
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
22. As 3 ondas da Web
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
23. As 3 ondas da Web
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
24. As 3 ondas da Web
r
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
25. As 3 ondas da Web
rw
r
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
26. As 3 ondas da Web
rwx
rw
r
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
27. As 3 ondas da Web
rwx
rw
r
tec.
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
28. As 3 ondas da Web
rwx
rw
r
soc.
tec.
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
29. As 3 ondas da Web
rwx
rw
r tec + soc
soc.
tec.
Fonte: Semantic Web
de Jeffrey Pollockext
Eduardo Nicola Zagari
Monday, November 9, 2009
30. Web Semântica
Com os computadores
entendendo os conteúdos, eles
teoricamente estarão aptos a
resolver problemas que hoje
estão fora de alcance
Eduardo Nicola Zagari
Monday, November 9, 2009
31. Web Semântica Com os computadores
entendendo os conteúdos, eles
teoricamente estarão aptos a
resolver problemas que hoje
estão fora de alcance
Objetivo:
Interligar conteúdos publicados na Web
A associação deve ser perceptível tanto
pelo homem (manualmente) como pela
máquina (automática)
Eduardo Nicola Zagari
Monday, November 9, 2009
32. Web Semântica Com os computadores
entendendo os conteúdos, eles
teoricamente estarão aptos a
resolver problemas que hoje
estão fora de alcance
Objetivo:
Interligar conteúdos publicados na Web
A associação deve ser perceptível tanto
pelo homem (manualmente) como pela
máquina (automática)
Problema:
Atribuição de significado (sentido) aos
conteúdos...
Eduardo Nicola Zagari
Monday, November 9, 2009
33. Abordagens
Bottom-up (Clássica):
Anotação de informação nas páginas,
usando RDF, para que seja “legível” por
máquinas
Top-down (Conhecimento semântico vertical):
Alavancagem de informações em páginas
web já existentes, como estão, para
extrair significado automaticamente
reconhecimento de nomes e verbos
cotidianos
Eduardo Nicola Zagari
Monday, November 9, 2009
34. Aplicações
Desktop Web Semântico (Browsers (Glue),
Emails, Gerenciador de Janelas)
Blogging Semântico (Zemanta)
Wikis Semânticas
Máquinas de Busca Semânticas
Redes Sociais Semânticas
Eduardo Nicola Zagari
Monday, November 9, 2009
35. Yahoo!
Search
Eduardo Nicola Zagari
Monday, November 9, 2009
36. ZoomInfo
Construção
de perfil
através da
associação
de dados
de
diferentes
fontes
Eduardo Nicola Zagari
Monday, November 9, 2009
37. TripIt
Agregad
or de
Viagens
Eduardo Nicola Zagari
Monday, November 9, 2009
38. Dapper
adição
de
anotação
semântic
a em
páginas
Eduardo Nicola Zagari
Monday, November 9, 2009
39. Tecnologias de Anotação
RDF - Resource Description Framework
RDFa e Microformatos
SPARQL
OWL
Eduardo Nicola Zagari
Monday, November 9, 2009
40. RDF
Eduardo Nicola Zagari
Monday, November 9, 2009
41. RDF
Linguagem usada para descrever dados,
metadados e até mesmo outras linguagens de
dados
Eduardo Nicola Zagari
Monday, November 9, 2009
42. RDF
Linguagem usada para descrever dados,
metadados e até mesmo outras linguagens de
dados
Formato de grafo de dados
Eduardo Nicola Zagari
Monday, November 9, 2009
43. RDF
Linguagem usada para descrever dados,
metadados e até mesmo outras linguagens de
dados
Formato de grafo de dados
Árvore
Eduardo Nicola Zagari
Monday, November 9, 2009
44. RDF
Linguagem usada para descrever dados,
metadados e até mesmo outras linguagens de
dados
Formato de grafo de dados Grafo
Árvore
Eduardo Nicola Zagari
Monday, November 9, 2009
45. RDF
Usa triplas: {Recurso, Predicado, Objeto}
Empregado em RSS e FOAF
Idéia básica
cada item de dado deve ter um
identificador Web único (URI)
atributo central do modelo: relacionamento
de URIs entre itens de dados
Eduardo Nicola Zagari
Monday, November 9, 2009
46. Um Grafo RDF Simples
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-
ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://bike.zagari.org/">
<dc:title>Viagens com a Magrela</dc:title>
</rdf:Description>
<rdf:Description rdf:about="http://bike.zagari.org/">
<dc:creator
rdf:resource="http://zagari.org/foaf.rdf#me"/>
</rdf:Description>
Eduardo Nicola Zagari
Monday, November 9, 2009
47. Um Grafo RDF Simples
Eduardo Nicola Zagari
Monday, November 9, 2009
48. RDFa e Microformatos
Web -> HTML
-> Linguagem de dados não estruturada
Microformatos e RDFa
Forma de codificar dados dentro de
documentos HTML e XHTML
Eduardo Nicola Zagari
Monday, November 9, 2009
49. HTML
<div>
<div>Nicola Zagari</div>
<div>Abril Digital</div>
<div>11-3818-1234</div>
<a href="http://
www.abril.com.br/">
http://www.abril.com.br/</
a>
</div>
Eduardo Nicola Zagari
Monday, November 9, 2009
50. HTML
<div>
<div>Abril Digital</div>
<div>Nicola Zagari</div>
<div>11-3818-1234</div>
<a href="http://
www.abril.com.br/">
http://www.abril.com.br/</
a>
</div>
Eduardo Nicola Zagari
Monday, November 9, 2009
53. RDFa
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN"
"http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
version="XHTML+RDFa 1.0" xml:lang="en">
<head>
<title>John's Home Page</title>
<base href="http://example.org/john-d/" />
<meta property="dc:creator" content="Jonathan Doe" />
</head>
<body>
<h1>John's Home Page</h1>
<p>My name is <span property="foaf:nick">John D</span> and I like
<a href="http://www.neubauten.org/" rel="foaf:interest"
xml:lang="de">Einstürzende Neubauten</a>.
</p>
<p>
My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite
book</span> is the inspiring <span about="urn:ISBN:0752820907"><cite
property="dc:title">Weaving the Web</cite> by
<span property="dc:creator">Tim Berners-Lee</span></span>
</p>
</body>
</html>
Eduardo Nicola Zagari
Monday, November 9, 2009
54. RDFa x Microformato
Microformato especifica:
a sintaxe para embutir os dados dentro do
documento HTML
um vocabulário de termos específicos para
cada tipo de informação (eventos, contatos,
localização geográfica etc)
RDFa especifica apenas a sintaxe:
especificação de termos é independente
Eduardo Nicola Zagari
Monday, November 9, 2009
55. SPARQL
SPARQL (Simple) Protocol and RDF Query
Language
Permite realizar queries em grafos de dados
RDF
É determinístico
Eduardo Nicola Zagari
Monday, November 9, 2009
57. OWL
Web Ontology Language
Linguagem para definir e instanciar ontologias
na Web
Pode incluir descrições de classes, suas
respectivas propriedades e relacionamentos
É uma extensão de RDF para permitir a
representação da semântica de modelos de
dados mais complexos
Eduardo Nicola Zagari
Monday, November 9, 2009
60. Bottom-Up
Desafios Técnicos
Como criar os documentos de descrição de
dados?
Algoritmo de NLP?
Manual?
Eduardo Nicola Zagari
Monday, November 9, 2009
61. Bottom-Up
Desafios Técnicos
Como criar os documentos de descrição de
dados?
Algoritmo de NLP?
Manual?
Quem os geraria? Centralizado (Google-like)
ou os próprios sites? Qual a motivação?
Eduardo Nicola Zagari
Monday, November 9, 2009
62. Bottom-Up
Desafios Técnicos
Como criar os documentos de descrição de
dados?
Algoritmo de NLP?
Manual?
Quem os geraria? Centralizado (Google-like)
ou os próprios sites? Qual a motivação?
No caso da abordagem distribuída, como fica
a questão de padronização?
Eduardo Nicola Zagari
Monday, November 9, 2009
64. Bottom-Up
Desafios Científicos
Problema NP-completo
Eduardo Nicola Zagari
Monday, November 9, 2009
65. Bottom-Up
Desafios Científicos
Problema NP-completo
Lidar com a Incerteza
Representação precisa dos fatos
Eduardo Nicola Zagari
Monday, November 9, 2009
66. Bottom-Up versus
Top-Down
Por estes aspectos, a abordagem Top-Down
apresenta-se mais interessante que a
Bottom-Up, mas...
Eduardo Nicola Zagari
Monday, November 9, 2009
67. Top-Down
Primeiro, é uma abordagem simplista e não a
Web Semântica como ela foi pensada
Um conjunto de apps e serviços web que
geram valor a partir de semânticas simples
Nem sempre chegam a resultados corretos,
devido à ambiguidade
Eduardo Nicola Zagari
Monday, November 9, 2009
68. Bottom-Up e Top-Down
Desafios de Negócio
Eduardo Nicola Zagari
Monday, November 9, 2009
69. Bottom-Up e Top-Down
Desafios de Negócio
Qual o real valor para o usuário?
Redução de tempo?
Eduardo Nicola Zagari
Monday, November 9, 2009
70. Bottom-Up e Top-Down
Desafios de Negócio
Qual o real valor para o usuário?
Redução de tempo?
Quais as aplicações que podem ser
construídas no topo da Web Semântica?
Eduardo Nicola Zagari
Monday, November 9, 2009
71. NLP e NER
NLP
Subárea de IA e da linguística que estuda
os problemas da geração e compreensão
automática de linguas humanas naturais
NER:
ramo do processamento de linguagem
natural que procura extrair e classificar as
entidades mencionadas em um texto
Eduardo Nicola Zagari
Monday, November 9, 2009
72. Calais
Eduardo Nicola Zagari
Monday, November 9, 2009
73. CMS
Eduardo Nicola Zagari
Monday, November 9, 2009
80. Considerações Finais
Big Player?
Aplicações inovadoras (killer apps)
Eduardo Nicola Zagari
Monday, November 9, 2009
81. Considerações Finais
Big Player?
Aplicações inovadoras (killer apps)
Agentes Inteligentes / máquinas de
inferência
Eduardo Nicola Zagari
Monday, November 9, 2009
82. Considerações Finais
Big Player?
Aplicações inovadoras (killer apps)
Agentes Inteligentes / máquinas de
inferência
Conteúdo relevante e de alta qualidade:
gerência de conteúdo => inteligência social
Eduardo Nicola Zagari
Monday, November 9, 2009
83. Referências
RDF. W3C, http://www.w3.org
RDF, Microformats, OWL, SPARQL. Wikipedia, http://en.wikipedia.org/wiki/Main_Page
The Road to the Semantic Web. Alex Iskold,
http://www.readwriteweb.com/archives/semantic_web_road.php
Semantic Web Patterns: A Guide to Semantic Technologies. Alex Iskold,
http://www.readwriteweb.com/archives/semantic_web_patterns_a_guide_redux.php
Semantic Web FOR DUMmIES. Jeff rey T. Pollock, Wiley Publishing, Inc.
WEB 2.0 AND BEYOND - Understanding the New Online Business Models, Trends, and
Technologies. Tom Funk, Praeger Publishers
Semantic Web: Difficulties with the Classic Approach. Alex Iskold
http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php
Top-Down: A New Approach to the Semantic Web. Alex Iskold,
http://www.readwriteweb.com/archives/the_top-down_semantic_web.php
Eduardo Nicola Zagari
Monday, November 9, 2009
84. Web Semântica
Eduardo Nicola F. Zagari
zagari em abril com br
Ekke Ekke Ekke Ptang Zoo Boing - Núcleo de Engenharia e Pesquisa
Abril Digital
Monday, November 9, 2009