SlideShare ist ein Scribd-Unternehmen logo
1 von 72
WEB SEMÂNTICA
   Renan Oliveira
AGENDA

•   Web atual: hipertexto

•   Web semântica

•   Ontologias

•   Modelagem de dados

•   Linked Open Data
WEB ATUAL


•   Apresentação do conteúdos

•   Formatação, não significado

•   Pouca ou nenhuma estruturação
CONTEÚDO MULTIMÍDIA

•   Vários elementos na página

•   Fotos, vídeos e animações

•   Qual a relação entre eles?

•   Quem é mencionado no texto?

•   Quem, Quando, Onde...
COMO ISSO AFETA
    ALGO COMUM?
Busca por Gols do Roberto Carlos no Maracanã
NA GLOBO.COM
E... NO GOOGLE
PROBLEMAS

•   Busca feita por palavras (dados, não informações)

•   Falta de contexto (como fotos e vídeos se relacionam com o texto?)

•   Ambiguidade (qual Roberto Carlos?)

•   Pouca relevância (gol???)
MELHORIAS


•   Registrar de forma precisa

•   Organizar corretamente

•   Transmitir significado
WEB SEMÂNTICA



“I have a dream for the web in which computers become
capable of analyzing all the data on the web - the content,
links, and transactions between people and computers.”
Tim Berners-Lee
HOMEM + MÁQUINA


•   Cada um desempenha seu melhor papel

•   Homem - desambiguar, relacionar e definir regras

•   Máquina - organizar, indexar e inferir
REGISTRAR INFORMAÇÃO


•   Produtor do conteúdo

•   Sabe o que, quem, quando, onde...

•   Resolve ambiguidade
GOL DO ROBERTO CARLOS
ONTOLOGIAS



• “Uma  ontologia é um modelo de dados que representa um
 conjunto de conceitos dentro de um domínio e os
 relacionamentos entre eles” - Wikipedia
MONTAGEM

•   Identificar os indivíduos

•   Descrever seus atributos

•   Agrupar os indivíduos em classes

•   Enumerar as relações entre indivíduos

•   Definir regras sobre atributos e relações
CONTRUÇÃO DE
                    ONTOLOGIAS

•   Linguagens para definir ontologias

    •   OWL (Web Ontology Language)

    •   RDF (Resource description framework)
REPRESENTAÇÃO EM TRIPLAS
VANTAGENS
•   Modelagem natural

    •   muito próximo da orientação a objetos

•   Expressividade

    •   representa qualquer relacionamento possível

    •   restrições, cardinalidade

•   Capacidade de inferência

    •   regras sobre as classes e relacionamentos
EXIBIR INFORMAÇÃO

•   HTML e XML não são suficientes

•   Estrutura, mas não significado

    <document type="progressive rock">
    <name>Another Brick in the Wall</name>
    <author>Roger Waters</author>
    </document>
REPRESENTAÇÃO
                    ESTRUTURADA
•   “Tags” com estrutura semântica

•   Padronização dos elementos

    <music type="rock">
    <title>Another Brick in the Wall</title>
    <composer>Roger Waters</composer>
    </music>
COMO PADRONIZAR?

•   Vocabulários controlados

•   Exemplo: Dublin Core Metadata Initiative (DCMI)

    •   termos com significado bem definido:

        •   title, creator, contributor, creator, ...
OUTROS VOCABULÁRIOS
•   FOAF (Friend of a Friend)

    •   informações sobre as pessoas

    •   orginalmente usado para redes sociais

•   Core Ontology for Multimedia (COMM)

    •   informações sobre arquivos de mídia

    •   dimensões, encoding, histórico de produção
XML USANDO DUBLIN CORE

      <music type="rock">
         <dc:title>
           Another Brick in the Wall
          </dc:title>
          <dc:creator>
           Roger Waters
          </dc:creator>
      </music>
HTML + RDFA

<span property="foaf:name">
 Roger Waters
</span>
 nasceu em
<span property="foaf:dateOfBirth" content="1943-09-06"
datatype="xsd:date">
 6 de setembro de 1943
</span>
SCHEMA.ORG


•   Iniciativa Google, Bing e Yahoo!

•   Gera Rich Snippet

•   Grande melhoria em SEO.
BENEFÍCIOS


•   Significado explícito

•   Sem ambiguidades

•   Entendido por máquinas de busca
LINKED DATA

•   Referências cruzadas globais

•   Embutidas em páginas HTML

    •   RDFa, schema.org

•   Identificadores único (URIs) para conceitos

•   Bases de dados de referência
LINKED OPEN DATA CLOUD
•   Repositório de uso geral

    •   DBPedia (conceitos extraídos da Wikipedia)

    •   FreeBase

•   Repositório sobre domínios específicos

    •   GeoNames

    •   MusicBrainz

•   Novos sites com autoridade sobre o domínio
BUSCAS SEMÂNTICAS

•   Encontram e analisam meta-informação

    •   tags com RDFa, microdata

    •   repositório de triplas

•   Relacionam informações em sites diferentes

•   Exemplo: Sindice e Google*
como usamos?
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
CONHECIMENTO
        ÚNICO
     Menor risco de duplicidade dos dados
Simplificação do uso e da manutenção dos dados
       Agilidade na recuperação dos dados
cita a entidade
            Materia                     Pessoa
ONTOLOGIA
TRIPLA
                      cita a entidade
            Matéria                     Romário
CASES RELEVANTES
    Modelos de uso da
     Web Semântica
•   Best Buy

•   BBC

•   New York Times
AÇÕES REALIZADAS


•   Uso da ontologia GoodRelations

•   Adição de metadados: RDFa
RESULTADOS ALCANÇADOS


•   Tráfego originado por motores de busca: + 30%

•   Taxa de cliques no Yahoo!: + 15%

•   Aumento significativo do Google PageRank
AÇÕES REALIZADAS


•   Ontologias públicas

•   Interligação com repositórios de dados externos

•   Criação de categorias e agregadores úteis
Domínios representados
Ontologias públicas
    utilizadas
Ontologia de programas
RESULTADOS ALCANÇADOS


•   Proliferação de links relevantes: potencialização de SEO

•   Reuso das informações: menor desperdício de pessoal

•   Navegação interligada e escalável para toda a BBC
AÇÕES REALIZADAS


•   Anotação e indexação do conteúdo baseado em indivíduos

•   Ontologia pública

•   Interligação com repositórios de dados externos

•   Adição de metadados: Open Graph
NYT Index Abstract
                              ✓ Assuntos: Livestock; Goats;
Jenny Brown, owner of          Amputation; Prosthesis; Legs
Woodstock (NY) Farm Animal
Sanctuary, forms special      ✓ Organizações:Woodstock Farm

bond with Albie, goat that     Animal Sanctuary
probably escaped from New
                              ✓ Lugares:Woodstock (NY); New
York City slaughterhouse;
                               York City
Albie injured leg in escape
and it had to be amputated;
                              ✓ Pessoas: Santos, Fernanda; Brown,
Brown had leg amputated as
Apresentação:
www.renanoliveira.net

Contato:
renan@corp.globo.com
@renan_oliveira

globo.com
Renan Oliveira

Weitere ähnliche Inhalte

Was ist angesagt?

Creando la estrategia de gestión de datos para tu organización
Creando la estrategia de gestión de datos para tu organizaciónCreando la estrategia de gestión de datos para tu organización
Creando la estrategia de gestión de datos para tu organizaciónRamón Hernández
 
Introduction To RDF and RDFS
Introduction To RDF and RDFSIntroduction To RDF and RDFS
Introduction To RDF and RDFSNilesh Wagmare
 
Metadata is a Love Note to the Future
Metadata is a Love Note to the FutureMetadata is a Love Note to the Future
Metadata is a Love Note to the FutureRachel Lovinger
 
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017OLX Group presentation for AWS Redshift meetup in London, 5 July 2017
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017Dobo Radichkov
 
Owl web ontology language
Owl  web ontology languageOwl  web ontology language
Owl web ontology languagehassco2011
 
Challenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services genChallenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services genrobin fay
 
Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Bohyun Kim
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityNeo4j
 
Microsoft Power & Utilities POV
Microsoft Power & Utilities POVMicrosoft Power & Utilities POV
Microsoft Power & Utilities POVJon Arnold
 
Functional requirements for bibliographic records & functional requirements f...
Functional requirements for bibliographic records & functional requirements f...Functional requirements for bibliographic records & functional requirements f...
Functional requirements for bibliographic records & functional requirements f...UDAYA VARADARAJAN
 
Converting Relational to Graph Databases
Converting Relational to Graph DatabasesConverting Relational to Graph Databases
Converting Relational to Graph DatabasesAntonio Maccioni
 
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)Amazon Web Services Korea
 
Data Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to MeshData Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to MeshJeffrey T. Pollock
 
Big Query - Utilizing Google Data Warehouse for Media Analytics
Big Query - Utilizing Google Data Warehouse for Media AnalyticsBig Query - Utilizing Google Data Warehouse for Media Analytics
Big Query - Utilizing Google Data Warehouse for Media Analyticshafeeznazri
 
Linked Data in Libraries
Linked Data in LibrariesLinked Data in Libraries
Linked Data in LibrariesCarl Hess
 
Data Mesh for Dinner
Data Mesh for DinnerData Mesh for Dinner
Data Mesh for DinnerKent Graziano
 

Was ist angesagt? (20)

Creando la estrategia de gestión de datos para tu organización
Creando la estrategia de gestión de datos para tu organizaciónCreando la estrategia de gestión de datos para tu organización
Creando la estrategia de gestión de datos para tu organización
 
Introduction To RDF and RDFS
Introduction To RDF and RDFSIntroduction To RDF and RDFS
Introduction To RDF and RDFS
 
Metadata is a Love Note to the Future
Metadata is a Love Note to the FutureMetadata is a Love Note to the Future
Metadata is a Love Note to the Future
 
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017OLX Group presentation for AWS Redshift meetup in London, 5 July 2017
OLX Group presentation for AWS Redshift meetup in London, 5 July 2017
 
Owl web ontology language
Owl  web ontology languageOwl  web ontology language
Owl web ontology language
 
Challenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services genChallenges and opportunities in library discovery services gen
Challenges and opportunities in library discovery services gen
 
IEEE LOM
IEEE LOMIEEE LOM
IEEE LOM
 
FAIR data overview
FAIR data overviewFAIR data overview
FAIR data overview
 
RDF Data Model
RDF Data ModelRDF Data Model
RDF Data Model
 
Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries
 
Group 3 Final Presentation
Group 3 Final PresentationGroup 3 Final Presentation
Group 3 Final Presentation
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
 
Microsoft Power & Utilities POV
Microsoft Power & Utilities POVMicrosoft Power & Utilities POV
Microsoft Power & Utilities POV
 
Functional requirements for bibliographic records & functional requirements f...
Functional requirements for bibliographic records & functional requirements f...Functional requirements for bibliographic records & functional requirements f...
Functional requirements for bibliographic records & functional requirements f...
 
Converting Relational to Graph Databases
Converting Relational to Graph DatabasesConverting Relational to Graph Databases
Converting Relational to Graph Databases
 
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)
데이터 기반 의사결정을 통한 비지니스 혁신 - 윤석찬 (AWS 테크에반젤리스트)
 
Data Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to MeshData Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to Mesh
 
Big Query - Utilizing Google Data Warehouse for Media Analytics
Big Query - Utilizing Google Data Warehouse for Media AnalyticsBig Query - Utilizing Google Data Warehouse for Media Analytics
Big Query - Utilizing Google Data Warehouse for Media Analytics
 
Linked Data in Libraries
Linked Data in LibrariesLinked Data in Libraries
Linked Data in Libraries
 
Data Mesh for Dinner
Data Mesh for DinnerData Mesh for Dinner
Data Mesh for Dinner
 

Ähnlich wie Introdução a web semântica e o case da globo.com

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisRosana Lanzelotte
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaNaira Michelle Alves Pereira
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLOtávio Calaça Xavier
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeElvis Fusco
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Luiz Adolfo de Andrade
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documentoAlex Martins
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Thiago de Azeredo
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partiturasRosana Lanzelotte
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de ConteúdoPatricia De Cia
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaLuciano Ramalho
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informaçãoHenrique Fonseca
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasHelio Henrique L. C. Monte-Alto
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasSociedade da Informação
 

Ähnlich wie Introdução a web semântica e o case da globo.com (20)

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicais
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomia
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQL
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na Rede
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partituras
 
Saber avaliar a informação
Saber avaliar a informaçãoSaber avaliar a informação
Saber avaliar a informação
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de Conteúdo
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiência
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informação
 
Aula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.pptAula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.ppt
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologias
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e Ontologias
 
Palestra Introdução a Linked Data
Palestra Introdução a Linked DataPalestra Introdução a Linked Data
Palestra Introdução a Linked Data
 

Mehr von Renan Moreira de Oliveira

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServiceRenan Moreira de Oliveira
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Renan Moreira de Oliveira
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosRenan Moreira de Oliveira
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaRenan Moreira de Oliveira
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveRenan Moreira de Oliveira
 

Mehr von Renan Moreira de Oliveira (20)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
Data science Framework
Data science FrameworkData science Framework
Data science Framework
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
Big data e Machine Learning na globo.com
Big data e Machine Learning na globo.comBig data e Machine Learning na globo.com
Big data e Machine Learning na globo.com
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Machine Learning na globo-com
Machine Learning na globo-comMachine Learning na globo-com
Machine Learning na globo-com
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Big data e a globo.com - 2017
Big data e a globo.com - 2017Big data e a globo.com - 2017
Big data e a globo.com - 2017
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Big Data na globo.com
Big Data na globo.comBig Data na globo.com
Big Data na globo.com
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 

Introdução a web semântica e o case da globo.com

  • 1. WEB SEMÂNTICA Renan Oliveira
  • 2. AGENDA • Web atual: hipertexto • Web semântica • Ontologias • Modelagem de dados • Linked Open Data
  • 3. WEB ATUAL • Apresentação do conteúdos • Formatação, não significado • Pouca ou nenhuma estruturação
  • 4. CONTEÚDO MULTIMÍDIA • Vários elementos na página • Fotos, vídeos e animações • Qual a relação entre eles? • Quem é mencionado no texto? • Quem, Quando, Onde...
  • 5. COMO ISSO AFETA ALGO COMUM? Busca por Gols do Roberto Carlos no Maracanã
  • 8. PROBLEMAS • Busca feita por palavras (dados, não informações) • Falta de contexto (como fotos e vídeos se relacionam com o texto?) • Ambiguidade (qual Roberto Carlos?) • Pouca relevância (gol???)
  • 9. MELHORIAS • Registrar de forma precisa • Organizar corretamente • Transmitir significado
  • 10. WEB SEMÂNTICA “I have a dream for the web in which computers become capable of analyzing all the data on the web - the content, links, and transactions between people and computers.” Tim Berners-Lee
  • 11. HOMEM + MÁQUINA • Cada um desempenha seu melhor papel • Homem - desambiguar, relacionar e definir regras • Máquina - organizar, indexar e inferir
  • 12. REGISTRAR INFORMAÇÃO • Produtor do conteúdo • Sabe o que, quem, quando, onde... • Resolve ambiguidade
  • 13. GOL DO ROBERTO CARLOS
  • 14. ONTOLOGIAS • “Uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre eles” - Wikipedia
  • 15. MONTAGEM • Identificar os indivíduos • Descrever seus atributos • Agrupar os indivíduos em classes • Enumerar as relações entre indivíduos • Definir regras sobre atributos e relações
  • 16. CONTRUÇÃO DE ONTOLOGIAS • Linguagens para definir ontologias • OWL (Web Ontology Language) • RDF (Resource description framework)
  • 18.
  • 19. VANTAGENS • Modelagem natural • muito próximo da orientação a objetos • Expressividade • representa qualquer relacionamento possível • restrições, cardinalidade • Capacidade de inferência • regras sobre as classes e relacionamentos
  • 20. EXIBIR INFORMAÇÃO • HTML e XML não são suficientes • Estrutura, mas não significado <document type="progressive rock"> <name>Another Brick in the Wall</name> <author>Roger Waters</author> </document>
  • 21. REPRESENTAÇÃO ESTRUTURADA • “Tags” com estrutura semântica • Padronização dos elementos <music type="rock"> <title>Another Brick in the Wall</title> <composer>Roger Waters</composer> </music>
  • 22. COMO PADRONIZAR? • Vocabulários controlados • Exemplo: Dublin Core Metadata Initiative (DCMI) • termos com significado bem definido: • title, creator, contributor, creator, ...
  • 23. OUTROS VOCABULÁRIOS • FOAF (Friend of a Friend) • informações sobre as pessoas • orginalmente usado para redes sociais • Core Ontology for Multimedia (COMM) • informações sobre arquivos de mídia • dimensões, encoding, histórico de produção
  • 24. XML USANDO DUBLIN CORE <music type="rock"> <dc:title> Another Brick in the Wall </dc:title> <dc:creator> Roger Waters </dc:creator> </music>
  • 25. HTML + RDFA <span property="foaf:name"> Roger Waters </span> nasceu em <span property="foaf:dateOfBirth" content="1943-09-06" datatype="xsd:date"> 6 de setembro de 1943 </span>
  • 26. SCHEMA.ORG • Iniciativa Google, Bing e Yahoo! • Gera Rich Snippet • Grande melhoria em SEO.
  • 27. BENEFÍCIOS • Significado explícito • Sem ambiguidades • Entendido por máquinas de busca
  • 28. LINKED DATA • Referências cruzadas globais • Embutidas em páginas HTML • RDFa, schema.org • Identificadores único (URIs) para conceitos • Bases de dados de referência
  • 29.
  • 30. LINKED OPEN DATA CLOUD • Repositório de uso geral • DBPedia (conceitos extraídos da Wikipedia) • FreeBase • Repositório sobre domínios específicos • GeoNames • MusicBrainz • Novos sites com autoridade sobre o domínio
  • 31. BUSCAS SEMÂNTICAS • Encontram e analisam meta-informação • tags com RDFa, microdata • repositório de triplas • Relacionam informações em sites diferentes • Exemplo: Sindice e Google*
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. CONHECIMENTO ÚNICO Menor risco de duplicidade dos dados Simplificação do uso e da manutenção dos dados Agilidade na recuperação dos dados
  • 49. cita a entidade Materia Pessoa ONTOLOGIA TRIPLA cita a entidade Matéria Romário
  • 50.
  • 51. CASES RELEVANTES Modelos de uso da Web Semântica
  • 52. Best Buy • BBC • New York Times
  • 53.
  • 54. AÇÕES REALIZADAS • Uso da ontologia GoodRelations • Adição de metadados: RDFa
  • 55.
  • 56.
  • 57. RESULTADOS ALCANÇADOS • Tráfego originado por motores de busca: + 30% • Taxa de cliques no Yahoo!: + 15% • Aumento significativo do Google PageRank
  • 58.
  • 59. AÇÕES REALIZADAS • Ontologias públicas • Interligação com repositórios de dados externos • Criação de categorias e agregadores úteis
  • 61. Ontologias públicas utilizadas
  • 63.
  • 64.
  • 65. RESULTADOS ALCANÇADOS • Proliferação de links relevantes: potencialização de SEO • Reuso das informações: menor desperdício de pessoal • Navegação interligada e escalável para toda a BBC
  • 66.
  • 67. AÇÕES REALIZADAS • Anotação e indexação do conteúdo baseado em indivíduos • Ontologia pública • Interligação com repositórios de dados externos • Adição de metadados: Open Graph
  • 68. NYT Index Abstract ✓ Assuntos: Livestock; Goats; Jenny Brown, owner of Amputation; Prosthesis; Legs Woodstock (NY) Farm Animal Sanctuary, forms special ✓ Organizações:Woodstock Farm bond with Albie, goat that Animal Sanctuary probably escaped from New ✓ Lugares:Woodstock (NY); New York City slaughterhouse; York City Albie injured leg in escape and it had to be amputated; ✓ Pessoas: Santos, Fernanda; Brown, Brown had leg amputated as
  • 69.
  • 70.
  • 71.

Hinweis der Redaktion

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. UM ROM&amp;#xC1;RIO ---- DADO CONSISTENTE NA NOSSA BASE\nDADO F&amp;#xC1;CIL DE USADO E MANTIDO\n\n
  58. PREDICADO CONECTA DUAS CLASSES\n
  59. ATORES: TIMES, T&amp;#xC9;CNICO, ETC...\nEVENTO: PARTIDA\nN&amp;#xC3;O TEM O JUIZ\n
  60. \n
  61. \n
  62. - Grande empresa varejo de eletronicos\n- Artigo semtech\n- benef&amp;#xED;cios da web sem&amp;#xE2;ntica\n\n\n
  63. good relations\n --&gt; vocabulario profissional e-commerce\n --&gt; amig&amp;#xE1;vel m&amp;#xE1;quina busca, mobile, exten&amp;#xE7;&amp;#xF5;es browser\nrdfa\n --&gt; anotar XHTML com sem&amp;#xE2;ntica\n --&gt; utilizado por m&amp;#xE1;quinas de busca, machine readable\n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. MUSIC BRAINZ - IMDB DA M&amp;#xDA;SICA\n
  71. DOM&amp;#xCD;NIO QUE INTERESSA A GLOBO.COM\n
  72. ESTOU PROCURANDO SOBRE NOT&amp;#xCD;CIAS DA CHINA\n
  73. P&amp;#xC1;GINA DE T&amp;#xD3;PICOS SOBRE A CHINA\n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n