SlideShare ist ein Scribd-Unternehmen logo
1 von 35
Downloaden Sie, um offline zu lesen
An approach for managing and
semantically enriching the publication
 of Linked Open Governmental Data
Kelli de Faria Cordeiro1, Fabricio Firmino de Faria1, Bianca de Oliveira Pereira1,2, André
  Freitas2, Cristiano Expedito Ribeiro1, João Vitor Villas Boas Freitas1, Ana Christina
Bringuente3, Lucas de Oliveira Arantes3, Rodrigo Calhau3, Veruska Zamborlini3, Maria
                     Luiza Machado Campos1, Giancarlo Guizzardi3
                        1Graduate Program in Informatics (PPGI)
                   Federal University of Rio de Janeiro (UFRJ) – Brazil
                      2Digital
                             Enterprise Research Institute (DERI)
                   National University of Ireland – Galway – Ireland
  3Ontology and Conceptual Modeling Research Group (NEMO) – Computer Science
           Department – Federal University of Espírito Santo (UFES) – Brazil
Agenda

       • Motivação e contextualização

       • Cenário Atual em Dados Abertos Interligados (LOD)

       • Projeto LinkedDataBR

       • ETL Workflow

       • Tratamento Semântico Incremental

       • Estudo de Caso

       • Considerações finais



An approach for managing and semantically enriching the publication of Linked Open Governmental Data   2
Motivação e contextualização




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   3
Motivação e contextualização




                                            Estão abertos?




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   4
Motivação e contextualização
                      RNP
           CAPES
CNPq




                                          Uso conjunto
                                       é ainda um desafio!




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   5
Motivação e contextualização


• Interoperabilidade e Integração de dados na Web ainda
  requerem considerável esforço

      – Mesmo dentro de uma organização!
        . Tivemos SGBD por mais de meio século, mas conseguimos a
              integração que se pretendia? O que faltou ?
      – E agora, na Web:
             • Distribuídos, heterogêneos, em grande escala, altamente
               visíveis, grande número de diferentes usuários, …




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   6
Linked Open Data (LOD)

      • LOD pode ser considerado uma abordagem mais
        simplista de uso de tecnologias da Web Semântica
      • Baseada em triplas (RDF) para representar os dados de
        forma realmente “granular”
         – Facilita a interligação
         – Acompanhado de um descritor
      • Abordagem pay-as-you-go




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   7
Linked Open Data (LOD)

   – O que vem a ser Dados Abertos Interligados?
          • Utilização ampla de padrões

          • Representação de dados em um grão mínimo (triplas RDF)
             – Flexibilidade nas ligações entre itens de dados

          • Tem a interoperabilidade em sua essência
              – RDF: Resource DESCRIPTION Framework
                 » Criado para interoperar METADADOS!
              – Descritores estão na base da proposta


An approach for managing and semantically enriching the publication of Linked Open Governmental Data   8
Linked Open Data (LOD)

      – Uma maneira “nova” de publicar e consumir dados!
             • O poder das ligações tipadas
             • O poder da colaboração
                     – Consumidores podem ser publicadores também!
             • Mais e mais dados sendo gerados e potencialmente
               “ligáveis”
                     – Sensores e Web das Coisas
             • Dados e metadados sendo explorados juntos em
               novas aplicações
             • Consulta E Navegação E Busca!


An approach for managing and semantically enriching the publication of Linked Open Governmental Data   9
Dados publicados como LOD
         265 datasets - 32 bilhões de triplas - 42% de dados de governo
                              Setembro de 2011




                 Até quando conseguiremos representar esta nuvem?
An approach for managing and semantically enriching the publication of Linked Open Governmental Data   10
Cenário Atual - Internacional
  • Muitas iniciativas de governo
         – Governo Britânico, Estados Unidos, Espanha, etc.
         – Diferentes abordagens
         – Entrando em fase mais madura
  • Muitas iniciativas do setor privado
         – BBC, New York Times, ...
  • Muitas iniciativas em e-Ciência
         – Dados genômicos, dados de meio-ambiente,...
  • Forte envolvimento da área acadêmica
         – Consórcio W3C, Sir Tim Berners Lee (MIT)
         – DERI/NUI (Irlanda), Univ. Berlim (Alemanha), Univ. de Madri (Espanha)
         – Projeto LOD2


An approach for managing and semantically enriching the publication of Linked Open Governmental Data   11
Cenário Atual - Internacional
  • Grande diversidade de ferramentas
         – Ainda sendo experimentadas
         – Foco em atividades específicas de publicação, consumo e colaboração
         – Ainda razoável esforço requerido para seu uso conjunto


  • Abordagem liberal
         – Prioridade para “expor” os dados e depois ir complementando sua
           descrição
         – Uso de ontologias ainda incipiente
         – Processo de publicação muito artesanal
         – Qualidade do dado publicado ainda pouco rastreável


  • Entrando em fase de amadurecimento
         – Maior preocupação com semântica e descritores
         – Frameworks para integração de ferramentas sendo discutidos
An approach for managing and semantically enriching the publication of Linked Open Governmental Data   12
Cenário Atual - Nacional
  • Inicialmente evoluindo sobre pesquisas e aplicações da Web
    Semântica e Ontologias
                • PUC-RJ, UFRJ, UFES, PUC-RJ, PUC-RS, …
  • Interesse crescente no Governo:
         –    Inicialmente uma certa confusão com dados abertos
         –    Acordo assinado entre o Brasil, EUA e mais 6 países
         –    Tema do CONSEGI deste ano
         –    Ministério do Planejamento :
                • Cria o INDA – Infraestrutura Nacional de Dados Abertos
                • Baseada em LOD e uso de ontologias
         – Apoio do W3C Brasil e CGI/BR
                • Cria o GT Ontologias
         – Iniciativas experimentais em LOD
                • Experimentos pontuais -> simples conversão de dados e interfaces atraentes
                • Tecnologia ainda pouco conhecida
An approach for managing and semantically enriching the publication of Linked Open Governmental Data   13
Linked



            LinkedDataBR


An approach for managing and semantically enriching the publication of Linked Open Governmental Data
Nossa Abordagem                                                                                       Linked




    • Alguns domínios requerem uma abordagem sistemática
      que garanta:
           – Maior controle do processo
           – Manutenção da consistência dos dados sendo publicados


    • Este é o caso de:
           – Dados Governamentais
           – Dados de e-Ciência


    • Necessário adotar uma abordagem de “gestão de dados”

An approach for managing and semantically enriching the publication of Linked Open Governmental Data            15
LinkedDataBR - FOCO                                                                            Linked




       • Foco
              – no apoio ao processo de publicação
              – na qualidade do dado
       • Característica da solução:
              – Plataforma integrada e flexível
              – Maximização no reuso de ferramentas existentes
                  (software livre)
              – Explorar:
                     • Gerência de metadados
                     • Apoio ao processo com ferramenta de workflow (ETL)
                     • Tratamento Semântico


An approach for managing and semantically enriching the publication of Linked Open Governmental Data
LinkedDataBR - FOCO                                                                                                           Linked




                                                       LinkedDataBR
                       Feed/Expose
                                                       Treatment Process                                           LinkedDataCloud
      Governmental and Non
      Governmental Entities
                                             Pre-
     Universities and Research            Processing       Triplification      Linking
             Institutes

    Data Producers
                                                                                                                Consumers
                                                                                               Requests      Governmental and Non
                                                                                                 URI         Governmental Entities
                                         Provenance       Vocabulary        Triples            Responses    Universities and Research
                                                           Ontology                           Linked Data           Institutes
                                                                                                               Citizen and Private
                                                           Repository                          Queries              Companies

                                                                                                    Consume/Explore




An approach for managing and semantically enriching the publication of Linked Open Governmental Data                                          17
Projeto LinkedDataBR                                                                           Linked



       • Objetivos

              – Construção de uma infra-estrutura inicial de suporte à
                publicação e criação de repositórios de dados abertos
                utilizando os padrões de Linked Data

              E ainda:

              – Criação de diretrizes associadas ao processo de publicação
              – Criação de grupo de interesse e mobilização para apoio e
                estímulo à iniciativa de Linked Open Data no Brasil e sua
                inserção no cenário mundial de dados abertos interligados.


An approach for managing and semantically enriching the publication of Linked Open Governmental Data            18
Projeto LinkedDataBR                                                                           Linked



       • Arquitetura




An approach for managing and semantically enriching the publication of Linked Open Governmental Data            19
ETL Workflow (Captura de Proveniência)



                                                Publishing Workflow Process

                                      Extract              Transform                 Load


                                        Stage                Triplify              Linking

                                             Workflow Implementation Design
 Raw Government                                                                                            Triples
      Data
                                                                                                          Provenance
                                                                 Prospective Provenance Data                Triples
                                            Workflow Implementation Execution
                                                                                                         Linked Open
                                                                                                       Government Data


                                                               Retrospective Provenance Data


An approach for managing and semantically enriching the publication of Linked Open Governmental Data                     20
Publicação de Dados Abertos Ligados

           ABORDAGENS PARA O
           ENRIQUECIMENTO SEMÂNTICO
                                                                                                       21
An approach for managing and semantically enriching the publication of Linked Open Governmental Data        21
Ausência de preocupação com a semântica




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   22
Alguma preocupação com a semântica




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   23
Preocupação mediana com a semântica




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   24
Muita preocupação com a semântica




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   25
Linked



                Exemplo de Cenário de Publicação de
                        Dados Interligados


An approach for managing and semantically enriching the publication of Linked Open Governmental Data   26
Cenário de Aplicação C&T
                Cenário de Financiamentos de Projetos de Pesquisa
                                       Projetos de
        Currículos de                                          Instituições de
                                        Pesquisa
       Pesquisadores                                              Pesquisa
                            tem
                        participação
                                          RNP       tem
           Lattes            de                  instituição       eMec
     tem
                                         FNDCT
 participação
      de
        Grupos de
      Pesquisa - CNPq


          GP-CNPq




                                                                                 27
Exemplo do Processo de Publicação




Tratamento   Triplificação   Ligação
Tratamento
Triplificação
Ligação
Resultado
                                                              swrc:Project
                                             Projetos                        GrupoTrabalho                      Instituticao
       Grafos interligados                   RNP
                                                                                               “LinkedDataBR”
                                                WGFase                    LODBR             temNome

                                                                        temFase              temInsituicao           UFRJ
                                                         LODBR_Ph1                 “Universidade
                                                                                                     temNome
                                                                                   Federal do Rio         temSigla
                                             Participante temParticipacaoDe         do Janeiro”        “UFRJ”
                                                                                                                         swrc:University
                                                                     temNome       “Maria Luiza
 CNPq CV Lattes                                          MLMC                      M. Campos”
                           Pesquisador                                                                               eMec Instituições
   “Maria Luiza                                                                                              UFRJ           temNome
 Machado Campos”     temNome
                                      MLMC                                                                                        “UFRJ”
  “UFRJ”                                                            swrc:Person                          temLocalOferta
              enderecoProfissional                                                                                             temSigla
   2009      temAno      temPublicacao                                                                                “Universidade
                                                                                                             RioJ     Federal do Rio
  “CrossMDA: a Model-            MLMC0232                          Grupos de Pesquisa CNPq                             do Janeiro”
   driven Approach for    temTitulo                      MLMC                         “Maria Luiza
  Aspect Management”                                                 temNome
                                                                                      M.Campos”
                                Publicacao                 temParticipante
                                                                                        “Grupo
                                                                    temArea          Engenharia do
                             swrc:Publication           GRECO       Predominante    Conhecimento”
                         swrc:ResearchGroup
                                                             temNome      “Knowledge Engineering”

An approach for managing and semantically enriching the publication of Linked Open Governmental Data
Resultado



        ...
        <rdf:Description rdf:about="http://www.rnp.br/resource/LDBR_Ph1">
            <rdf:type rdf:resource="http://www.rnp.br/ontology/WGPhase"/>
            <rnp:hasParticipationOf rdf:resource="http://www.rnp.br/resource/MLMC"/>
        </rdf:Description>
        ...
        <rdf:Description rdf:about="http://www.rnp.br/resource/MLMC">
            <rdf:type rdf:resource="http://www.rnp.br/ontology/Participant"/>
            <rdf:type rdf:resource="http://swrc.ontoware.org/ontology/Person"/>
            <rnp:hasFullName> Maria Luiza Machado Campos </rnp:hasFullName>
            <owl:sameAs rdf:resource="http://lattes.cnpq.br/resource/MLMC"/>
            <owl:sameAs rdf:resource="http://www.cnpq.br/resource/MLMC"/>
        </rdf:Description>
        ...




An approach for managing and semantically enriching the publication of Linked Open Governmental Data   33
Considerações Finais
       • Iniciativas nacionais e internacionais pela transparência das
         ações governamentais e participação do cidadão.
       • Dado Aberto possui um papel fundamental, mas o valor real
         do dado é revelado se os dados são explorados em conjunto.
       • LOD é uma abordagem de interoperabilidade e integração
       • Em LOGD é essencial considerar algumas garantias de
         qualidade e estratégias de interoperabilidade
       • Plataforma do LinkedDataBR e a abordagem de
         enriquecimento semântico incremental
       • Concebida para apoiar os publicadores e gestores de dados de
         governo
       • O potencial da colaboração do cidadão (wisdom of the
         crowds) desempenhará um papel importante no
         mapeamento e ligação.
An approach for managing and semantically enriching the publication of Linked Open Governmental Data   34
An approach for managing and
semantically enriching the publication
 of Linked Open Governmental Data
                       http://greco.ppgi.ufrj.br/gtlinkedbr/
Kelli de Faria Cordeiro1, Fabricio Firmino de Faria1, Bianca de Oliveira Pereira1,2, André
  Freitas2, Cristiano Expedito Ribeiro1, João Vitor Villas Boas Freitas1, Ana Christina
Bringuente3, Lucas de Oliveira Arantes3, Rodrigo Calhau3, Veruska Zamborlini3, Maria
                     Luiza Machado Campos1, Giancarlo Guizzardi3
                        1Graduate Program in Informatics (PPGI)
                   Federal University of Rio de Janeiro (UFRJ) – Brazil
                      2Digital
                             Enterprise Research Institute (DERI)
                   National University of Ireland – Galway – Ireland
  3Ontology and Conceptual Modeling Research Group (NEMO) – Computer Science
           Department – Federal University of Espírito Santo (UFES) – Brazil

Weitere ähnliche Inhalte

Andere mochten auch

โปรพอลิส
โปรพอลิสโปรพอลิส
โปรพอลิสRpg Thailand
 
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamuk
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamukPemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamuk
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamukMuhammad Syahida
 
Internet product-of-foss
Internet product-of-fossInternet product-of-foss
Internet product-of-fossnghia le trung
 
A3 examen et corrige anglais 2012 1 am t2
A3 examen et corrige anglais 2012 1 am t2A3 examen et corrige anglais 2012 1 am t2
A3 examen et corrige anglais 2012 1 am t2Ahmed Mesellem
 
Targetes retallables: Síl·labari per Català i Castellà.
 Targetes retallables: Síl·labari per Català i Castellà. Targetes retallables: Síl·labari per Català i Castellà.
Targetes retallables: Síl·labari per Català i Castellà.Silvia Nieto
 
Tf8 integratingtechnologyintothecurriculum ahmadzai
Tf8 integratingtechnologyintothecurriculum ahmadzaiTf8 integratingtechnologyintothecurriculum ahmadzai
Tf8 integratingtechnologyintothecurriculum ahmadzaiahmadzai1959
 
Prezens Profile New 2011
Prezens Profile New 2011Prezens Profile New 2011
Prezens Profile New 2011jayeshbright
 
프레젠테이션2
프레젠테이션2프레젠테이션2
프레젠테이션2yunjuna7632
 
Integral
IntegralIntegral
IntegralAlv Awg
 
Mpeg Advisor Presentation Power Point[1]
Mpeg Advisor Presentation Power Point[1]Mpeg Advisor Presentation Power Point[1]
Mpeg Advisor Presentation Power Point[1]maryannstaff
 
Architecting fail safe data services
Architecting fail safe data servicesArchitecting fail safe data services
Architecting fail safe data servicesMarc Mercuri
 
Men in Black 3D
Men in Black 3DMen in Black 3D
Men in Black 3Djoelyp
 
Đồ sơ sinh cần thiết cho bé
Đồ sơ sinh cần thiết cho béĐồ sơ sinh cần thiết cho bé
Đồ sơ sinh cần thiết cho béShop Trẻ Thơ
 
Update on the UN System of Environmental-Economic Accounting
Update on the UN System of Environmental-Economic AccountingUpdate on the UN System of Environmental-Economic Accounting
Update on the UN System of Environmental-Economic AccountingGaia Manco
 
A3 examen et corrige arabe 2012 1 am t2
A3 examen et corrige arabe 2012 1 am t2A3 examen et corrige arabe 2012 1 am t2
A3 examen et corrige arabe 2012 1 am t2Ahmed Mesellem
 
Is the ideal worth pursuing?
Is the ideal worth pursuing?Is the ideal worth pursuing?
Is the ideal worth pursuing?cblockus
 

Andere mochten auch (20)

โปรพอลิส
โปรพอลิสโปรพอลิส
โปรพอลิส
 
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamuk
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamukPemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamuk
Pemanfaatan ekstrak serai(sitronela) sebagai pengusir nyamuk
 
Internet product-of-foss
Internet product-of-fossInternet product-of-foss
Internet product-of-foss
 
United World Project
United World ProjectUnited World Project
United World Project
 
A3 examen et corrige anglais 2012 1 am t2
A3 examen et corrige anglais 2012 1 am t2A3 examen et corrige anglais 2012 1 am t2
A3 examen et corrige anglais 2012 1 am t2
 
Targetes retallables: Síl·labari per Català i Castellà.
 Targetes retallables: Síl·labari per Català i Castellà. Targetes retallables: Síl·labari per Català i Castellà.
Targetes retallables: Síl·labari per Català i Castellà.
 
Tf8 integratingtechnologyintothecurriculum ahmadzai
Tf8 integratingtechnologyintothecurriculum ahmadzaiTf8 integratingtechnologyintothecurriculum ahmadzai
Tf8 integratingtechnologyintothecurriculum ahmadzai
 
Prezens Profile New 2011
Prezens Profile New 2011Prezens Profile New 2011
Prezens Profile New 2011
 
프레젠테이션2
프레젠테이션2프레젠테이션2
프레젠테이션2
 
Integral
IntegralIntegral
Integral
 
How are you
How are youHow are you
How are you
 
Mpeg Advisor Presentation Power Point[1]
Mpeg Advisor Presentation Power Point[1]Mpeg Advisor Presentation Power Point[1]
Mpeg Advisor Presentation Power Point[1]
 
OpenRoad Introduction
OpenRoad IntroductionOpenRoad Introduction
OpenRoad Introduction
 
Architecting fail safe data services
Architecting fail safe data servicesArchitecting fail safe data services
Architecting fail safe data services
 
Men in Black 3D
Men in Black 3DMen in Black 3D
Men in Black 3D
 
Đồ sơ sinh cần thiết cho bé
Đồ sơ sinh cần thiết cho béĐồ sơ sinh cần thiết cho bé
Đồ sơ sinh cần thiết cho bé
 
Update on the UN System of Environmental-Economic Accounting
Update on the UN System of Environmental-Economic AccountingUpdate on the UN System of Environmental-Economic Accounting
Update on the UN System of Environmental-Economic Accounting
 
A3 examen et corrige arabe 2012 1 am t2
A3 examen et corrige arabe 2012 1 am t2A3 examen et corrige arabe 2012 1 am t2
A3 examen et corrige arabe 2012 1 am t2
 
Итоги Russian Wine Fair 2012
Итоги Russian Wine Fair 2012Итоги Russian Wine Fair 2012
Итоги Russian Wine Fair 2012
 
Is the ideal worth pursuing?
Is the ideal worth pursuing?Is the ideal worth pursuing?
Is the ideal worth pursuing?
 

Ähnlich wie Gestão de Dados Governamentais como LOD

Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeThiago Avila, Msc
 
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontes
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontesCiência aberto, diretrizes FAIR, etapas de viabilização e horizontes
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontesLuiz Olavo Bonino da Silva Santos
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Roberto C. S. Pacheco
 
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Thiago Avila, Msc
 
Plataformas digitais de serviço público e a prova digital
Plataformas digitais de serviço público e a prova digitalPlataformas digitais de serviço público e a prova digital
Plataformas digitais de serviço público e a prova digitalLuis Borges Gouveia
 
O Bibliotecário como gestor de Projetos em TIC
 O Bibliotecário como gestor de Projetos em TIC O Bibliotecário como gestor de Projetos em TIC
O Bibliotecário como gestor de Projetos em TICRodrigo Moreira Garcia
 
Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Infraestrutura nacional de dados espaciais wadih joão scandar neto
Infraestrutura nacional de dados espaciais   wadih joão scandar netoInfraestrutura nacional de dados espaciais   wadih joão scandar neto
Infraestrutura nacional de dados espaciais wadih joão scandar netoconseplansp
 
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?Apresentação Dados Abertos: cidadania ou oportunidades para empresas?
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?Caroline Burle
 
Interoperabilidade dados abertos
Interoperabilidade dados abertosInteroperabilidade dados abertos
Interoperabilidade dados abertosLeonardo Cezar
 
Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Index3i
 
Dados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoDados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoThiago Avila, Msc
 
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...Eduardo Dalcin
 
Fatores Criticos de SUcesso
Fatores Criticos de SUcessoFatores Criticos de SUcesso
Fatores Criticos de SUcessoRenan Miranda
 
Utilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosUtilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosMarcos V. Saturno Ribeiro
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...Pedro Príncipe
 

Ähnlich wie Gestão de Dados Governamentais como LOD (20)

Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo Sociedade
 
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontes
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontesCiência aberto, diretrizes FAIR, etapas de viabilização e horizontes
Ciência aberto, diretrizes FAIR, etapas de viabilização e horizontes
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
 
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
 
Plataformas digitais de serviço público e a prova digital
Plataformas digitais de serviço público e a prova digitalPlataformas digitais de serviço público e a prova digital
Plataformas digitais de serviço público e a prova digital
 
Integração de dados
Integração de dadosIntegração de dados
Integração de dados
 
O Bibliotecário como gestor de Projetos em TIC
 O Bibliotecário como gestor de Projetos em TIC O Bibliotecário como gestor de Projetos em TIC
O Bibliotecário como gestor de Projetos em TIC
 
Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Infraestrutura nacional de dados espaciais wadih joão scandar neto
Infraestrutura nacional de dados espaciais   wadih joão scandar netoInfraestrutura nacional de dados espaciais   wadih joão scandar neto
Infraestrutura nacional de dados espaciais wadih joão scandar neto
 
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?Apresentação Dados Abertos: cidadania ou oportunidades para empresas?
Apresentação Dados Abertos: cidadania ou oportunidades para empresas?
 
José luiz ribeiro
José luiz ribeiroJosé luiz ribeiro
José luiz ribeiro
 
Interoperabilidade dados abertos
Interoperabilidade dados abertosInteroperabilidade dados abertos
Interoperabilidade dados abertos
 
Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...Findability: elementos essenciais para a recuperação da informação em ambient...
Findability: elementos essenciais para a recuperação da informação em ambient...
 
Dados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoDados Abertos para o Controle Externo
Dados Abertos para o Controle Externo
 
Web semantica na prática
Web semantica na práticaWeb semantica na prática
Web semantica na prática
 
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidad...
 
Fatores Criticos de SUcesso
Fatores Criticos de SUcessoFatores Criticos de SUcesso
Fatores Criticos de SUcesso
 
Utilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertosUtilização de Big Data em portais de dados abertos
Utilização de Big Data em portais de dados abertos
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
 

Gestão de Dados Governamentais como LOD

  • 1. An approach for managing and semantically enriching the publication of Linked Open Governmental Data Kelli de Faria Cordeiro1, Fabricio Firmino de Faria1, Bianca de Oliveira Pereira1,2, André Freitas2, Cristiano Expedito Ribeiro1, João Vitor Villas Boas Freitas1, Ana Christina Bringuente3, Lucas de Oliveira Arantes3, Rodrigo Calhau3, Veruska Zamborlini3, Maria Luiza Machado Campos1, Giancarlo Guizzardi3 1Graduate Program in Informatics (PPGI) Federal University of Rio de Janeiro (UFRJ) – Brazil 2Digital Enterprise Research Institute (DERI) National University of Ireland – Galway – Ireland 3Ontology and Conceptual Modeling Research Group (NEMO) – Computer Science Department – Federal University of Espírito Santo (UFES) – Brazil
  • 2. Agenda • Motivação e contextualização • Cenário Atual em Dados Abertos Interligados (LOD) • Projeto LinkedDataBR • ETL Workflow • Tratamento Semântico Incremental • Estudo de Caso • Considerações finais An approach for managing and semantically enriching the publication of Linked Open Governmental Data 2
  • 3. Motivação e contextualização An approach for managing and semantically enriching the publication of Linked Open Governmental Data 3
  • 4. Motivação e contextualização Estão abertos? An approach for managing and semantically enriching the publication of Linked Open Governmental Data 4
  • 5. Motivação e contextualização RNP CAPES CNPq Uso conjunto é ainda um desafio! An approach for managing and semantically enriching the publication of Linked Open Governmental Data 5
  • 6. Motivação e contextualização • Interoperabilidade e Integração de dados na Web ainda requerem considerável esforço – Mesmo dentro de uma organização! . Tivemos SGBD por mais de meio século, mas conseguimos a integração que se pretendia? O que faltou ? – E agora, na Web: • Distribuídos, heterogêneos, em grande escala, altamente visíveis, grande número de diferentes usuários, … An approach for managing and semantically enriching the publication of Linked Open Governmental Data 6
  • 7. Linked Open Data (LOD) • LOD pode ser considerado uma abordagem mais simplista de uso de tecnologias da Web Semântica • Baseada em triplas (RDF) para representar os dados de forma realmente “granular” – Facilita a interligação – Acompanhado de um descritor • Abordagem pay-as-you-go An approach for managing and semantically enriching the publication of Linked Open Governmental Data 7
  • 8. Linked Open Data (LOD) – O que vem a ser Dados Abertos Interligados? • Utilização ampla de padrões • Representação de dados em um grão mínimo (triplas RDF) – Flexibilidade nas ligações entre itens de dados • Tem a interoperabilidade em sua essência – RDF: Resource DESCRIPTION Framework » Criado para interoperar METADADOS! – Descritores estão na base da proposta An approach for managing and semantically enriching the publication of Linked Open Governmental Data 8
  • 9. Linked Open Data (LOD) – Uma maneira “nova” de publicar e consumir dados! • O poder das ligações tipadas • O poder da colaboração – Consumidores podem ser publicadores também! • Mais e mais dados sendo gerados e potencialmente “ligáveis” – Sensores e Web das Coisas • Dados e metadados sendo explorados juntos em novas aplicações • Consulta E Navegação E Busca! An approach for managing and semantically enriching the publication of Linked Open Governmental Data 9
  • 10. Dados publicados como LOD 265 datasets - 32 bilhões de triplas - 42% de dados de governo Setembro de 2011 Até quando conseguiremos representar esta nuvem? An approach for managing and semantically enriching the publication of Linked Open Governmental Data 10
  • 11. Cenário Atual - Internacional • Muitas iniciativas de governo – Governo Britânico, Estados Unidos, Espanha, etc. – Diferentes abordagens – Entrando em fase mais madura • Muitas iniciativas do setor privado – BBC, New York Times, ... • Muitas iniciativas em e-Ciência – Dados genômicos, dados de meio-ambiente,... • Forte envolvimento da área acadêmica – Consórcio W3C, Sir Tim Berners Lee (MIT) – DERI/NUI (Irlanda), Univ. Berlim (Alemanha), Univ. de Madri (Espanha) – Projeto LOD2 An approach for managing and semantically enriching the publication of Linked Open Governmental Data 11
  • 12. Cenário Atual - Internacional • Grande diversidade de ferramentas – Ainda sendo experimentadas – Foco em atividades específicas de publicação, consumo e colaboração – Ainda razoável esforço requerido para seu uso conjunto • Abordagem liberal – Prioridade para “expor” os dados e depois ir complementando sua descrição – Uso de ontologias ainda incipiente – Processo de publicação muito artesanal – Qualidade do dado publicado ainda pouco rastreável • Entrando em fase de amadurecimento – Maior preocupação com semântica e descritores – Frameworks para integração de ferramentas sendo discutidos An approach for managing and semantically enriching the publication of Linked Open Governmental Data 12
  • 13. Cenário Atual - Nacional • Inicialmente evoluindo sobre pesquisas e aplicações da Web Semântica e Ontologias • PUC-RJ, UFRJ, UFES, PUC-RJ, PUC-RS, … • Interesse crescente no Governo: – Inicialmente uma certa confusão com dados abertos – Acordo assinado entre o Brasil, EUA e mais 6 países – Tema do CONSEGI deste ano – Ministério do Planejamento : • Cria o INDA – Infraestrutura Nacional de Dados Abertos • Baseada em LOD e uso de ontologias – Apoio do W3C Brasil e CGI/BR • Cria o GT Ontologias – Iniciativas experimentais em LOD • Experimentos pontuais -> simples conversão de dados e interfaces atraentes • Tecnologia ainda pouco conhecida An approach for managing and semantically enriching the publication of Linked Open Governmental Data 13
  • 14. Linked LinkedDataBR An approach for managing and semantically enriching the publication of Linked Open Governmental Data
  • 15. Nossa Abordagem Linked • Alguns domínios requerem uma abordagem sistemática que garanta: – Maior controle do processo – Manutenção da consistência dos dados sendo publicados • Este é o caso de: – Dados Governamentais – Dados de e-Ciência • Necessário adotar uma abordagem de “gestão de dados” An approach for managing and semantically enriching the publication of Linked Open Governmental Data 15
  • 16. LinkedDataBR - FOCO Linked • Foco – no apoio ao processo de publicação – na qualidade do dado • Característica da solução: – Plataforma integrada e flexível – Maximização no reuso de ferramentas existentes (software livre) – Explorar: • Gerência de metadados • Apoio ao processo com ferramenta de workflow (ETL) • Tratamento Semântico An approach for managing and semantically enriching the publication of Linked Open Governmental Data
  • 17. LinkedDataBR - FOCO Linked LinkedDataBR Feed/Expose Treatment Process LinkedDataCloud Governmental and Non Governmental Entities Pre- Universities and Research Processing Triplification Linking Institutes Data Producers Consumers Requests Governmental and Non URI Governmental Entities Provenance Vocabulary Triples Responses Universities and Research Ontology Linked Data Institutes Citizen and Private Repository Queries Companies Consume/Explore An approach for managing and semantically enriching the publication of Linked Open Governmental Data 17
  • 18. Projeto LinkedDataBR Linked • Objetivos – Construção de uma infra-estrutura inicial de suporte à publicação e criação de repositórios de dados abertos utilizando os padrões de Linked Data E ainda: – Criação de diretrizes associadas ao processo de publicação – Criação de grupo de interesse e mobilização para apoio e estímulo à iniciativa de Linked Open Data no Brasil e sua inserção no cenário mundial de dados abertos interligados. An approach for managing and semantically enriching the publication of Linked Open Governmental Data 18
  • 19. Projeto LinkedDataBR Linked • Arquitetura An approach for managing and semantically enriching the publication of Linked Open Governmental Data 19
  • 20. ETL Workflow (Captura de Proveniência) Publishing Workflow Process Extract Transform Load Stage Triplify Linking Workflow Implementation Design Raw Government Triples Data Provenance Prospective Provenance Data Triples Workflow Implementation Execution Linked Open Government Data Retrospective Provenance Data An approach for managing and semantically enriching the publication of Linked Open Governmental Data 20
  • 21. Publicação de Dados Abertos Ligados ABORDAGENS PARA O ENRIQUECIMENTO SEMÂNTICO 21 An approach for managing and semantically enriching the publication of Linked Open Governmental Data 21
  • 22. Ausência de preocupação com a semântica An approach for managing and semantically enriching the publication of Linked Open Governmental Data 22
  • 23. Alguma preocupação com a semântica An approach for managing and semantically enriching the publication of Linked Open Governmental Data 23
  • 24. Preocupação mediana com a semântica An approach for managing and semantically enriching the publication of Linked Open Governmental Data 24
  • 25. Muita preocupação com a semântica An approach for managing and semantically enriching the publication of Linked Open Governmental Data 25
  • 26. Linked Exemplo de Cenário de Publicação de Dados Interligados An approach for managing and semantically enriching the publication of Linked Open Governmental Data 26
  • 27. Cenário de Aplicação C&T Cenário de Financiamentos de Projetos de Pesquisa Projetos de Currículos de Instituições de Pesquisa Pesquisadores Pesquisa tem participação RNP tem Lattes de instituição eMec tem FNDCT participação de Grupos de Pesquisa - CNPq GP-CNPq 27
  • 28. Exemplo do Processo de Publicação Tratamento Triplificação Ligação
  • 32. Resultado swrc:Project Projetos GrupoTrabalho Instituticao Grafos interligados RNP “LinkedDataBR” WGFase LODBR temNome temFase temInsituicao UFRJ LODBR_Ph1 “Universidade temNome Federal do Rio temSigla Participante temParticipacaoDe do Janeiro” “UFRJ” swrc:University temNome “Maria Luiza CNPq CV Lattes MLMC M. Campos” Pesquisador eMec Instituições “Maria Luiza UFRJ temNome Machado Campos” temNome MLMC “UFRJ” “UFRJ” swrc:Person temLocalOferta enderecoProfissional temSigla 2009 temAno temPublicacao “Universidade RioJ Federal do Rio “CrossMDA: a Model- MLMC0232 Grupos de Pesquisa CNPq do Janeiro” driven Approach for temTitulo MLMC “Maria Luiza Aspect Management” temNome M.Campos” Publicacao temParticipante “Grupo temArea Engenharia do swrc:Publication GRECO Predominante Conhecimento” swrc:ResearchGroup temNome “Knowledge Engineering” An approach for managing and semantically enriching the publication of Linked Open Governmental Data
  • 33. Resultado ... <rdf:Description rdf:about="http://www.rnp.br/resource/LDBR_Ph1"> <rdf:type rdf:resource="http://www.rnp.br/ontology/WGPhase"/> <rnp:hasParticipationOf rdf:resource="http://www.rnp.br/resource/MLMC"/> </rdf:Description> ... <rdf:Description rdf:about="http://www.rnp.br/resource/MLMC"> <rdf:type rdf:resource="http://www.rnp.br/ontology/Participant"/> <rdf:type rdf:resource="http://swrc.ontoware.org/ontology/Person"/> <rnp:hasFullName> Maria Luiza Machado Campos </rnp:hasFullName> <owl:sameAs rdf:resource="http://lattes.cnpq.br/resource/MLMC"/> <owl:sameAs rdf:resource="http://www.cnpq.br/resource/MLMC"/> </rdf:Description> ... An approach for managing and semantically enriching the publication of Linked Open Governmental Data 33
  • 34. Considerações Finais • Iniciativas nacionais e internacionais pela transparência das ações governamentais e participação do cidadão. • Dado Aberto possui um papel fundamental, mas o valor real do dado é revelado se os dados são explorados em conjunto. • LOD é uma abordagem de interoperabilidade e integração • Em LOGD é essencial considerar algumas garantias de qualidade e estratégias de interoperabilidade • Plataforma do LinkedDataBR e a abordagem de enriquecimento semântico incremental • Concebida para apoiar os publicadores e gestores de dados de governo • O potencial da colaboração do cidadão (wisdom of the crowds) desempenhará um papel importante no mapeamento e ligação. An approach for managing and semantically enriching the publication of Linked Open Governmental Data 34
  • 35. An approach for managing and semantically enriching the publication of Linked Open Governmental Data http://greco.ppgi.ufrj.br/gtlinkedbr/ Kelli de Faria Cordeiro1, Fabricio Firmino de Faria1, Bianca de Oliveira Pereira1,2, André Freitas2, Cristiano Expedito Ribeiro1, João Vitor Villas Boas Freitas1, Ana Christina Bringuente3, Lucas de Oliveira Arantes3, Rodrigo Calhau3, Veruska Zamborlini3, Maria Luiza Machado Campos1, Giancarlo Guizzardi3 1Graduate Program in Informatics (PPGI) Federal University of Rio de Janeiro (UFRJ) – Brazil 2Digital Enterprise Research Institute (DERI) National University of Ireland – Galway – Ireland 3Ontology and Conceptual Modeling Research Group (NEMO) – Computer Science Department – Federal University of Espírito Santo (UFES) – Brazil