SlideShare ist ein Scribd-Unternehmen logo
1 von 21
Downloaden Sie, um offline zu lesen
Repositório	
  de	
  dados	
  na	
  U.Porto	
  	
  

      Um	
  fluxo	
  de	
  curadoria	
  suportado	
  
        numa	
  extensão	
  ao	
  DSpace	
  	
  


                      Cris:na	
  Ribeiro	
   DEI-­‐	
  FEUP/	
  INESC	
  TEC	
  
                João	
  Rocha	
  da	
  Silva	
   FEUP	
  
        Eugénia	
  Matos	
  Fernandes	
   Reitoria	
  da	
  Universidade	
  do	
  Porto	
  
                 João	
  Correia	
  Lopes	
   DEI-­‐	
  FEUP/	
  INESC	
  TEC	
  
Conteúdo	
  
•    Obje:vos	
  
•    Auditoria	
  de	
  dados	
  na	
  U.Porto	
  
•    Desenho	
  de	
  um	
  workflow	
  de	
  gestão	
  de	
  dados	
  
•    Construção	
  de	
  um	
  protó:po	
  de	
  repositório	
  
•    Conclusões	
  e	
  trabalhos	
  futuros	
  
Obje:vos	
  

•  Determinar	
  as	
  necessidades	
  de	
  gestão	
  de	
  
   dados	
  dos	
  inves:gadores	
  da	
  U.Porto	
  
•  Desenhar	
  e	
  implementar	
  um	
  repositório	
  de	
  
   dados	
  para	
  sa:sfazer	
  estas	
  necessidades	
  
•  Procurar	
  uma	
  solução	
  que	
  não	
  esteja	
  limitada	
  
   às	
  necessidades	
  de	
  um	
  só	
  grupo	
  
Sa:sfazer	
  
                      obje:vos	
  
 Objetivo


             • 
                           	
  
                  Representar	
  dados	
  
                  tabulares	
  em	
  
                  formatos	
  próprios	
  
                  para	
  preservação	
  
                   –  XML	
  
             •  Interrogação	
  online	
  
             •  Reu:lização	
  de	
  
Status Quo
                descritores	
  nos	
  
                metadados	
  
Fase	
  1	
  :	
  Entrevistas	
  

         Recolha	
  de	
  dados	
  e	
  
         de	
  casos	
  de	
  uso	
  

             Especificação	
  do	
  
             workflow	
  

                 Construção	
  da	
  
                 plataforma	
  


                     Depósito	
  de	
  dados	
  
Auditoria	
  de	
  dados	
  
•  Entrevistas	
  com	
  inves:gadores	
  
   –  Engenharia,	
  ciências	
  sociais,	
  educação,	
  ciências	
  da	
  
      terra,	
  biologia,	
  economia,	
  …	
  	
  
•  Recolha	
  de	
  amostras	
  de	
  dados	
  
•  Recolha	
  de	
  casos	
  de	
  uso	
  
•  Relatório	
  e	
  resultados	
  subme:dos	
  a	
  
   aprovação	
  dos	
  inves:gadores	
  
Os	
  inves:gadores	
  dizem	
  
•  …	
  a	
  gestão	
  de	
  dados	
  é	
  complexa	
  
•  …	
  a	
  gestão	
  de	
  dados	
  não	
  deveria	
  distraí-­‐los	
  do	
  
   seu	
  trabalho	
  
•  …	
  precisam	
  de	
  apoio	
  profissional	
  na	
  gestão	
  de	
  
   dados	
  
•  …	
  “o	
  que	
  ganho	
  em	
  guardar	
  os	
  meus	
  dados	
  
   num	
  repositório?	
  Os	
  discos	
  externos	
  são	
  tão	
  
   baratos!”	
  
Os	
  inves:gadores	
  dizem	
  
•  …	
  já	
  perderam	
  dados	
  devido	
  a	
  formatos	
  que	
  
   foram	
  abandonados	
  
•  …	
  precisam	
  de	
  sí:o	
  para	
  par:lhar	
  dados	
  com	
  
   parceiros,	
  em	
  vez	
  de	
  usarem	
  o	
  email	
  
•  …	
  precisam	
  de	
  ferramentas	
  para	
  manipulação	
  
   de	
  dados	
  online	
  
Preocupações	
  e	
  necessidade	
  dos	
  
              inves:gadores	
  
•  “Os	
  repositórios	
  não	
  podem	
  ser	
  cemitérios	
  	
  de	
  
   dados”	
  

•  “O	
  principal	
  obje:vo	
  na	
  preservação	
  de	
  dados	
  
   é	
  a	
  par:lha/	
  reu:lização/	
  citação”	
  

•  “Os	
  dados	
  têm	
  de	
  ser	
  bem	
  anotados	
  ou	
  não	
  
     podem	
  ser	
  usados	
  para	
  validar	
  resultados	
  
	
  
Fase	
  2	
  :	
  Modificar	
  o	
  workflow	
  

                Recolha	
  de	
  dados	
  e	
  
                de	
  casos	
  de	
  uso	
  

                    Especificação	
  do	
  
                    workflow	
  

                        Construção	
  da	
  
                        plataforma	
  


                            Depósito	
  de	
  dados	
  
O	
  Papel	
  do	
  “Curador	
  de	
  Dados”	
  

                        Dados


Investigador                             Curador
Reunião	
  de	
  curadoria	
  




           Reunião

                          Dados
                         Curados
Anotação	
  de	
  dados	
  
                                                                                   Elementos	
  	
  do	
  XML	
  
                                                                                   Schema	
  	
  
dc:contributor.author   Silva, João Rocha
                                                                                   do	
  domínio	
  como	
  
  dc:lastModified
      dc:title
                            01-01-2011
                        Azores GPS Run
                                                 Table-level
                                                  metadata
                                                                                   descritores	
  
     dc:rights
            END_METADATA
                        License: CC ShareAlike
                                                                                   e	
  colunas	
  
  time.gps_sow                latitude             longitude     gravity.specific       Dimensions
 488496.999194             38.760267507          -27.084113730    -53.750371
 488497.999193             38.760267485          -27.084113744    -67.168032
 488498.999192             38.760267506          -27.084113739    -80.584969
 488499.999191             38.760267489          -27.084113743    -93.994527
 488500.999190             38.760267493          -27.084113746   -107.391006           Data




 Terceira         Flores
Depois	
  da	
  reunião	
  




                                    Repositório
Dados+Metadados	
  em	
  formato	
  Excel	
  
Dados	
  disponíveis	
  
                      Repositório de dados de investigação



    Investigador




•  Explorar,	
  filtrar	
  e	
  descarregar	
  só	
  o	
  necessário	
  
Fase	
  3	
  :	
  Construir	
  ferramentas	
  de	
  
         suporte	
  ao	
  workflow	
  

                  Recolha	
  de	
  dados	
  e	
  
                  de	
  casos	
  de	
  uso	
  

                      Especificação	
  do	
  
                      workflow	
  

                          Construção	
  da	
  
                          plataforma	
  


                              Depósito	
  de	
  dados	
  
Investigador              Curador

                                                             Folha Excel
                                                                                          Ficheiro
Pedido de filtragem de dados                                 correctamente
                                                                                          Original
                                                             preenchida
         3
           Tabela
          Dinâmica
                                                                                            Core
                                                            1                              DSpace
                                                                 Página de
                                                                  depósito
                                         Interrogação
                                        XQuery FLWOR             2
        Interrogação
           (JSON)
                           4      Tradutor              Acesso                Documento
                                                                     Leitor
                                     de                   a
                                                                     XLSX
                                                                              Traduzido
                               Interrogações            dados                   (XML)

                                                                 XML Manager

                                                   Resultados
                                               (Dados + Metadados)

                                 Tabela                              5
                               Formatada         Transformação
                                                     XSLT


                               Módulo de dados de investigação UPData
Fase	
  4	
  :	
  Testar	
  ferramenta	
  com	
  dados	
  
                              reais	
  

                     Recolha	
  de	
  dados	
  e	
  
                     de	
  casos	
  de	
  uso	
  

                         Especificação	
  do	
  
                         workflow	
  

                             Construção	
  da	
  
                             plataforma	
  


                                 Depósito	
  de	
  dados	
  
Conclusões	
  e	
  Trabalho	
  Futuro	
  
•  Recolhemos	
  requisitos	
  e	
  casos	
  de	
  uso	
  dos	
  
   inves:gadores	
  da	
  U.Porto	
  
•  Casos	
  de	
  uso	
  mais	
  importantes	
  foram	
  implementados	
  
   em	
  repositório	
  DSpace	
  
•  U:lizadores	
  podem	
  navegar	
  sobre	
  dados	
  online	
  no	
  
   repositório	
  e	
  descarregar	
  subconjuntos	
  selecionados	
  
•  Futuro:	
  	
  
     –  Validação	
  de	
  ferramentas	
  com	
  u:lizadores	
  
     –  Métodos	
  mais	
  simples	
  de	
  interação	
  entre	
  inves:gadores	
  e	
  
        repositório	
  
Contactos	
  e	
  ligações	
  
              Cris:na	
  Ribeiro	
         mcr@fe.up.pt	
  

        João	
  Rocha	
  da	
  Silva	
     joaorosilva@gmail.com	
  
                                           	
  
Eugénia	
  Matos	
  Fernandes	
            efernand@reit.up.pt	
  
                                           	
  
        João	
  Correia	
  Lopes	
  	
     jlopes@fe.up.pt	
  
                                           	
  



Repositório:	
  hjp://sciencedata.up.pt/	
  
Documentos:	
  hjp://sciencedata.up.pt/doc	
  

Weitere ähnliche Inhalte

Was ist angesagt?

Aula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dadosAula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dados
wapiva
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma biblioteca
David Canjamba 2D
 

Was ist angesagt? (17)

Aprendendo R
Aprendendo RAprendendo R
Aprendendo R
 
Scc0241m01revisao
Scc0241m01revisaoScc0241m01revisao
Scc0241m01revisao
 
Bancodedados
BancodedadosBancodedados
Bancodedados
 
Banco de Dados (parte 01)
Banco de Dados (parte 01)Banco de Dados (parte 01)
Banco de Dados (parte 01)
 
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
 
Formatose padrões(1)
Formatose padrões(1)Formatose padrões(1)
Formatose padrões(1)
 
Bancos de Dados para Bibliotecarios
Bancos de Dados para BibliotecariosBancos de Dados para Bibliotecarios
Bancos de Dados para Bibliotecarios
 
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosBanco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
 
pSets TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
pSets TSI33A - Banco de Dados I (TSI UTFPR-Toledo)pSets TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
pSets TSI33A - Banco de Dados I (TSI UTFPR-Toledo)
 
Banco de Dados I - Aula 05 - Banco de Dados Relacional (Modelo Conceitual)
Banco de Dados I - Aula 05 - Banco de Dados Relacional (Modelo Conceitual)Banco de Dados I - Aula 05 - Banco de Dados Relacional (Modelo Conceitual)
Banco de Dados I - Aula 05 - Banco de Dados Relacional (Modelo Conceitual)
 
SGBD Oracle
SGBD OracleSGBD Oracle
SGBD Oracle
 
Oracle EXPLICAÇÕES EM PDF
Oracle EXPLICAÇÕES EM PDFOracle EXPLICAÇÕES EM PDF
Oracle EXPLICAÇÕES EM PDF
 
Funcionalidades Oracle
Funcionalidades OracleFuncionalidades Oracle
Funcionalidades Oracle
 
Hive vs impala vs spark - tuning
Hive vs impala vs spark - tuningHive vs impala vs spark - tuning
Hive vs impala vs spark - tuning
 
Aula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dadosAula tecnologia da informacao 6 banco de dados
Aula tecnologia da informacao 6 banco de dados
 
Banco de Dados II Aula 06 - Modelagem de Dados (Modelo Físico)
Banco de Dados II Aula 06 - Modelagem de Dados (Modelo Físico)Banco de Dados II Aula 06 - Modelagem de Dados (Modelo Físico)
Banco de Dados II Aula 06 - Modelagem de Dados (Modelo Físico)
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma biblioteca
 

Ähnlich wie Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
iMasters
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dados
lrmodesto
 
Documentação da infraestrutura de rede
Documentação da infraestrutura de redeDocumentação da infraestrutura de rede
Documentação da infraestrutura de rede
Marcos Monteiro
 
Processos iniciais do mapeamento OR
Processos iniciais do mapeamento ORProcessos iniciais do mapeamento OR
Processos iniciais do mapeamento OR
Nécio de Lima Veras
 

Ähnlich wie Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace (20)

Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...
Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...
Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...
 
UPBox e DataNotes: ferramentas colaborativas para dados de investigação em do...
UPBox e DataNotes: ferramentas colaborativas para dados de investigação em do...UPBox e DataNotes: ferramentas colaborativas para dados de investigação em do...
UPBox e DataNotes: ferramentas colaborativas para dados de investigação em do...
 
DP-900-BR-01.pptx
DP-900-BR-01.pptxDP-900-BR-01.pptx
DP-900-BR-01.pptx
 
Tecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensTecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvens
 
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 
Big data para programadores convencionais
Big data para programadores convencionaisBig data para programadores convencionais
Big data para programadores convencionais
 
TechEd 2011: Raio-X do SQL Server: Arquitetura Interna do Gerenciador de Ban...
TechEd 2011: Raio-X do SQL Server: Arquitetura Interna do Gerenciador de Ban...TechEd 2011: Raio-X do SQL Server: Arquitetura Interna do Gerenciador de Ban...
TechEd 2011: Raio-X do SQL Server: Arquitetura Interna do Gerenciador de Ban...
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dados
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
 
Módulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpaceMódulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpace
 
Bi microsoft & pentaho
Bi microsoft & pentahoBi microsoft & pentaho
Bi microsoft & pentaho
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
De 1 a 1.000.00 de usuários
De 1 a 1.000.00 de usuáriosDe 1 a 1.000.00 de usuários
De 1 a 1.000.00 de usuários
 
Documentação da infraestrutura de rede
Documentação da infraestrutura de redeDocumentação da infraestrutura de rede
Documentação da infraestrutura de rede
 
Apostila oracle
Apostila oracleApostila oracle
Apostila oracle
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Processos iniciais do mapeamento OR
Processos iniciais do mapeamento ORProcessos iniciais do mapeamento OR
Processos iniciais do mapeamento OR
 
PostgreSQL-Prático.pdf
PostgreSQL-Prático.pdfPostgreSQL-Prático.pdf
PostgreSQL-Prático.pdf
 
Pentaho JUG Vale 2012
Pentaho JUG Vale 2012Pentaho JUG Vale 2012
Pentaho JUG Vale 2012
 

Mehr von Conferência Luso-Brasileira de Ciência Aberta

Mehr von Conferência Luso-Brasileira de Ciência Aberta (20)

Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...
 
Pré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição EletrónicaPré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição Eletrónica
 
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
 
10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA
 
Programa de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência AbertaPrograma de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência Aberta
 
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso AbertoAnálise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
 
Acesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do pacienteAcesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do paciente
 
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
 
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
 
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
 
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
 
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
 
Serviço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOIServiço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOI
 
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
 
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
 
Preservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidadePreservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidade
 
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
 
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em PortugalDo acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
 
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
 
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
 

Kürzlich hochgeladen

Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
Natalia Granato
 

Kürzlich hochgeladen (6)

ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 

Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace

  • 1. Repositório  de  dados  na  U.Porto     Um  fluxo  de  curadoria  suportado   numa  extensão  ao  DSpace     Cris:na  Ribeiro   DEI-­‐  FEUP/  INESC  TEC   João  Rocha  da  Silva   FEUP   Eugénia  Matos  Fernandes   Reitoria  da  Universidade  do  Porto   João  Correia  Lopes   DEI-­‐  FEUP/  INESC  TEC  
  • 2. Conteúdo   •  Obje:vos   •  Auditoria  de  dados  na  U.Porto   •  Desenho  de  um  workflow  de  gestão  de  dados   •  Construção  de  um  protó:po  de  repositório   •  Conclusões  e  trabalhos  futuros  
  • 3. Obje:vos   •  Determinar  as  necessidades  de  gestão  de   dados  dos  inves:gadores  da  U.Porto   •  Desenhar  e  implementar  um  repositório  de   dados  para  sa:sfazer  estas  necessidades   •  Procurar  uma  solução  que  não  esteja  limitada   às  necessidades  de  um  só  grupo  
  • 4. Sa:sfazer   obje:vos   Objetivo •    Representar  dados   tabulares  em   formatos  próprios   para  preservação   –  XML   •  Interrogação  online   •  Reu:lização  de   Status Quo descritores  nos   metadados  
  • 5. Fase  1  :  Entrevistas   Recolha  de  dados  e   de  casos  de  uso   Especificação  do   workflow   Construção  da   plataforma   Depósito  de  dados  
  • 6. Auditoria  de  dados   •  Entrevistas  com  inves:gadores   –  Engenharia,  ciências  sociais,  educação,  ciências  da   terra,  biologia,  economia,  …     •  Recolha  de  amostras  de  dados   •  Recolha  de  casos  de  uso   •  Relatório  e  resultados  subme:dos  a   aprovação  dos  inves:gadores  
  • 7. Os  inves:gadores  dizem   •  …  a  gestão  de  dados  é  complexa   •  …  a  gestão  de  dados  não  deveria  distraí-­‐los  do   seu  trabalho   •  …  precisam  de  apoio  profissional  na  gestão  de   dados   •  …  “o  que  ganho  em  guardar  os  meus  dados   num  repositório?  Os  discos  externos  são  tão   baratos!”  
  • 8. Os  inves:gadores  dizem   •  …  já  perderam  dados  devido  a  formatos  que   foram  abandonados   •  …  precisam  de  sí:o  para  par:lhar  dados  com   parceiros,  em  vez  de  usarem  o  email   •  …  precisam  de  ferramentas  para  manipulação   de  dados  online  
  • 9. Preocupações  e  necessidade  dos   inves:gadores   •  “Os  repositórios  não  podem  ser  cemitérios    de   dados”   •  “O  principal  obje:vo  na  preservação  de  dados   é  a  par:lha/  reu:lização/  citação”   •  “Os  dados  têm  de  ser  bem  anotados  ou  não   podem  ser  usados  para  validar  resultados    
  • 10. Fase  2  :  Modificar  o  workflow   Recolha  de  dados  e   de  casos  de  uso   Especificação  do   workflow   Construção  da   plataforma   Depósito  de  dados  
  • 11. O  Papel  do  “Curador  de  Dados”   Dados Investigador Curador
  • 12. Reunião  de  curadoria   Reunião Dados Curados
  • 13. Anotação  de  dados   Elementos    do  XML   Schema     dc:contributor.author Silva, João Rocha do  domínio  como   dc:lastModified dc:title 01-01-2011 Azores GPS Run Table-level metadata descritores   dc:rights END_METADATA License: CC ShareAlike e  colunas   time.gps_sow latitude longitude gravity.specific Dimensions 488496.999194 38.760267507 -27.084113730 -53.750371 488497.999193 38.760267485 -27.084113744 -67.168032 488498.999192 38.760267506 -27.084113739 -80.584969 488499.999191 38.760267489 -27.084113743 -93.994527 488500.999190 38.760267493 -27.084113746 -107.391006 Data Terceira Flores
  • 14. Depois  da  reunião   Repositório Dados+Metadados  em  formato  Excel  
  • 15. Dados  disponíveis   Repositório de dados de investigação Investigador •  Explorar,  filtrar  e  descarregar  só  o  necessário  
  • 16. Fase  3  :  Construir  ferramentas  de   suporte  ao  workflow   Recolha  de  dados  e   de  casos  de  uso   Especificação  do   workflow   Construção  da   plataforma   Depósito  de  dados  
  • 17. Investigador Curador Folha Excel Ficheiro Pedido de filtragem de dados correctamente Original preenchida 3 Tabela Dinâmica Core 1 DSpace Página de depósito Interrogação XQuery FLWOR 2 Interrogação (JSON) 4 Tradutor Acesso Documento Leitor de a XLSX Traduzido Interrogações dados (XML) XML Manager Resultados (Dados + Metadados) Tabela 5 Formatada Transformação XSLT Módulo de dados de investigação UPData
  • 18.
  • 19. Fase  4  :  Testar  ferramenta  com  dados   reais   Recolha  de  dados  e   de  casos  de  uso   Especificação  do   workflow   Construção  da   plataforma   Depósito  de  dados  
  • 20. Conclusões  e  Trabalho  Futuro   •  Recolhemos  requisitos  e  casos  de  uso  dos   inves:gadores  da  U.Porto   •  Casos  de  uso  mais  importantes  foram  implementados   em  repositório  DSpace   •  U:lizadores  podem  navegar  sobre  dados  online  no   repositório  e  descarregar  subconjuntos  selecionados   •  Futuro:     –  Validação  de  ferramentas  com  u:lizadores   –  Métodos  mais  simples  de  interação  entre  inves:gadores  e   repositório  
  • 21. Contactos  e  ligações   Cris:na  Ribeiro   mcr@fe.up.pt   João  Rocha  da  Silva   joaorosilva@gmail.com     Eugénia  Matos  Fernandes   efernand@reit.up.pt     João  Correia  Lopes     jlopes@fe.up.pt     Repositório:  hjp://sciencedata.up.pt/   Documentos:  hjp://sciencedata.up.pt/doc