Apresentação da disciplina de Sistemas de Informações Gerenciais do curso de bacharelado em Adminsitração da UNESP de Tupã, em 2018. Mais informações em https://rodrigues.pro.br
Estudo de aderência entre padrões de representação de dados sobre entidades
Processo de Acesso a Dados e suas fases
1. Processo de Acesso a
Dados e suas fases
Fernando de Assis Rodrigues
Post-Doctoral Fellow @ UNESP
2. Rodrigues, F. A.
● Acesso a Dados
○ Coleta
○ Armazenamento
○ Recuperação
● Exposição prática
○ Contexto
○ Exemplificação
3. Rodrigues, F. A.
Qual a questão chave?
● Produção Científica
○ Importante para a disseminação do conhecimento científico
gerado por um pesquisador ou um grupo de pesquisadores
○ Visibilidade ao pesquisador → Networking
○ …
4. Rodrigues, F. A.
Qual a questão chave?
● Produção Científica no Brasil
○ Plataforma Lattes
“A Plataforma Lattes representa a experiência do CNPq na integração
de bases de dados de Currículos, de Grupos de pesquisa e de
Instituições em um único Sistema de Informações. Sua dimensão atual
se estende não só às ações de planejamento, gestão e
operacionalização do fomento do CNPq, mas também de outras
agências de fomento federais e estaduais, das fundações estaduais de
apoio à ciência e tecnologia, das instituições de ensino superior e dos
institutos de pesquisa. Além disso, se tornou estratégica não só para as
atividades de planejamento e gestão, mas também para a formulação
das políticas do Ministério de Ciência e Tecnologia e de outros órgãos
governamentais da área de ciência, tecnologia e inovação.”
http://lattes.cnpq.br/
5. Rodrigues, F. A.
Qual a questão chave?
● Produção Científica no Brasil
○ Plataforma Lattes
○ Problema a ser abordado:
6. Rodrigues, F. A.
Qual é a questão chave?
A Plataforma Lattes não possui uma interface dedicada ao
acesso aos dados sobre pesquisadores e a produção
científica destes, principalmente as publicações em
periódicos científicos, o que impossibilita agentes externos a
coleta destes dados e, consequentemente, a análise e
construção de novas percepções sobre o contexto
acadêmico a partir não publicações cadastradas neste
Sistema de Informação, mas também da avaliação dos
periódicos científicos.
8. Rodrigues, F. A.
Sobre a Coleta
● Quais os dados necessários?
○ Dados sobre o Pesquisador/Estudante
■ Nome
■ URL para acesso ao Currículo Lattes
■ Data da última atualização do Currículo
■ Descrição informada pelo Pesquisador/Estudante
■ Nome em citações bibliográficas
9. Rodrigues, F. A.
Sobre a Coleta
● Quais os dados necessários?
○ Dados sobre a Produção publicada em Periódico Científico
■ Autores
■ Título
■ Nome do Periódico
■ Volume
■ Página
■ Ano
○ Dados sobre o periódico científico
■ Nome do Periódico
■ ISSN
■ Área de Avaliação
■ Extrato
10. Rodrigues, F. A.
Sobre a Coleta - Sobre cada Fonte
● Quais são as fontes disponíveis?
○ Plataforma Lattes → Currículo Lattes
■ Detentor: CNPq - Conselho Nacional de Desenvolvimento Científico
e Tecnológico
■ Acesso: acesso pela interface de pesquisa dos Currículos Lattes
cadastrados
■ Coletor: Fernando de Assis Rodrigues (Agente
Externo/Pesquisador)
■ Delimitada ou Contínua? Delimitada
■ Estruturação do Conteúdo: Não estruturado
■ Formato: Texto, em HTML
11. Rodrigues, F. A.
Sobre a Coleta - Sobre cada Fonte
● Quais são as fontes disponíveis?
○ Plataforma Lattes → Currículo Lattes
■ Metadados
● Identificadores: Nome, URL para acesso ao Currículo Lattes, Nome em citações
bibliográficas, Autores da Publicação, Título da Publicação e Título do Periódico
● Descritivos: Nome, Descrição informada pelo Pesquisador/Estudante, Autores da
Publicação, Título da Publicação e Título do Periódico
■ Sobre cada dado:
● Todos os tipos de dado estão no formato texto
18. Rodrigues, F. A.
Sobre a Coleta - Sobre cada Fonte
● Quais são as fontes disponíveis?
○ Plataforma Sucupira → Qualis-Periódicos
■ Detentor: CAPES - Coordenação de Aperfeiçoamento de Pessoal
de Nível Superior
■ Acesso: acesso pela interface de pesquisa do Qualis-Periódicos
■ Coletor: Fernando de Assis Rodrigues (Agente
Externo/Pesquisador)
■ Delimitada ou Contínua? Delimitada
■ Estruturação do Conteúdo: Estruturado
■ Formato: Texto, em tabela XLS
19. Rodrigues, F. A.
Sobre a Coleta - Sobre cada Fonte
● Quais são as fontes disponíveis?
○ Plataforma Sucupira → Qualis-Periódicos
■ Metadados
● Identificadores: ISSN e Título
● Descritivos: ISSN, Título, Área de Avaliação e Extrato
■ Sobre cada dado:
● Todos os tipos de dado estão no formato texto
25. Rodrigues, F. A.
Sobre a Coleta
● Sobre a Integração
○ Como as fontes utilizadas estão integradas?
■ Para agentes externos a estas organizações, não há integração das
fontes.
○ Quais dados que sustentam esta integração?
■ Título do periódico
● Sobre a Privacidade
○ Os dados coletados podem quebrar a privacidade?
■ Detentor → Sim, inclusive há um site só para explicar como isso
deve ser realizado → http://lattes.cnpq.br/web/plataforma-
lattes/extracao-de-dados/
■ Referenciado → Sim, pois pode (re)identificá-lo em outros contextos
como, por exemplo, o JusBrasil.
26. Rodrigues, F. A.
Sobre a Coleta
● Sobre a Qualidade
○ Tempestividade da Fonte:
■ Plataforma Lattes - Currículo Lattes: variada, pois depende de
atualização por cada autor
■ Plataforma Sucupira - Qualis-Periódico: trienal
○ Sobre a confiabilidade:
■ Plataforma Lattes - Currículo Lattes: baixa, pois os autores são os
responsáveis pela veracidade das informações cadastradas
■ Plataforma Sucupira - Qualis-Periódico: alta, pois trata-se de um
indicador de qualidade dos periódicos, avaliado por equipes e
colaboradores do CNPq
27. Rodrigues, F. A.
Sobre a Coleta
● Sobre os Direitos Autorais
○ O detentor de cada fonte identifica os critérios de acesso?
■ Plataforma Lattes - Currículo Lattes: Sim, em
http://lattes.cnpq.br/web/plataforma-lattes/extracao-de-dados/
■ Plataforma Sucupira - Qualis-Periódico: Não.
● Sobre a Disseminação
○ Quais identificadores coletados permitirão a recuperação?
■ Nome do pesquisador/estudante
■ Título do periódico
■ ISSN
■ Título do Artigo
■ Autores do Artigo
28. Rodrigues, F. A.
Sobre a Coleta
● Sobre a Preservação
○ Quais as garantias de perenidade da fonte?
■ Plataforma Lattes - Currículo Lattes: Baixa, pois os autores podem
cadastrar e remover os dados em qualquer momento.
■ Plataforma Sucupira - Qualis-Periódico: Alta, pois trata-se de
informação importante para a avaliação dos periódicos por
pesquisadores nacionais.
○ Existem fontes alternativas?
■ Plataforma Lattes - Currículo Lattes: Não.
■ Plataforma Sucupira - Qualis-Periódico: Não.
30. Rodrigues, F. A.
Sobre o Armazenamento
● Quais dados serão armazenados?
○ ISSN, Título, Área de Avaliação e Estrato ← Qualis-Periódicos
○ URL do Lattes, Nome, Nome em Citações Bibliográficas, Última
atualização e Descrição informada pelo Pesquisador/Estudante
← Currículo Lattes (Pesquisadores/Estudantes)
○ Autores , Título, Título do Periódico, Volume, Páginas e Ano de
Publicação ← Currículo Lattes (Publicações)
31. Rodrigues, F. A.
Sobre o Armazenamento
● Fonte delimitada ou contínua?
○ Contínua para Publicações e Autores
○ Delimitada para atualização de Qualis-Periódicos
● Em que suporte os dados serão armazenados?
○ Digital
● Qual a estruturação do conteúdo?
○ Tabela (Entidade/Relacionamento)
● Qual o formato?
○ Planilha eletrônica (Google Spreadsheets)
32. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre os metadados
○ Identificadores
■ Autor: URL do Lattes e Nome
■ Publicações: URL do Lattes e Título do Periódico
■ Qualis-Periódico: Título
○ Descritivos
■ Autor: Nome, Descrição informada pelo Pesquisador/Estudante
■ Publicações: Autores da Publicação, Título da Publicação, Título do
Periódico
■ Qualis-Periódico: ISSN, Título do Periódico, Área de Avaliação e
Extrato
33. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre cada dado
○ Todos os dados serão do tipo texto
● Quem responde por este suporte?
○ Fernando de Assis Rodrigues (Pesquisador)
34. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre a Integração
○ Quais os relacionamentos internos?
■ Autor se relaciona com Publicações. Publicações se relaciona com
Periódico. Periódico se relaciona com Avaliação Qualis-Periódicos
○ Quais os relacionamentos externos?
■ Autor se relaciona com Currículo Lattes
■ Periódico se relaciona com Avaliação Qualis-Periódicos.
○ Quais dados sustentam os relacionamentos?
■ URL do Lattes → Autor com Publicações e Autor com Currículo
Lattes
■ Título do Periódico → Publicações com Periódico e Periódico com
Avaliação Qualis-Periódicos.
35. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre a Privacidade
○ Os dados armazenados podem quebrar a privacidade?
■ Sim, do referenciado. O nome dele e a URL do Currículo Lattes
podem dar acesso a mais informações.
○ Quem tem acesso aos dados armazenados?
■ Público
● Sobre a Preservação
○ Existem cópias de segurança?
■ Sim. Backup em 2 computadores. Não há espelhamento.
36. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre a Qualidade
○ Qual a tempestividade do arquivo?
■ Mensal, a partir da aplicação de processo de atualização dos dados
por colaboradores
○ Qual a confiabilidade?
■ Média. Em parte, depende da veracidade dos dados coletados que
são inseridos pelo próprio autor
○ Qual a precisão dos dados?
■ Alta. Não há cortes em textos ou valores numéricos arredondados.
37. Rodrigues, F. A.
Sobre o Armazenamento
● Sobre os Direitos Autorais
○ Existe restrição para gerar cópias dos dados coletados?
■ Não, desde que citado a fonte.
● Sobre a Disseminação
○ Quais as alternativas físicas para acesso aos dados
armazenados?
■ Hardlink na página http://owl.tupa.unesp.br (a ser cadastrado) e
acesso pelo hiperlink da própria planilha (quando divulgado)
39. Rodrigues, F. A.
● Quem responde pela recuperação?
○ Fernando de Assis Rodrigues (Pesquisador)
○ OWL
● Quais dados podem ser disponibilizados?
○ Todos, pois se tratam de dados públicos
● Quem pode acessar estes dados?
○ Open Access
● Quem é o público-alvo?
○ Analistas de dados científicos, pesquisadores relacionados a
comunicação científica, estudantes e pesquisadores ligados a
temática de produção científica, entre outros.
Sobre a Recuperação
40. Rodrigues, F. A.
● Onde serão disponibilizados?
○ OWL
○ Google Drive
● Qual a estruturação do conteúdo?
○ Dados estruturados na forma de tabela
● Qual o formato?
○ Planilha eletrônica (Google Spreadsheet)
Sobre a Recuperação
41. Rodrigues, F. A.
● Sobre os metadados
○ Quais os identificadores?
■ Autor: URL do Lattes e Nome
■ Publicações: URL do Lattes, Título do Artigo e Título do Periódico
■ Qualis-Periódico: ISSN e Título do Periódico
○ Quais os descritivos?
■ Autor: Nome, Descrição informada pelo Pesquisador/Estudante
■ Publicações: Autores da Publicação, Título da Publicação, Título do
Periódico
■ Qualis-Periódico: ISSN, Título do Periódico, Área de Avaliação e
Extrato
Sobre a Recuperação
42. Rodrigues, F. A.
● Sobre cada dado
○ Quais o Tipo?
■ Todos os dados estão no formato texto
■ Quantidades estão no formato numérico, dentro do conjunto de
números inteiros positivos, incluindo o zero.
Sobre a Recuperação
43. Rodrigues, F. A.
● Sobre a Integração
○ Quais os relacionamentos internos?
■ Autor se relaciona com Publicações. Publicações se relaciona com
Periódico. Periódico se relaciona com Avaliação Qualis-Periódicos
○ Quais os relacionamentos externos?
■ Autor se relaciona com Currículo Lattes
■ Periódico se relaciona com Avaliação Qualis-Periódicos. *Potencial
○ Quais dados sustentam os relacionamentos?
■ URL do Lattes → Autor com Publicações e Autor com Currículo
Lattes
■ Título do Periódico → Publicações com Periódico e Periódico com
Avaliação Qualis-Periódicos.
Sobre a Recuperação
44. Rodrigues, F. A.
Sobre a Recuperação
● Sobre a Privacidade
○ Os dados armazenados podem quebrar a privacidade?
■ Sim, do referenciado. O nome dele e a URL do Currículo Lattes
podem dar acesso a mais informações.
● Sobre a Preservação
○ Como o acesso será garantido ao longo do tempo?
■ Hardlink no web site OWL (UNESP)
○ Perenidade da interface
■ Por tempo indefinido, com hyperlink estático.
○ Inclusão ou substituição dos dados?
■ Substituição do arquivo com a inclusão de novos dados. Também
utilizará o controle de versão, para acesso a dados de versões
anteriores.
45. Rodrigues, F. A.
Sobre a Recuperação
● Sobre a Qualidade
○ Como está refletida a interface de acesso com o conteúdo
coletado e armazenado?
■ Sem menção aos conteúdos coletados, porém com acesso
completo ao conteúdo armazenado (somente leitura).
○ Qual a precisão dos dados disponibilizados?
■ Alta. Não há cortes em textos ou valores numéricos arredondados.
○ Qual a tempestividade dos dados disponibilizados?
■ Mensal, a partir da aplicação de processo de atualização dos dados
por colaboradores.
46. Rodrigues, F. A.
Sobre a Recuperação
● Sobre os Direitos Autorais
○ Existe garantias de que estes dados podem ser disponibilizados?
■ Sim, pois são dados originários de dados públicos. Não há restrição
na origem, desde que não seja aplicado algoritmo para a coleta de
dados automática (extração).
■ Quais as informações para os usuários sobre os direitos de acesso
para estes dados?
● Creative Commons 4.0 (cc-by-na)
■ Quais as informações para os usuários sobre a origem?
● Indicado as fontes no início do arquivo
47. Rodrigues, F. A.
Sobre a Recuperação
● Sobre a Disseminação
○ Como esta fonte será divulgada?
■ Hardlink na página http://owl.tupa.unesp.br (a ser cadastrado) e
acesso pelo hiperlink da própria planilha (quando divulgado)
○ Como poderá ser encontrada?
■ Mecanismos de busca e menu do web site OWL
○ Encontrável nos mecanismos de busca pelos atributos?
■ Localização pelo conteúdo a partir de pesquisa em Mecanismos de
Busca
○ Permitirá processos de coleta?
■ Sim.