SlideShare uma empresa Scribd logo
1 de 30
Integração de Dados
Danusa Ribeiro
drbc@cin.ufpe.br
Porque integrar?
2
Porque integrar?
Sist. de Suporte
a Decisão
Outras áreas
Linguagens de
Programação
Inteligência
Artificial
Sistemas
Distribuídos
& Internet
Sistemas de Bancos
de Dados
TemporalEspacial
Espaço Temporal
BD Multimídia
BD Dimensional
DW
BD Distribuídos
BDOO
BDDOO
BD Ativo
BDD
BDD Ativo
BDOO
Ativo
BD de
Restrições
BD OO
Espacial
BD XML Nativo
[Lóscio, 2014]
3
Porque integrar?
• Heterogeneidade
– nível físico (diferentes plataformas de hardware e
software).
– nível lógico (diferentes modelos de dados).
– nível conceitual (diferentes esquemas e
conceitos).
4
Porque integrar?
“Integration of multiple information systems
aims at combining selected systems so that
they form a unified new whole and give users
the illusion of interacting with one single
information system.”
[Patrick Ziegler and Klaus R. Dittrich, 2004]
5
Sistemas de Integração de Dados
• Objetivo dos sistemas de integração de dados
– permitir que usuários consultem simultaneamente
múltiplas fontes de dados
• Heterogêneas
• Distribuídas
• Autônomas
– Manter transparentes os procedimentos de
acesso, extração e integração dos dados
6
Sistemas de Integração de Dados
• Abordagens
– Virtual
– Materializada
7
Sistemas de Integração de Dados
• Virtual
– Os dados são recuperados diretamente das fontes.
– As consultas são enviadas diretamente às fontes
de dados .
– Os resultados individuais obtidos são integrados e
enviados ao usuário.
– Vantagem: Os dados estão sempre atualizados.
– Desvantagem: Os custos de processamento das
consultas e de acesso às fontes são elevados.
8
Sistemas de Integração de Dados
• Materializada
– Os dados da fontes distintas são extraídos e
materializados localmente em repositórios
chamados datawarehouses.
– Vantagem: As consultas são realizadas sobre a
base materializada.
• Melhor desempenho
– Desvantagem: Necessidade de manter a base
materializada sempre atualizada
9
Arquitetura para Integração de Dados
• Arquiteturas Clássicas para Integração de Dados
– Esquema Global
• Construção de um esquema global a partir da integração dos
esquemas das fontes de dados locais.
• As fontes de dados distribuídas e heterogêneas podem ser
acessadas de maneira uniforme e transparente através deste
esquema global.
– Federada
• Bancos de dados cooperantes e autônomos que participam
da federação para permitir um compartilhamento parcial e
controlado de seus dados.
• São oferecidos múltiplos esquemas integrados, de acordo
com os requisitos das aplicações
– estáticos e definidos a priori
10
Arquitetura para Integração de Dados
• Arquitetura baseada em Mediadores
11
Arquitetura para Integração de Dados
• Arquitetura de Data Warehouse
12
Arquitetura para Integração de Dados
• Sistemas de Gerenciamento de Dados peer-to-
peer
13
Arquitetura para Integração de Dados
• Dataspaces
– Fase de inicialização rápida e de baixo custo, por meio da
geração incremental e automática dos mapeamentos.
– Como consequência disto, os resultados recuperados pelas
consultas são imprecisos.
– Isto se deve a baixa qualidade dos mapeamentos, que por
muitas vezes, são obtidos de maneira automática pelas
ferramentas existentes.
– Não há uma definição clara do esquema de mediação ou
esquema global, já que o mesmo é um sistema bastante
flexível, podendo variar conforme a necessidade.
14
Principais Desafios
• Modelagem de Dados
• Definição da visão integrada
• Reformulação de consultas
• Construção de tradutores
15
Sistemas de Integração de Dados
• Para que ocorra a integração de dados, devem
ser definidos relacionamentos ou
mapeamentos entre cada esquema fonte e o
esquema de mediação.
• Um mapeamento especifica como instâncias
de dados de um esquema correspondem à
instância de dados de outro esquema.
16
Abordagem para definição de
Mapeamentos
• Para especificar a descrição das fontes de
dados:
– Global-As-View (GAV)
– Local-As-View (LAV)
– Global-Local-as-View (GLAV)
17
• Global-As-View (GAV)
– Cada entidade no esquema de mediação tem uma
correspondência com o esquema da fonte de
dado.
– Neste caso a reformulação de consultas torna-se
mais simples.
Abordagem para definição de
Mapeamentos
18
• Local-As-View (GAV)
– Cada elemento em uma fonte local é definido
como uma visão sobre o esquema de mediação.
– Torna mais fácil a manutenção das fontes de
dados.
– O processo de decomposição de consultas é mais
complexo.
Abordagem para definição de
Mapeamentos
19
Abordagem para definição de
Mapeamentos
Fonte de dados1
Estudante1
• 𝑚𝑎𝑡1
• 𝑛𝑜𝑚𝑒1
• 𝑐𝑢𝑟𝑠𝑜1
• 𝑛𝑜𝑡𝑎1
Fonte de dados2
Estudante1
• 𝑚𝑎𝑡2
• 𝑛𝑜𝑚𝑒2
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
Avaliação1
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
• 𝑐𝑢𝑟𝑠𝑜2
• 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2
Esquema de
mediação
Estudante 𝑚
• Mat 𝑚
• Nome 𝑚
• Curso 𝑚
• Nota 𝑚
• Aval_escrita 𝑚
20
Abordagem para definição de
Mapeamentos
Fonte de dados1
Estudante1
• 𝑚𝑎𝑡1
• 𝑛𝑜𝑚𝑒1
• 𝑐𝑢𝑟𝑠𝑜1
• 𝑛𝑜𝑡𝑎1
Fonte de dados2
Estudante1
• 𝑚𝑎𝑡2
• 𝑛𝑜𝑚𝑒2
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
Avaliação1
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
• 𝑐𝑢𝑟𝑠𝑜2
• 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2
Esquema de
mediação
Estudante 𝑚
• Mat 𝑚
• Nome 𝑚
• Curso 𝑚
• Nota 𝑚
• Aval_escrita 𝑚
Global-As-View (GAV)
21
Abordagem para definição de
Mapeamentos
Fonte de dados1
Estudante1
• 𝑚𝑎𝑡1
• 𝑛𝑜𝑚𝑒1
• 𝑐𝑢𝑟𝑠𝑜1
• 𝑛𝑜𝑡𝑎1
Fonte de dados2
Estudante1
• 𝑚𝑎𝑡2
• 𝑛𝑜𝑚𝑒2
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
Avaliação1
• 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2
• 𝑐𝑢𝑟𝑠𝑜2
• 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2
Esquema de
mediação
Estudante 𝑚
• Mat 𝑚
• Nome 𝑚
• Curso 𝑚
• Nota 𝑚
• Aval_escrita 𝑚
Local-As-View (GAV)
22
Histórico
23
Web
HTTP
HTML/CSS/ JavaScript
Web Social
Compartilhamento, Grupos,
Relacionamentos, Tags...
Web Semântica (visão desde 1998)
Raciocinadores, Lógica,
Regras...
O que vem por aí?
1990-2000
2000-2010
2010-2020?
E com o advento da Web... Ainda é
necessário integrar os dados?
A Web
revolucionou a
forma como os
dados são gerados
e manipulados!
24
Desafios para Integração de Dados na
Web
• Existem algumas diferenças que precisam ser consideradas quando
fontes de dados Web são integradas como:
– O número de fontes de dados pode ser grande, o que dificulta os
processos de integração de esquemas e resolução de conflitos.
– As fontes de dados
• são muito dinâmicas e assim a adição ou remoção de fontes de
dados deve ser feita de maneira a minimizar o impacto na visão
integrada.
• são bastante heterogêneas, podendo ser desde sistemas de
gerenciamento de bancos de dados até simples arquivos.
• podem ser não estruturadas ou semiestruturadas e, na maioria
das vezes, não fornecem informações suficientes para a integração
dos esquemas.
25
Desafios para Integração de Dados na
Web
• Os dados na Web
– são organizados para serem lidos ou compreendidos por humanos e
não por agentes de software.
– é necessário processar a semântica envolvida naquele dado, num
determinado contexto.
• Semântica diz respeito à atribuição de significado a elementos,
dados ou expressões que precisam ser interpretados numa dada
situação.
– atribuir significado aos dados interligando-os com outros conjuntos de
dados ou outros domínios de conhecimento, conseguindo, assim, criar
uma relação de significância entre os conteúdos publicados na
Internet de modo que seja perceptível tanto pelo usuário quanto pelos
agentes de software.
– Essa visão da Web é denominada de Web Semântica (Semantic Web)
26
E o que é Web Semântica?
Como ela ajuda no processo de
integração de dados na Web?
Cenas dos próximos capítulos. Não percam!!!
27
Referências
• [Franklin et al. 2005] Franklin, M., Halevy, A., Maier, D. From Databases to
Dataspaces: A New Abstraction for Information Management. In: SIGMOD
’05: Proceedings of the 2005 ACM SIGMOD international conference on
Management of data (2005) 27–33.
• [Halevy 2003] Havely, A. Y., Data Integration: A Status Report. . In
proceedings of BTW, 2003.
• [Halevy et al. 2006a] Halevy, A., Rajaraman, A., Ordille, J.: Data
integration: the teenage years. In: VLDB’06: 32nd International Conference
on Very Large Data Bases, ACM (2006).
• [Halevy et al. 2006b] Halevy, A., Franklin, M., Maier, D. Principles of
Dataspace Systems. In: PODS ’06: Proceedings of the twenty-fifth ACM
SIGMOD-SIGACT-SIGART symposium on Principles of database systems,
ACM (2006).
• [Heath and Bizer 2011] Heath, T., Bizer, C., Linked Data: Evolving the Web
into a Global Data Space (1st edition). Synthesis Lectures on the Semantic
Web: Theory and Technology. Morgan & Claypool, 2011.
28
Referências
• [Herschel and Heese 2005] Herschel, S. and Heese, R. Humboldt
Discoverer: A Semantic P2P index for PDMS. In: Proc. of the International
Workshop Data Integration and the Semantic Web, Porto, Portugal, 2005.
• [Lóscio 2003] Lóscio, B. F. Managing the Evolution of XML-based Mediation
Queries. Ph.D. Thesis, Federal University of Pernambuco, Brazil, 2003.
• [Navathe et al. 1986] Navathe, S. B., Elmasri, R. and Larson, J. (1986).
Integrating user views in database design. IEEE Computer, vol. 19, no. 1.
• [Madhavan et al. 2007] Madhavan, J., Cohen, S., Dong, X.L., Halevy, A.Y.,
Jeffery, S.R., Ko, D., Yu, C. Web-scale data integration: You can afford to
pay as you go. In: Proc. of Third Biennial Conference on Innovative Data
Systems Research, 2007, Asilomar, CA, USA.
29
Referências
• [Pires 2009] Pires, C. E. S. (2009). Ontology-based Clustering in a Peer Data
Management System. PhD thesis, Federal University of Pernambuco.
• [Salles et al. 2007] Salles, M.A.V., Dittrich, J.P., Karakashian, S.K., Girard,
O.R., Blunschi, L.: iTrails: Pay-as-you-go Information Integration in
Dataspaces. In: VLDB’07: 33rd International Conference on Very Large
Data Bases, ACM (2007).
• [Sarma et al 2008] Sarma, A. D., Dong, X., Halevy, A. 2008. Bootstrapping
pay-as-you-go data integration systems. In Proceedings of the 2008 ACM
SIGMOD international conference on Management of data (SIGMOD '08).
ACM, New York, NY, USA, 861-874.
• [Sung et al. 2005] Sung, L. G. A., Ahmed, N., Blanco, R., Li, H, Soliman, M.
A., Hadaller, D. A Survey of Data Management in Peer-to-Peer Systems. In:
School of Computer Science, University of Waterloo, 2005.
30

Mais conteúdo relacionado

Mais procurados

06 Modelagem de banco de dados: Modelo Lógico
06  Modelagem de banco de dados: Modelo Lógico06  Modelagem de banco de dados: Modelo Lógico
06 Modelagem de banco de dados: Modelo LógicoCentro Paula Souza
 
Aula 5 - Dicionário de Dados
Aula 5 - Dicionário de DadosAula 5 - Dicionário de Dados
Aula 5 - Dicionário de DadosJanynne Gomes
 
Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - dbDaniela Brauner
 
SISTEMAS OPERACIOANIS 20.01.2023.pptx
SISTEMAS OPERACIOANIS 20.01.2023.pptxSISTEMAS OPERACIOANIS 20.01.2023.pptx
SISTEMAS OPERACIOANIS 20.01.2023.pptxADASVIEIRAArmazmPara
 
Arquitetura e Organização de Computadores: Introdução
Arquitetura e Organização de Computadores: IntroduçãoArquitetura e Organização de Computadores: Introdução
Arquitetura e Organização de Computadores: IntroduçãoWellington Oliveira
 
Introducão à Deep Learning e suas aplicações em neuroimagem
Introducão à Deep Learning e suas aplicações em neuroimagemIntroducão à Deep Learning e suas aplicações em neuroimagem
Introducão à Deep Learning e suas aplicações em neuroimagemWalter Hugo Lopez Pinaya
 
Introdução a segurança da informação
Introdução a segurança da informaçãoIntrodução a segurança da informação
Introdução a segurança da informaçãoCleber Fonseca
 
Sistemas Operacionais Modernos Capítulo 3 Deadlock
Sistemas Operacionais Modernos Capítulo 3 DeadlockSistemas Operacionais Modernos Capítulo 3 Deadlock
Sistemas Operacionais Modernos Capítulo 3 DeadlockWellington Oliveira
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoHelder Lopes
 
Serviços de Rede - Telnet e SSH
Serviços de Rede - Telnet e SSHServiços de Rede - Telnet e SSH
Serviços de Rede - Telnet e SSHNatanael Simões
 
01 Introdução à programação web
01 Introdução à programação web01 Introdução à programação web
01 Introdução à programação webCentro Paula Souza
 
Aps lista de exercícios
Aps lista de exercíciosAps lista de exercícios
Aps lista de exercíciosGuilherme
 
Estrutura de Dados Aula 04 - Listas Estáticas
Estrutura de Dados Aula 04 - Listas EstáticasEstrutura de Dados Aula 04 - Listas Estáticas
Estrutura de Dados Aula 04 - Listas EstáticasLeinylson Fontinele
 
Aprendizado de Máquina
Aprendizado de MáquinaAprendizado de Máquina
Aprendizado de Máquinabutest
 
Introdução ao Processamento de Imagens Digitais
Introdução ao Processamento de Imagens DigitaisIntrodução ao Processamento de Imagens Digitais
Introdução ao Processamento de Imagens DigitaisMurilo Adriano Vasconcelos
 
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...Juliana Cindra
 

Mais procurados (20)

06 Modelagem de banco de dados: Modelo Lógico
06  Modelagem de banco de dados: Modelo Lógico06  Modelagem de banco de dados: Modelo Lógico
06 Modelagem de banco de dados: Modelo Lógico
 
Aula 5 - Dicionário de Dados
Aula 5 - Dicionário de DadosAula 5 - Dicionário de Dados
Aula 5 - Dicionário de Dados
 
Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - db
 
SISTEMAS OPERACIOANIS 20.01.2023.pptx
SISTEMAS OPERACIOANIS 20.01.2023.pptxSISTEMAS OPERACIOANIS 20.01.2023.pptx
SISTEMAS OPERACIOANIS 20.01.2023.pptx
 
Banco de dados
Banco de dadosBanco de dados
Banco de dados
 
Arquitetura e Organização de Computadores: Introdução
Arquitetura e Organização de Computadores: IntroduçãoArquitetura e Organização de Computadores: Introdução
Arquitetura e Organização de Computadores: Introdução
 
Estrutura de dados - Pilhas
Estrutura de dados - PilhasEstrutura de dados - Pilhas
Estrutura de dados - Pilhas
 
Introducão à Deep Learning e suas aplicações em neuroimagem
Introducão à Deep Learning e suas aplicações em neuroimagemIntroducão à Deep Learning e suas aplicações em neuroimagem
Introducão à Deep Learning e suas aplicações em neuroimagem
 
Introdução a segurança da informação
Introdução a segurança da informaçãoIntrodução a segurança da informação
Introdução a segurança da informação
 
Conceitos iniciais de Active Directory
Conceitos iniciais de Active DirectoryConceitos iniciais de Active Directory
Conceitos iniciais de Active Directory
 
Sistemas Operacionais Modernos Capítulo 3 Deadlock
Sistemas Operacionais Modernos Capítulo 3 DeadlockSistemas Operacionais Modernos Capítulo 3 Deadlock
Sistemas Operacionais Modernos Capítulo 3 Deadlock
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de Informação
 
Serviços de Rede - Telnet e SSH
Serviços de Rede - Telnet e SSHServiços de Rede - Telnet e SSH
Serviços de Rede - Telnet e SSH
 
01 Introdução à programação web
01 Introdução à programação web01 Introdução à programação web
01 Introdução à programação web
 
Aps lista de exercícios
Aps lista de exercíciosAps lista de exercícios
Aps lista de exercícios
 
Estrutura de Dados Aula 04 - Listas Estáticas
Estrutura de Dados Aula 04 - Listas EstáticasEstrutura de Dados Aula 04 - Listas Estáticas
Estrutura de Dados Aula 04 - Listas Estáticas
 
Aprendizado de Máquina
Aprendizado de MáquinaAprendizado de Máquina
Aprendizado de Máquina
 
Telnet
TelnetTelnet
Telnet
 
Introdução ao Processamento de Imagens Digitais
Introdução ao Processamento de Imagens DigitaisIntrodução ao Processamento de Imagens Digitais
Introdução ao Processamento de Imagens Digitais
 
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...
AVALIAÇÃO DA QUALIDADE DE UM SISTEMA DE GESTÃO ACADÊMICA ATRAVÉS DA MINERAÇÃO...
 

Destaque

Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Danusa Ribeiro
 
Apresentação defesa de mestrado 2014 final
Apresentação defesa de mestrado 2014   finalApresentação defesa de mestrado 2014   final
Apresentação defesa de mestrado 2014 finalDanusa Ribeiro
 
Integração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e SaberIntegração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e SaberJunio Soares Dias
 
Sistemas de federação linked data
Sistemas de federação linked dataSistemas de federação linked data
Sistemas de federação linked dataDanusa Ribeiro
 
Linked Data: da Web de Documentos para a Web de Dados
Linked Data: da Web de Documentos para a Web de DadosLinked Data: da Web de Documentos para a Web de Dados
Linked Data: da Web de Documentos para a Web de DadosDanusa Ribeiro
 
Tecnicas de gerenciamento=_trabalho
Tecnicas de gerenciamento=_trabalhoTecnicas de gerenciamento=_trabalho
Tecnicas de gerenciamento=_trabalhoWagner Santiago
 
Case 011 INTEGRAÇÃO DE DADOS
Case 011   INTEGRAÇÃO DE DADOSCase 011   INTEGRAÇÃO DE DADOS
Case 011 INTEGRAÇÃO DE DADOSFabio Viana
 
Integracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreIntegracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreBerna Lóscio
 
Dados Informacao Conhecimento Saber
Dados Informacao Conhecimento SaberDados Informacao Conhecimento Saber
Dados Informacao Conhecimento Saberblogspheregroup
 
Banco de Dados, Integração e Qualidade de Dados
Banco de Dados, Integração e Qualidade de DadosBanco de Dados, Integração e Qualidade de Dados
Banco de Dados, Integração e Qualidade de DadosCeça Moraes
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoNilton Heck
 
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARES
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARESPROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARES
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARESTancredo Almeida
 
Facilidades e dificuldades do trabalho em equipe
Facilidades e dificuldades do trabalho em equipeFacilidades e dificuldades do trabalho em equipe
Facilidades e dificuldades do trabalho em equipeLigia Coppetti
 
Competências pessoais sociais
Competências pessoais sociaisCompetências pessoais sociais
Competências pessoais sociaisRosalina Fialho
 
Manual de apresentação novos colaboradores - google docs
Manual de apresentação   novos colaboradores - google docsManual de apresentação   novos colaboradores - google docs
Manual de apresentação novos colaboradores - google docsproriso
 
Aula - Interfaces e Estilos de Interação
Aula - Interfaces e Estilos de InteraçãoAula - Interfaces e Estilos de Interação
Aula - Interfaces e Estilos de InteraçãoFabio Moura Pereira
 
Integração Treinamento Colaboradores
Integração Treinamento ColaboradoresIntegração Treinamento Colaboradores
Integração Treinamento ColaboradoresSINDILOJAS POA
 
DER - Diagrama de Entidade e Relacionamentos
DER - Diagrama de Entidade e RelacionamentosDER - Diagrama de Entidade e Relacionamentos
DER - Diagrama de Entidade e RelacionamentosCláudio Amaral
 

Destaque (20)

Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
 
Apresentação defesa de mestrado 2014 final
Apresentação defesa de mestrado 2014   finalApresentação defesa de mestrado 2014   final
Apresentação defesa de mestrado 2014 final
 
Integração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e SaberIntegração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e Saber
 
Sistemas de federação linked data
Sistemas de federação linked dataSistemas de federação linked data
Sistemas de federação linked data
 
Linked Data: da Web de Documentos para a Web de Dados
Linked Data: da Web de Documentos para a Web de DadosLinked Data: da Web de Documentos para a Web de Dados
Linked Data: da Web de Documentos para a Web de Dados
 
Tecnicas de gerenciamento=_trabalho
Tecnicas de gerenciamento=_trabalhoTecnicas de gerenciamento=_trabalho
Tecnicas de gerenciamento=_trabalho
 
Case 011 INTEGRAÇÃO DE DADOS
Case 011   INTEGRAÇÃO DE DADOSCase 011   INTEGRAÇÃO DE DADOS
Case 011 INTEGRAÇÃO DE DADOS
 
Integracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreIntegracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e Sempre
 
Dados Informacao Conhecimento Saber
Dados Informacao Conhecimento SaberDados Informacao Conhecimento Saber
Dados Informacao Conhecimento Saber
 
Banco de Dados, Integração e Qualidade de Dados
Banco de Dados, Integração e Qualidade de DadosBanco de Dados, Integração e Qualidade de Dados
Banco de Dados, Integração e Qualidade de Dados
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da Informação
 
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARES
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARESPROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARES
PROPOSTA DE UM SISTEMA PARA AUTOMATIZAR ROTINAS ADMINISTRATIVAS ESCOLARES
 
Hackeando o Facebook com Python
Hackeando o Facebook com PythonHackeando o Facebook com Python
Hackeando o Facebook com Python
 
Facilidades e dificuldades do trabalho em equipe
Facilidades e dificuldades do trabalho em equipeFacilidades e dificuldades do trabalho em equipe
Facilidades e dificuldades do trabalho em equipe
 
Competências pessoais sociais
Competências pessoais sociaisCompetências pessoais sociais
Competências pessoais sociais
 
Manual de apresentação novos colaboradores - google docs
Manual de apresentação   novos colaboradores - google docsManual de apresentação   novos colaboradores - google docs
Manual de apresentação novos colaboradores - google docs
 
Aula - Interfaces e Estilos de Interação
Aula - Interfaces e Estilos de InteraçãoAula - Interfaces e Estilos de Interação
Aula - Interfaces e Estilos de Interação
 
Integração Treinamento Colaboradores
Integração Treinamento ColaboradoresIntegração Treinamento Colaboradores
Integração Treinamento Colaboradores
 
Integração
IntegraçãoIntegração
Integração
 
DER - Diagrama de Entidade e Relacionamentos
DER - Diagrama de Entidade e RelacionamentosDER - Diagrama de Entidade e Relacionamentos
DER - Diagrama de Entidade e Relacionamentos
 

Semelhante a Integração de dados

Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
Sistema de Base de Dados1.ppt
Sistema de Base de Dados1.pptSistema de Base de Dados1.ppt
Sistema de Base de Dados1.ppthhuu6
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)Andre Sidou
 
Banco de Dados - Conceitos
Banco de Dados - ConceitosBanco de Dados - Conceitos
Banco de Dados - Conceitosssuser69006f
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduceKarla Okada
 
Projeto de Banco de Dados - Capítulo 1
Projeto de Banco de Dados - Capítulo 1Projeto de Banco de Dados - Capítulo 1
Projeto de Banco de Dados - Capítulo 1Januário Neto
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Interoperabilidade, metadados e outras coisitas mais
Interoperabilidade, metadados e outras coisitas maisInteroperabilidade, metadados e outras coisitas mais
Interoperabilidade, metadados e outras coisitas maisMarcos Luis Mori
 
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERRangel Javier
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosCentro Web
 
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...Carlos Raniery
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS Antonio Pedro
 
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptx
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptxAula 2 - SGBDs e Modelos de Bancos de Dados.pptx
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptxJoseph Donald
 
Material Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukMaterial Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukHebert Alquimim
 
Universidade federal do amazonas Banco de Dados - Apresentação final
Universidade federal do amazonas   Banco de Dados - Apresentação finalUniversidade federal do amazonas   Banco de Dados - Apresentação final
Universidade federal do amazonas Banco de Dados - Apresentação finalRenan Levy
 

Semelhante a Integração de dados (20)

Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Sistema de Base de Dados1.ppt
Sistema de Base de Dados1.pptSistema de Base de Dados1.ppt
Sistema de Base de Dados1.ppt
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)
 
Banco de Dados - Conceitos
Banco de Dados - ConceitosBanco de Dados - Conceitos
Banco de Dados - Conceitos
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
 
Projeto de Banco de Dados - Capítulo 1
Projeto de Banco de Dados - Capítulo 1Projeto de Banco de Dados - Capítulo 1
Projeto de Banco de Dados - Capítulo 1
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
BANCO DE DADOS.pptx
BANCO DE DADOS.pptxBANCO DE DADOS.pptx
BANCO DE DADOS.pptx
 
Interoperabilidade, metadados e outras coisitas mais
Interoperabilidade, metadados e outras coisitas maisInteroperabilidade, metadados e outras coisitas mais
Interoperabilidade, metadados e outras coisitas mais
 
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
 
Metadados e Interoperabilidade
Metadados e InteroperabilidadeMetadados e Interoperabilidade
Metadados e Interoperabilidade
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e Benefícios
 
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...
Mashups e Modelagem Quantitativa Usando Padrões de Mashup com foco no Gerenci...
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS
 
Aula 4 banco de dados
Aula 4   banco de dados Aula 4   banco de dados
Aula 4 banco de dados
 
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptx
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptxAula 2 - SGBDs e Modelos de Bancos de Dados.pptx
Aula 2 - SGBDs e Modelos de Bancos de Dados.pptx
 
TA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdfTA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdf
 
Material Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukMaterial Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos Alexandruk
 
Wperformance 2015 (2)
Wperformance   2015 (2)Wperformance   2015 (2)
Wperformance 2015 (2)
 
Universidade federal do amazonas Banco de Dados - Apresentação final
Universidade federal do amazonas   Banco de Dados - Apresentação finalUniversidade federal do amazonas   Banco de Dados - Apresentação final
Universidade federal do amazonas Banco de Dados - Apresentação final
 

Integração de dados

  • 1. Integração de Dados Danusa Ribeiro drbc@cin.ufpe.br
  • 3. Porque integrar? Sist. de Suporte a Decisão Outras áreas Linguagens de Programação Inteligência Artificial Sistemas Distribuídos & Internet Sistemas de Bancos de Dados TemporalEspacial Espaço Temporal BD Multimídia BD Dimensional DW BD Distribuídos BDOO BDDOO BD Ativo BDD BDD Ativo BDOO Ativo BD de Restrições BD OO Espacial BD XML Nativo [Lóscio, 2014] 3
  • 4. Porque integrar? • Heterogeneidade – nível físico (diferentes plataformas de hardware e software). – nível lógico (diferentes modelos de dados). – nível conceitual (diferentes esquemas e conceitos). 4
  • 5. Porque integrar? “Integration of multiple information systems aims at combining selected systems so that they form a unified new whole and give users the illusion of interacting with one single information system.” [Patrick Ziegler and Klaus R. Dittrich, 2004] 5
  • 6. Sistemas de Integração de Dados • Objetivo dos sistemas de integração de dados – permitir que usuários consultem simultaneamente múltiplas fontes de dados • Heterogêneas • Distribuídas • Autônomas – Manter transparentes os procedimentos de acesso, extração e integração dos dados 6
  • 7. Sistemas de Integração de Dados • Abordagens – Virtual – Materializada 7
  • 8. Sistemas de Integração de Dados • Virtual – Os dados são recuperados diretamente das fontes. – As consultas são enviadas diretamente às fontes de dados . – Os resultados individuais obtidos são integrados e enviados ao usuário. – Vantagem: Os dados estão sempre atualizados. – Desvantagem: Os custos de processamento das consultas e de acesso às fontes são elevados. 8
  • 9. Sistemas de Integração de Dados • Materializada – Os dados da fontes distintas são extraídos e materializados localmente em repositórios chamados datawarehouses. – Vantagem: As consultas são realizadas sobre a base materializada. • Melhor desempenho – Desvantagem: Necessidade de manter a base materializada sempre atualizada 9
  • 10. Arquitetura para Integração de Dados • Arquiteturas Clássicas para Integração de Dados – Esquema Global • Construção de um esquema global a partir da integração dos esquemas das fontes de dados locais. • As fontes de dados distribuídas e heterogêneas podem ser acessadas de maneira uniforme e transparente através deste esquema global. – Federada • Bancos de dados cooperantes e autônomos que participam da federação para permitir um compartilhamento parcial e controlado de seus dados. • São oferecidos múltiplos esquemas integrados, de acordo com os requisitos das aplicações – estáticos e definidos a priori 10
  • 11. Arquitetura para Integração de Dados • Arquitetura baseada em Mediadores 11
  • 12. Arquitetura para Integração de Dados • Arquitetura de Data Warehouse 12
  • 13. Arquitetura para Integração de Dados • Sistemas de Gerenciamento de Dados peer-to- peer 13
  • 14. Arquitetura para Integração de Dados • Dataspaces – Fase de inicialização rápida e de baixo custo, por meio da geração incremental e automática dos mapeamentos. – Como consequência disto, os resultados recuperados pelas consultas são imprecisos. – Isto se deve a baixa qualidade dos mapeamentos, que por muitas vezes, são obtidos de maneira automática pelas ferramentas existentes. – Não há uma definição clara do esquema de mediação ou esquema global, já que o mesmo é um sistema bastante flexível, podendo variar conforme a necessidade. 14
  • 15. Principais Desafios • Modelagem de Dados • Definição da visão integrada • Reformulação de consultas • Construção de tradutores 15
  • 16. Sistemas de Integração de Dados • Para que ocorra a integração de dados, devem ser definidos relacionamentos ou mapeamentos entre cada esquema fonte e o esquema de mediação. • Um mapeamento especifica como instâncias de dados de um esquema correspondem à instância de dados de outro esquema. 16
  • 17. Abordagem para definição de Mapeamentos • Para especificar a descrição das fontes de dados: – Global-As-View (GAV) – Local-As-View (LAV) – Global-Local-as-View (GLAV) 17
  • 18. • Global-As-View (GAV) – Cada entidade no esquema de mediação tem uma correspondência com o esquema da fonte de dado. – Neste caso a reformulação de consultas torna-se mais simples. Abordagem para definição de Mapeamentos 18
  • 19. • Local-As-View (GAV) – Cada elemento em uma fonte local é definido como uma visão sobre o esquema de mediação. – Torna mais fácil a manutenção das fontes de dados. – O processo de decomposição de consultas é mais complexo. Abordagem para definição de Mapeamentos 19
  • 20. Abordagem para definição de Mapeamentos Fonte de dados1 Estudante1 • 𝑚𝑎𝑡1 • 𝑛𝑜𝑚𝑒1 • 𝑐𝑢𝑟𝑠𝑜1 • 𝑛𝑜𝑡𝑎1 Fonte de dados2 Estudante1 • 𝑚𝑎𝑡2 • 𝑛𝑜𝑚𝑒2 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 Avaliação1 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 • 𝑐𝑢𝑟𝑠𝑜2 • 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2 Esquema de mediação Estudante 𝑚 • Mat 𝑚 • Nome 𝑚 • Curso 𝑚 • Nota 𝑚 • Aval_escrita 𝑚 20
  • 21. Abordagem para definição de Mapeamentos Fonte de dados1 Estudante1 • 𝑚𝑎𝑡1 • 𝑛𝑜𝑚𝑒1 • 𝑐𝑢𝑟𝑠𝑜1 • 𝑛𝑜𝑡𝑎1 Fonte de dados2 Estudante1 • 𝑚𝑎𝑡2 • 𝑛𝑜𝑚𝑒2 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 Avaliação1 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 • 𝑐𝑢𝑟𝑠𝑜2 • 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2 Esquema de mediação Estudante 𝑚 • Mat 𝑚 • Nome 𝑚 • Curso 𝑚 • Nota 𝑚 • Aval_escrita 𝑚 Global-As-View (GAV) 21
  • 22. Abordagem para definição de Mapeamentos Fonte de dados1 Estudante1 • 𝑚𝑎𝑡1 • 𝑛𝑜𝑚𝑒1 • 𝑐𝑢𝑟𝑠𝑜1 • 𝑛𝑜𝑡𝑎1 Fonte de dados2 Estudante1 • 𝑚𝑎𝑡2 • 𝑛𝑜𝑚𝑒2 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 Avaliação1 • 𝑐𝑜𝑑_𝑎𝑣𝑎𝑙2 • 𝑐𝑢𝑟𝑠𝑜2 • 𝑎𝑣𝑎𝑙_𝑒𝑠𝑐𝑟𝑖𝑡𝑎2 Esquema de mediação Estudante 𝑚 • Mat 𝑚 • Nome 𝑚 • Curso 𝑚 • Nota 𝑚 • Aval_escrita 𝑚 Local-As-View (GAV) 22
  • 23. Histórico 23 Web HTTP HTML/CSS/ JavaScript Web Social Compartilhamento, Grupos, Relacionamentos, Tags... Web Semântica (visão desde 1998) Raciocinadores, Lógica, Regras... O que vem por aí? 1990-2000 2000-2010 2010-2020?
  • 24. E com o advento da Web... Ainda é necessário integrar os dados? A Web revolucionou a forma como os dados são gerados e manipulados! 24
  • 25. Desafios para Integração de Dados na Web • Existem algumas diferenças que precisam ser consideradas quando fontes de dados Web são integradas como: – O número de fontes de dados pode ser grande, o que dificulta os processos de integração de esquemas e resolução de conflitos. – As fontes de dados • são muito dinâmicas e assim a adição ou remoção de fontes de dados deve ser feita de maneira a minimizar o impacto na visão integrada. • são bastante heterogêneas, podendo ser desde sistemas de gerenciamento de bancos de dados até simples arquivos. • podem ser não estruturadas ou semiestruturadas e, na maioria das vezes, não fornecem informações suficientes para a integração dos esquemas. 25
  • 26. Desafios para Integração de Dados na Web • Os dados na Web – são organizados para serem lidos ou compreendidos por humanos e não por agentes de software. – é necessário processar a semântica envolvida naquele dado, num determinado contexto. • Semântica diz respeito à atribuição de significado a elementos, dados ou expressões que precisam ser interpretados numa dada situação. – atribuir significado aos dados interligando-os com outros conjuntos de dados ou outros domínios de conhecimento, conseguindo, assim, criar uma relação de significância entre os conteúdos publicados na Internet de modo que seja perceptível tanto pelo usuário quanto pelos agentes de software. – Essa visão da Web é denominada de Web Semântica (Semantic Web) 26
  • 27. E o que é Web Semântica? Como ela ajuda no processo de integração de dados na Web? Cenas dos próximos capítulos. Não percam!!! 27
  • 28. Referências • [Franklin et al. 2005] Franklin, M., Halevy, A., Maier, D. From Databases to Dataspaces: A New Abstraction for Information Management. In: SIGMOD ’05: Proceedings of the 2005 ACM SIGMOD international conference on Management of data (2005) 27–33. • [Halevy 2003] Havely, A. Y., Data Integration: A Status Report. . In proceedings of BTW, 2003. • [Halevy et al. 2006a] Halevy, A., Rajaraman, A., Ordille, J.: Data integration: the teenage years. In: VLDB’06: 32nd International Conference on Very Large Data Bases, ACM (2006). • [Halevy et al. 2006b] Halevy, A., Franklin, M., Maier, D. Principles of Dataspace Systems. In: PODS ’06: Proceedings of the twenty-fifth ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems, ACM (2006). • [Heath and Bizer 2011] Heath, T., Bizer, C., Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology. Morgan & Claypool, 2011. 28
  • 29. Referências • [Herschel and Heese 2005] Herschel, S. and Heese, R. Humboldt Discoverer: A Semantic P2P index for PDMS. In: Proc. of the International Workshop Data Integration and the Semantic Web, Porto, Portugal, 2005. • [Lóscio 2003] Lóscio, B. F. Managing the Evolution of XML-based Mediation Queries. Ph.D. Thesis, Federal University of Pernambuco, Brazil, 2003. • [Navathe et al. 1986] Navathe, S. B., Elmasri, R. and Larson, J. (1986). Integrating user views in database design. IEEE Computer, vol. 19, no. 1. • [Madhavan et al. 2007] Madhavan, J., Cohen, S., Dong, X.L., Halevy, A.Y., Jeffery, S.R., Ko, D., Yu, C. Web-scale data integration: You can afford to pay as you go. In: Proc. of Third Biennial Conference on Innovative Data Systems Research, 2007, Asilomar, CA, USA. 29
  • 30. Referências • [Pires 2009] Pires, C. E. S. (2009). Ontology-based Clustering in a Peer Data Management System. PhD thesis, Federal University of Pernambuco. • [Salles et al. 2007] Salles, M.A.V., Dittrich, J.P., Karakashian, S.K., Girard, O.R., Blunschi, L.: iTrails: Pay-as-you-go Information Integration in Dataspaces. In: VLDB’07: 33rd International Conference on Very Large Data Bases, ACM (2007). • [Sarma et al 2008] Sarma, A. D., Dong, X., Halevy, A. 2008. Bootstrapping pay-as-you-go data integration systems. In Proceedings of the 2008 ACM SIGMOD international conference on Management of data (SIGMOD '08). ACM, New York, NY, USA, 861-874. • [Sung et al. 2005] Sung, L. G. A., Ahmed, N., Blanco, R., Li, H, Soliman, M. A., Hadaller, D. A Survey of Data Management in Peer-to-Peer Systems. In: School of Computer Science, University of Waterloo, 2005. 30