SlideShare ist ein Scribd-Unternehmen logo
1 von 43
Downloaden Sie, um offline zu lesen
Derivação de Modelos ER para
Modelagem Multidimensional
Setembro / 2009
Agenda
Introdução
De acordo com KIMBALL (1997) a modelagem de
data warehouse é completamente diferente da
modelagem de sistemas transacionais e que
as técnicas de modelagem E/R não podem ser
igualmente aplicadas.
No entanto, MOODY & KORTINK (2000) argumentam
que a modelagem E/R é igualmente aplicável no projeto
de data warehouse e data mart.
Introdução
Segundo MOODY & KORTINK (2000), a abordagem de
projeto proposta por Kimball é introdutória e baseia-se
apenas no levatamento de requisitos dos usuários
identificando os componentes (fatos relevantes que
precisam ser agregados e atributos dimensionais
agregáveis) básicos do esquema estrela.
O data warehouse resultante não passaria de um
conjunto discreto de esquemas estrela.
Problemas Relacionados à Metodologia
de KIMBALL
Imprevisibilidade dos requisitos dos usuários resulta em
projeto instável;
Projeto incorreto caso o projetista não entenda os
relacionamentos entre os dados;
Agregação prematura dos dados resulta em perda de
informação;
A abordagem é apresentada através de exemplos ao
invés de uma metodologia de projeto concreta.
A Metodologia de MOODY & KORTINK
A proposta de MOODY & KORTINK (2000) para
projeto de data warehouse baseia-se na derivação de
modelos dimensionais a partir de modelos de dados
globais amplamente conhecidos como modelos E/R. A
metodologia concentra-se em três etapas básicas:
Classificação das entidades
Identificação das hierarquias
Projeto de modelo dimensional
Modelo de Dados de Exemplo
Classificação das Entidades
Entidades de Transação: As entidades transação
registram os detalhes de eventos relacionados aos
negócios da empresa.
As principais características destas entidades são:
a) descrevem um evento que ocorre em um ponto
específico no tempo;
b) contém medidas ou quantidades as quais podem ser
sumarizadas.
Classificação das Entidades
Entidades Componente: Uma entidade componente é
aquela que está diretamente relacionada com a entidade
transação através de um relacionamento “um-para-
muitos”.
As entidades componente respondem as perguntas:
· Quando aconteceu o fato ?
· Quem é o personagem do fato ?
· O que é o objeto do fato ?
· Onde aconteceu o fato ?
Classificação das Entidades
Entidades de Classificação: As entidades de
classificação são as entidades que estão relacionadas
com as entidades componentes através de
relacionamentos “um-para-muitos”, isto é, eles são
funcionalmente dependentes das entidades
componentes (direta ou transitiva).
As entidades de classificação representam hierarquias
inseridas no modelo de dados através das entidades
componentes para formar tabelas de dimensão em um
esquema estrela.
Modelo Resultante da Classificação das
Entidades
No diagrama, as entidades em preto representam
entidades de Transação. As entidades em cinza
representam entidades Componente e as entidades em
branco representam entidades de Classificação.
Como Resolver Duplicidades de
Classificação ?
Hierarquia de precedência:
1. Entidades de transação (mais alta precedência);
2. Entidades de Classificação;
3. Entidades de Componente (mais baixa precedência).
Ainda, segundo Moody, na prática, algumas entidades
não conformam com nenhuma destas categorias. Estas
entidades não se ajustam na estrutura do modelo
dimensional não podendo ser incluídas em modelos
estrela.
Identificação das Hierarquias
Representam a base para a derivação de modelos E/R
em modelos dimensionais.
Uma hierarquia no modelo E/R é representada por uma
seqüência de entidades ligadas através de
relacionamentos “um-para-muitos” todos na mesma
direção.
Identificação das Hierarquias
Na terminologia hierárquica:
A entidade Estado é “pai” de Região
Região é “dependente” de Estado
ItemVenda,Venda, Local e Região, são todas
descendentes de Estado
Venda, Local, Região e Estado, são todas ascendentes
de ItemVenda
Projeto de Modelos Multidimensionais
Utilização dos operadores:
Colapso de hierarquia e Agregação.
Colapso de Hierarquia
Com este operador, as entidades de nível mais alto
podem ser inseridas em entidades de nível mais baixo
dentro da hierarquia.
Esta operação introduz redundância, na
forma de dependência transitiva, o qual é uma violação
da terceira forma normal (CODD, 1970).
A ocultação de um nível na hierarquia das entidades
resulta na desnormalização do modelo.
Agregação
Através do operador de agregação criam-se novas
entidades contendo dados sumarizados.
Um conjunto de atributos da entidade origem é
escolhido para agregar (os atributos de agregação) e um
conjunto de atributos destino recebe o agrupamento
(atributos de agrupamento).
Os atributos de agregação devem ser quantitativos
numéricos.
Avaliação dos Operadores
Usando os operadores descritos acima, pode-se
produzir diferentes esquemas dimensionais a partir de
um modelo E/R.
Cada uma das alternativas representa um diferente
“trade-off” (custo X benefício) entre complexidade e
redundância.
Quanto mais simples o modelo, maior a redundância.
À medida que a redundância é removida, o grau de
complexidade do modelo aumenta.
Geração do Modelo Final
· Uma tabela de fatos é formada para cada entidade
transação. A chave da tabela é a combinação das chaves
das entidades componente associadas;
· Uma tabela de dimensão é formada para cada
entidade componente. A chave desta entidade (tabela
de dimensão) será formada pela composição das chaves
das entidades de classificação;
Geração do Modelo Final
· Onde existirem relacionamentos hierárquicos entre as
entidades transação, a entidade dependente herda
todas as dimensões (e atributos chave) da entidade pai.
· Isto provê a habilidade de efetuar operações “drill-
down” entre os níveis de transação;
· Os atributos numéricos das entidades transação
devem ser agregados pelos atributos chave das
dimensões.
Esquema Estrela Resultante da Entidade
Fato Venda
Esquema Estrela Resultante da Entidade
Fato Item-Venda
Avaliação e Refinamento
Combinar tabelas de fato:
As tabelas (de fato) que possuem as mesmas chaves
primárias podem ser combinadas em uma única tabela.
Isto reduz o número de esquemas estrela, facilitando o
trabalho de análise e comparação entre fatos
relacionados.
Avaliação e Refinamento
Combinar tabelas de dimensão:
A criação de uma tabela de dimensão a partir de
cada entidade componente muitas vezes resulta em um
grande número de tabelas de dimensão.
Para simplificar a estrutura do data warehouse as
dimensões relacionadas devem ser consolidadas em uma
única tabela de dimensão.
Avaliação e Refinamento
Relacionamentos Muitos-para-Muitos:
Grande parte da complexidade enfrentada na
conversão de modelos E/R para modelos dimensionais
resultam dos relacionamentos muitos-para-muitos.
Estes relacionamentos causam problemas na modelagem
dimensional, pois representam uma “quebra” na
estrutura hierárquica e conseqüentemente não podem
ser simplificadas diretamente.
Bibliografia
MOODY, Daniel L.; KORTINK, Mark A.R. From
Enterprise Models to Dimensional
Models: A Methodology for Data warehouse and Data
mart Design. (DMDW´2000).
KIMBALL, Ralph. A Dimensional Modeling Manifesto.
DBMS,http://www.dbmsmag.com/9708d15.html.
Agosto, 1997.
KIMBALL, Ralph. Data warehouse Toolkit. São Paulo:
Editora Makron Books, 1998.
Além do Star e do SnowFlake Schema
Flat Schema
O esquema Flat é o
modelo mais simples
possivel sem perda de
informações.
Este é formado pelo
colapso de todas as
entidades do modelo
de dados para as
entidades minimas.
Terraced Schema
O Terraced Schema é
formado pelo colapso
de entidades até a
hierarquia máxima
parando quando
encontra uma entidade
de transação.
Isso resulta em uma
única tabela para cada
entidade de transação
existente.
Constellation Schema
Constellation Schema
Em vez de um número discreto de esquemas estrela, o
modelo de dados de exemplo pode ser transformado
em uma esquema constelação.
Um esquema constelação consiste num conjunto
de esquemas em estrela com tabelas de fatos ligadas
hierarquicamente.
As ligações entre as tabelas de fatos diferentes
fornecem a capacidade de "drill down" entre os níveis
de detalhe (por exemplo,Sale and Item Sale).
Constellation Schema
Star Cluster Schema
Star Cluster Schema
Kimball argumenta que o modelo Snowflake é
indesejável devido ao aumento da complexidade do
esquema e as junções extras requeridas nas
consultas.
Porém, pode-se considerar que nem um Star-
schema puro ou um Snowflake-schema puro
resultem na melhor solução.
A solução ideal é portanto o equilibrio entre os
dois esquemas citados.
Star Cluster Schema

Weitere ähnliche Inhalte

Was ist angesagt?

09 Mecânica Energia
09 Mecânica Energia09 Mecânica Energia
09 Mecânica EnergiaEletrons
 
Estudo das Lentes Esféricas
Estudo das Lentes EsféricasEstudo das Lentes Esféricas
Estudo das Lentes EsféricasFabio Martins
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data WarehouseFernando Peres
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basicoAmadeo Santos
 
Radiciação 2015 (professora Simone)
Radiciação 2015 (professora Simone)Radiciação 2015 (professora Simone)
Radiciação 2015 (professora Simone)Elivelton Pontes
 
Aula 4 - Diagrama Entidade Relacionamento (com exercício no final)
Aula 4  - Diagrama Entidade Relacionamento (com exercício no final)Aula 4  - Diagrama Entidade Relacionamento (com exercício no final)
Aula 4 - Diagrama Entidade Relacionamento (com exercício no final)Janynne Gomes
 
Presentation Of My Skills
Presentation  Of  My SkillsPresentation  Of  My Skills
Presentation Of My SkillsMfoghama
 
Potenciação - Propriedades das potências
Potenciação - Propriedades das potênciasPotenciação - Propriedades das potências
Potenciação - Propriedades das potênciasJosé Antônio Silva
 
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Paulo Mutolo
 
POTENCIAÇÃO E RADICIAÇÃO
POTENCIAÇÃO E RADICIAÇÃO POTENCIAÇÃO E RADICIAÇÃO
POTENCIAÇÃO E RADICIAÇÃO JOSÉ MARÇAL
 
Aula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e LogarítmicasAula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e LogarítmicasTurma1NC
 
Mer - Modelo Entidade Relacionamento
Mer - Modelo Entidade RelacionamentoMer - Modelo Entidade Relacionamento
Mer - Modelo Entidade RelacionamentoRademaker Siena
 
8 Localização das instalações de apoio parte 2
8 Localização das instalações de apoio   parte 28 Localização das instalações de apoio   parte 2
8 Localização das instalações de apoio parte 2Marcel Gois
 
Física - Gravitação universal -
Física - Gravitação universal -Física - Gravitação universal -
Física - Gravitação universal -Vídeo Aulas Apoio
 
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...Marcos Júnior
 

Was ist angesagt? (16)

09 Mecânica Energia
09 Mecânica Energia09 Mecânica Energia
09 Mecânica Energia
 
Estudo das Lentes Esféricas
Estudo das Lentes EsféricasEstudo das Lentes Esféricas
Estudo das Lentes Esféricas
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data Warehouse
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basico
 
Radiciação 2015 (professora Simone)
Radiciação 2015 (professora Simone)Radiciação 2015 (professora Simone)
Radiciação 2015 (professora Simone)
 
Aula 4 - Diagrama Entidade Relacionamento (com exercício no final)
Aula 4  - Diagrama Entidade Relacionamento (com exercício no final)Aula 4  - Diagrama Entidade Relacionamento (com exercício no final)
Aula 4 - Diagrama Entidade Relacionamento (com exercício no final)
 
Presentation Of My Skills
Presentation  Of  My SkillsPresentation  Of  My Skills
Presentation Of My Skills
 
Potenciação - Propriedades das potências
Potenciação - Propriedades das potênciasPotenciação - Propriedades das potências
Potenciação - Propriedades das potências
 
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
 
POTENCIAÇÃO E RADICIAÇÃO
POTENCIAÇÃO E RADICIAÇÃO POTENCIAÇÃO E RADICIAÇÃO
POTENCIAÇÃO E RADICIAÇÃO
 
Aula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e LogarítmicasAula 6 - Funções Exponenciais e Logarítmicas
Aula 6 - Funções Exponenciais e Logarítmicas
 
Mer - Modelo Entidade Relacionamento
Mer - Modelo Entidade RelacionamentoMer - Modelo Entidade Relacionamento
Mer - Modelo Entidade Relacionamento
 
8 Localização das instalações de apoio parte 2
8 Localização das instalações de apoio   parte 28 Localização das instalações de apoio   parte 2
8 Localização das instalações de apoio parte 2
 
Física - Gravitação universal -
Física - Gravitação universal -Física - Gravitação universal -
Física - Gravitação universal -
 
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...
Trocas de calor, quantidade de calor, calor específico, calor latente e dilat...
 
Aula de vetores
Aula de vetoresAula de vetores
Aula de vetores
 

Andere mochten auch

Apresentação de Business Intelligence
Apresentação de Business IntelligenceApresentação de Business Intelligence
Apresentação de Business IntelligenceJuliana Maria Lopes
 
Er Win7 3 Modelagem De Dados Inteligentes
Er Win7 3 Modelagem De Dados InteligentesEr Win7 3 Modelagem De Dados Inteligentes
Er Win7 3 Modelagem De Dados InteligentesCA RMDM Brasil
 
modelagem dimensional
modelagem dimensionalmodelagem dimensional
modelagem dimensionalElmar Ricardo
 
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...Carlos Eduardo Pantoja
 
Aula modelagem de dados
Aula modelagem de dadosAula modelagem de dados
Aula modelagem de dadosGabriel Moura
 
Introdução ao BI
Introdução ao BIIntrodução ao BI
Introdução ao BIpichiliani
 
Modelagem de dados e representação da informação
Modelagem de dados e representação da informaçãoModelagem de dados e representação da informação
Modelagem de dados e representação da informaçãoElvis Fusco
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dadosmlima72
 
Conceitos Tabelas Fatos e Dimensões no BI
Conceitos Tabelas Fatos e Dimensões no BIConceitos Tabelas Fatos e Dimensões no BI
Conceitos Tabelas Fatos e Dimensões no BIJosé Nascimento
 

Andere mochten auch (20)

Aula - Aspectos Avançados em Modelagem Multidimensional
Aula - Aspectos Avançados em Modelagem MultidimensionalAula - Aspectos Avançados em Modelagem Multidimensional
Aula - Aspectos Avançados em Modelagem Multidimensional
 
Inteligência de Negócios e Software Livre
Inteligência de Negócios e Software LivreInteligência de Negócios e Software Livre
Inteligência de Negócios e Software Livre
 
Manual Pentaho 3.5
Manual Pentaho 3.5Manual Pentaho 3.5
Manual Pentaho 3.5
 
Apresentação de Business Intelligence
Apresentação de Business IntelligenceApresentação de Business Intelligence
Apresentação de Business Intelligence
 
Er Win7 3 Modelagem De Dados Inteligentes
Er Win7 3 Modelagem De Dados InteligentesEr Win7 3 Modelagem De Dados Inteligentes
Er Win7 3 Modelagem De Dados Inteligentes
 
modelagem dimensional
modelagem dimensionalmodelagem dimensional
modelagem dimensional
 
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...
Modelando Banco de Dados Relacionais e Geográficos Utilizando a Ferramenta Ge...
 
Aula modelagem de dados
Aula modelagem de dadosAula modelagem de dados
Aula modelagem de dados
 
Pitch BestPoint - Campus Party
Pitch BestPoint - Campus PartyPitch BestPoint - Campus Party
Pitch BestPoint - Campus Party
 
Business Intelligence - Prática e Experiências
Business Intelligence - Prática e ExperiênciasBusiness Intelligence - Prática e Experiências
Business Intelligence - Prática e Experiências
 
Pitch AcheSeuEstúdio - Campus Party
Pitch AcheSeuEstúdio - Campus PartyPitch AcheSeuEstúdio - Campus Party
Pitch AcheSeuEstúdio - Campus Party
 
Introdução ao BI
Introdução ao BIIntrodução ao BI
Introdução ao BI
 
Modelagem de dados e representação da informação
Modelagem de dados e representação da informaçãoModelagem de dados e representação da informação
Modelagem de dados e representação da informação
 
Modelagem de Dados
Modelagem de DadosModelagem de Dados
Modelagem de Dados
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
Conceitos Tabelas Fatos e Dimensões no BI
Conceitos Tabelas Fatos e Dimensões no BIConceitos Tabelas Fatos e Dimensões no BI
Conceitos Tabelas Fatos e Dimensões no BI
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
Data Warehouse - Modelagem
Data Warehouse - ModelagemData Warehouse - Modelagem
Data Warehouse - Modelagem
 
Aula 4 banco de dados
Aula 4   banco de dados Aula 4   banco de dados
Aula 4 banco de dados
 

Ähnlich wie Derivação de Modelos ER

Mapeamento de Objetos para o Modelo Relacional.ppt
Mapeamento de Objetos para o Modelo Relacional.pptMapeamento de Objetos para o Modelo Relacional.ppt
Mapeamento de Objetos para o Modelo Relacional.pptJoberthSilva
 
TI para Concursos: Modelagem Conceitual de Bancos de Dados
TI para Concursos: Modelagem Conceitual de Bancos de DadosTI para Concursos: Modelagem Conceitual de Bancos de Dados
TI para Concursos: Modelagem Conceitual de Bancos de DadosEstratégia Concursos
 
Aula 3-IDB - Modelo Conceptual-2.pdf
Aula 3-IDB - Modelo Conceptual-2.pdfAula 3-IDB - Modelo Conceptual-2.pdf
Aula 3-IDB - Modelo Conceptual-2.pdfCelestino24
 
Diagrama de Classes.pdf
Diagrama de Classes.pdfDiagrama de Classes.pdf
Diagrama de Classes.pdfJoberthSilva
 
BANCO DE DADOS - Modelo conceitual - MER e DER.pdf
BANCO DE DADOS - Modelo conceitual - MER e DER.pdfBANCO DE DADOS - Modelo conceitual - MER e DER.pdf
BANCO DE DADOS - Modelo conceitual - MER e DER.pdfssusera5d99a
 
Banco de Dados
Banco de DadosBanco de Dados
Banco de DadosFabio Abel
 
UML - Criando Diagramas Eficientes
UML - Criando Diagramas EficientesUML - Criando Diagramas Eficientes
UML - Criando Diagramas EficientesRodrigo Cascarrolho
 
Modelagem
ModelagemModelagem
Modelagemprsimon
 
Modelagem relacional e normalização de dados
Modelagem relacional e normalização de dadosModelagem relacional e normalização de dados
Modelagem relacional e normalização de dadosjulianaveregue
 
Modelos de dados
Modelos de dadosModelos de dados
Modelos de dadosaeasantos
 
Atps de banco de dados rel 1 3-4 atualizado formato ok
Atps de banco de dados rel 1 3-4  atualizado formato okAtps de banco de dados rel 1 3-4  atualizado formato ok
Atps de banco de dados rel 1 3-4 atualizado formato okThyvis Kalevi
 
Por que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BIPor que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BILeonardo Karpinski
 
Aula desesenvolvimento segunda semana
Aula desesenvolvimento segunda semanaAula desesenvolvimento segunda semana
Aula desesenvolvimento segunda semanaGabriel Moura
 
Integração de Tecnologias
Integração de TecnologiasIntegração de Tecnologias
Integração de Tecnologiaselliando dias
 
CursoUML - Unified Modeling Language
CursoUML - Unified Modeling LanguageCursoUML - Unified Modeling Language
CursoUML - Unified Modeling Languageelliando dias
 
Modelagem Dimensional
Modelagem DimensionalModelagem Dimensional
Modelagem DimensionalMarco Garcia
 

Ähnlich wie Derivação de Modelos ER (20)

Mapeamento de Objetos para o Modelo Relacional.ppt
Mapeamento de Objetos para o Modelo Relacional.pptMapeamento de Objetos para o Modelo Relacional.ppt
Mapeamento de Objetos para o Modelo Relacional.ppt
 
TI para Concursos: Modelagem Conceitual de Bancos de Dados
TI para Concursos: Modelagem Conceitual de Bancos de DadosTI para Concursos: Modelagem Conceitual de Bancos de Dados
TI para Concursos: Modelagem Conceitual de Bancos de Dados
 
Aula 3-IDB - Modelo Conceptual-2.pdf
Aula 3-IDB - Modelo Conceptual-2.pdfAula 3-IDB - Modelo Conceptual-2.pdf
Aula 3-IDB - Modelo Conceptual-2.pdf
 
Principais diagramas da UML
Principais diagramas da UMLPrincipais diagramas da UML
Principais diagramas da UML
 
Diagrama de Classes.pdf
Diagrama de Classes.pdfDiagrama de Classes.pdf
Diagrama de Classes.pdf
 
BANCO DE DADOS - Modelo conceitual - MER e DER.pdf
BANCO DE DADOS - Modelo conceitual - MER e DER.pdfBANCO DE DADOS - Modelo conceitual - MER e DER.pdf
BANCO DE DADOS - Modelo conceitual - MER e DER.pdf
 
Banco de Dados
Banco de DadosBanco de Dados
Banco de Dados
 
Aula-04-UML.pptx
Aula-04-UML.pptxAula-04-UML.pptx
Aula-04-UML.pptx
 
Modelagem e elaboração de componentes
Modelagem e elaboração de componentesModelagem e elaboração de componentes
Modelagem e elaboração de componentes
 
Bases De Dados
Bases De DadosBases De Dados
Bases De Dados
 
UML - Criando Diagramas Eficientes
UML - Criando Diagramas EficientesUML - Criando Diagramas Eficientes
UML - Criando Diagramas Eficientes
 
Modelagem
ModelagemModelagem
Modelagem
 
Modelagem relacional e normalização de dados
Modelagem relacional e normalização de dadosModelagem relacional e normalização de dados
Modelagem relacional e normalização de dados
 
Modelos de dados
Modelos de dadosModelos de dados
Modelos de dados
 
Atps de banco de dados rel 1 3-4 atualizado formato ok
Atps de banco de dados rel 1 3-4  atualizado formato okAtps de banco de dados rel 1 3-4  atualizado formato ok
Atps de banco de dados rel 1 3-4 atualizado formato ok
 
Por que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BIPor que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BI
 
Aula desesenvolvimento segunda semana
Aula desesenvolvimento segunda semanaAula desesenvolvimento segunda semana
Aula desesenvolvimento segunda semana
 
Integração de Tecnologias
Integração de TecnologiasIntegração de Tecnologias
Integração de Tecnologias
 
CursoUML - Unified Modeling Language
CursoUML - Unified Modeling LanguageCursoUML - Unified Modeling Language
CursoUML - Unified Modeling Language
 
Modelagem Dimensional
Modelagem DimensionalModelagem Dimensional
Modelagem Dimensional
 

Mehr von Mauricio Cesar Santos da Purificação

Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Mauricio Cesar Santos da Purificação
 
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroIntelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroMauricio Cesar Santos da Purificação
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Mauricio Cesar Santos da Purificação
 

Mehr von Mauricio Cesar Santos da Purificação (20)

Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
 
R para Iniciantes
R para IniciantesR para Iniciantes
R para Iniciantes
 
Aprendendo R
Aprendendo RAprendendo R
Aprendendo R
 
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroIntelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Flyer BestPoint
Flyer BestPointFlyer BestPoint
Flyer BestPoint
 
Pitch BestPoint
Pitch BestPointPitch BestPoint
Pitch BestPoint
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
OxenTI - Desenvolvimento de Soluções Inovadoras em TI
OxenTI - Desenvolvimento de Soluções Inovadoras em TIOxenTI - Desenvolvimento de Soluções Inovadoras em TI
OxenTI - Desenvolvimento de Soluções Inovadoras em TI
 
Pitch BestPoint - DemoDay StartupSummer 2015
Pitch BestPoint - DemoDay StartupSummer 2015Pitch BestPoint - DemoDay StartupSummer 2015
Pitch BestPoint - DemoDay StartupSummer 2015
 
BestPoint
BestPointBestPoint
BestPoint
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
QlikView In Action - Do BI ao Business Discovery!…
QlikView In Action - Do BI ao Business Discovery!…QlikView In Action - Do BI ao Business Discovery!…
QlikView In Action - Do BI ao Business Discovery!…
 
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
 
Adeus BI, Seja Bem Vindo a Era do Analytics?
Adeus BI, Seja Bem Vindo a Era do Analytics?Adeus BI, Seja Bem Vindo a Era do Analytics?
Adeus BI, Seja Bem Vindo a Era do Analytics?
 
Business Intelligence & Business Analytics
Business Intelligence & Business AnalyticsBusiness Intelligence & Business Analytics
Business Intelligence & Business Analytics
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BIAula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
 
Aula - Metodologias Ágeis
Aula - Metodologias ÁgeisAula - Metodologias Ágeis
Aula - Metodologias Ágeis
 

Derivação de Modelos ER

  • 1. Derivação de Modelos ER para Modelagem Multidimensional Setembro / 2009
  • 3. Introdução De acordo com KIMBALL (1997) a modelagem de data warehouse é completamente diferente da modelagem de sistemas transacionais e que as técnicas de modelagem E/R não podem ser igualmente aplicadas. No entanto, MOODY & KORTINK (2000) argumentam que a modelagem E/R é igualmente aplicável no projeto de data warehouse e data mart.
  • 4. Introdução Segundo MOODY & KORTINK (2000), a abordagem de projeto proposta por Kimball é introdutória e baseia-se apenas no levatamento de requisitos dos usuários identificando os componentes (fatos relevantes que precisam ser agregados e atributos dimensionais agregáveis) básicos do esquema estrela. O data warehouse resultante não passaria de um conjunto discreto de esquemas estrela.
  • 5. Problemas Relacionados à Metodologia de KIMBALL Imprevisibilidade dos requisitos dos usuários resulta em projeto instável; Projeto incorreto caso o projetista não entenda os relacionamentos entre os dados; Agregação prematura dos dados resulta em perda de informação; A abordagem é apresentada através de exemplos ao invés de uma metodologia de projeto concreta.
  • 6. A Metodologia de MOODY & KORTINK A proposta de MOODY & KORTINK (2000) para projeto de data warehouse baseia-se na derivação de modelos dimensionais a partir de modelos de dados globais amplamente conhecidos como modelos E/R. A metodologia concentra-se em três etapas básicas: Classificação das entidades Identificação das hierarquias Projeto de modelo dimensional
  • 7. Modelo de Dados de Exemplo
  • 8.
  • 9. Classificação das Entidades Entidades de Transação: As entidades transação registram os detalhes de eventos relacionados aos negócios da empresa. As principais características destas entidades são: a) descrevem um evento que ocorre em um ponto específico no tempo; b) contém medidas ou quantidades as quais podem ser sumarizadas.
  • 10. Classificação das Entidades Entidades Componente: Uma entidade componente é aquela que está diretamente relacionada com a entidade transação através de um relacionamento “um-para- muitos”. As entidades componente respondem as perguntas: · Quando aconteceu o fato ? · Quem é o personagem do fato ? · O que é o objeto do fato ? · Onde aconteceu o fato ?
  • 11. Classificação das Entidades Entidades de Classificação: As entidades de classificação são as entidades que estão relacionadas com as entidades componentes através de relacionamentos “um-para-muitos”, isto é, eles são funcionalmente dependentes das entidades componentes (direta ou transitiva). As entidades de classificação representam hierarquias inseridas no modelo de dados através das entidades componentes para formar tabelas de dimensão em um esquema estrela.
  • 12. Modelo Resultante da Classificação das Entidades No diagrama, as entidades em preto representam entidades de Transação. As entidades em cinza representam entidades Componente e as entidades em branco representam entidades de Classificação.
  • 13.
  • 14. Como Resolver Duplicidades de Classificação ? Hierarquia de precedência: 1. Entidades de transação (mais alta precedência); 2. Entidades de Classificação; 3. Entidades de Componente (mais baixa precedência). Ainda, segundo Moody, na prática, algumas entidades não conformam com nenhuma destas categorias. Estas entidades não se ajustam na estrutura do modelo dimensional não podendo ser incluídas em modelos estrela.
  • 15. Identificação das Hierarquias Representam a base para a derivação de modelos E/R em modelos dimensionais. Uma hierarquia no modelo E/R é representada por uma seqüência de entidades ligadas através de relacionamentos “um-para-muitos” todos na mesma direção.
  • 16.
  • 17. Identificação das Hierarquias Na terminologia hierárquica: A entidade Estado é “pai” de Região Região é “dependente” de Estado ItemVenda,Venda, Local e Região, são todas descendentes de Estado Venda, Local, Região e Estado, são todas ascendentes de ItemVenda
  • 18. Projeto de Modelos Multidimensionais Utilização dos operadores: Colapso de hierarquia e Agregação.
  • 19. Colapso de Hierarquia Com este operador, as entidades de nível mais alto podem ser inseridas em entidades de nível mais baixo dentro da hierarquia. Esta operação introduz redundância, na forma de dependência transitiva, o qual é uma violação da terceira forma normal (CODD, 1970). A ocultação de um nível na hierarquia das entidades resulta na desnormalização do modelo.
  • 20.
  • 21. Agregação Através do operador de agregação criam-se novas entidades contendo dados sumarizados. Um conjunto de atributos da entidade origem é escolhido para agregar (os atributos de agregação) e um conjunto de atributos destino recebe o agrupamento (atributos de agrupamento). Os atributos de agregação devem ser quantitativos numéricos.
  • 22.
  • 23. Avaliação dos Operadores Usando os operadores descritos acima, pode-se produzir diferentes esquemas dimensionais a partir de um modelo E/R. Cada uma das alternativas representa um diferente “trade-off” (custo X benefício) entre complexidade e redundância.
  • 24. Quanto mais simples o modelo, maior a redundância. À medida que a redundância é removida, o grau de complexidade do modelo aumenta.
  • 25. Geração do Modelo Final · Uma tabela de fatos é formada para cada entidade transação. A chave da tabela é a combinação das chaves das entidades componente associadas; · Uma tabela de dimensão é formada para cada entidade componente. A chave desta entidade (tabela de dimensão) será formada pela composição das chaves das entidades de classificação;
  • 26. Geração do Modelo Final · Onde existirem relacionamentos hierárquicos entre as entidades transação, a entidade dependente herda todas as dimensões (e atributos chave) da entidade pai. · Isto provê a habilidade de efetuar operações “drill- down” entre os níveis de transação; · Os atributos numéricos das entidades transação devem ser agregados pelos atributos chave das dimensões.
  • 27. Esquema Estrela Resultante da Entidade Fato Venda
  • 28.
  • 29. Esquema Estrela Resultante da Entidade Fato Item-Venda
  • 30.
  • 31. Avaliação e Refinamento Combinar tabelas de fato: As tabelas (de fato) que possuem as mesmas chaves primárias podem ser combinadas em uma única tabela. Isto reduz o número de esquemas estrela, facilitando o trabalho de análise e comparação entre fatos relacionados.
  • 32. Avaliação e Refinamento Combinar tabelas de dimensão: A criação de uma tabela de dimensão a partir de cada entidade componente muitas vezes resulta em um grande número de tabelas de dimensão. Para simplificar a estrutura do data warehouse as dimensões relacionadas devem ser consolidadas em uma única tabela de dimensão.
  • 33. Avaliação e Refinamento Relacionamentos Muitos-para-Muitos: Grande parte da complexidade enfrentada na conversão de modelos E/R para modelos dimensionais resultam dos relacionamentos muitos-para-muitos. Estes relacionamentos causam problemas na modelagem dimensional, pois representam uma “quebra” na estrutura hierárquica e conseqüentemente não podem ser simplificadas diretamente.
  • 34. Bibliografia MOODY, Daniel L.; KORTINK, Mark A.R. From Enterprise Models to Dimensional Models: A Methodology for Data warehouse and Data mart Design. (DMDW´2000). KIMBALL, Ralph. A Dimensional Modeling Manifesto. DBMS,http://www.dbmsmag.com/9708d15.html. Agosto, 1997. KIMBALL, Ralph. Data warehouse Toolkit. São Paulo: Editora Makron Books, 1998.
  • 35. Além do Star e do SnowFlake Schema
  • 36. Flat Schema O esquema Flat é o modelo mais simples possivel sem perda de informações. Este é formado pelo colapso de todas as entidades do modelo de dados para as entidades minimas.
  • 37. Terraced Schema O Terraced Schema é formado pelo colapso de entidades até a hierarquia máxima parando quando encontra uma entidade de transação. Isso resulta em uma única tabela para cada entidade de transação existente.
  • 39. Constellation Schema Em vez de um número discreto de esquemas estrela, o modelo de dados de exemplo pode ser transformado em uma esquema constelação. Um esquema constelação consiste num conjunto de esquemas em estrela com tabelas de fatos ligadas hierarquicamente. As ligações entre as tabelas de fatos diferentes fornecem a capacidade de "drill down" entre os níveis de detalhe (por exemplo,Sale and Item Sale).
  • 42. Star Cluster Schema Kimball argumenta que o modelo Snowflake é indesejável devido ao aumento da complexidade do esquema e as junções extras requeridas nas consultas. Porém, pode-se considerar que nem um Star- schema puro ou um Snowflake-schema puro resultem na melhor solução. A solução ideal é portanto o equilibrio entre os dois esquemas citados.