SlideShare ist ein Scribd-Unternehmen logo
1 von 15
2.4.12 - OLAP
OLAP (On-Line Analytical Processing) representa um conjunto de tecnologias projetadas para
suportar análise e consultas ad hoc. Sistemas OLAP ajudam analistas e executivos a
sintetizarem informações sobre a empresa, através de comparações, visões personalizadas,
análise histórica e projeção de dados em vários cenários de "e se ..." . Sistemas OLAP são
implementados para ambientes multi-usuário, arquitetura cliente-servidor e oferecem respostas
rápidas e consistentes às consultas iterativas executadas pelos analistas , independente do
tamanho e complexidade do banco de dados.
A característica principal dos sistemas OLAP é permitir uma visão conceitualmulti-
dimensional dos dados de uma empresa. A visão muti-dimensional é muito mais útil para os
analistas do que a tradicional visão tabular utilizada nos sistemas de processamento de
transação. Ela é mais natural, fácil e intuitiva, permitindo a visão em diferentes perspectivas
dos negócios da empresa e desta maneira tornando o analista um explorador da informação.
A modelagem dimensional é a técnica utilizada para se ter uma visão multi-dimensional dos
dados. Nesta técnica os dados são modelados em uma estrutura dimensional conhecida por
cubo. As dimensões do cubo representam os componentes dos negócios da empresa tais
como "cliente", "produto" , "fornecedor" e "tempo". A célula resultante da interseção das
dimensões é chamada de medida e geralmente representa dados numéricos tais como
"unidades vendidas" , "lucro" e "total de venda". Além dos componentes dimensão e medida
outro importante aspecto do modelo multi-dimensional é a consolidação dos dados uma vez
que para a tarefa de análise são mais úteis e significativos a agregação (ou sumarização) dos
valores indicativos dos negócios.
Além da visão multi-dimensional dos dados da empresa, outras importantes características dos
sistemas OLAP são :
• Análise de tendências. A tecnologia OLAP é mais do que uma forma de visualizar a
história dos dados. Deve, também, ajudar os usuários a tomar decisões sobre o futuro,
permitindo a construção de cenários ( "e se ...") a partir de suposições e fórmulas
aplicadas, pelos analistas, aos dados históricos disponíveis ;
• Busca automática (reach-through) de dados mais detalhados que não estão
disponíveis no servidor OLAP. Detalhes não são normalmente importantes na tarefa de
análise mas quando necessários, o servidor OLAP deve ser capaz de buscá-los;
• Dimensionalidade genérica;
• Operação trans-dimensional. Possibilidade de fazer cálculos e manipulação de dados
através diferentes dimensões;
• Possibilidade de ver os dados de diferentes pontos de vista (slice and dice), mediante a
rotação (pivoting) do cubo e a navegação (drill-up/drill-down) entre os níveis de
agregação;
• Conjunto de funções de análise e cálculos não triviais com os dados.
Quanto a localização dos dados a serem utilizados na análise, atualmente existem duas
abordagens para este local :
• Um banco de dados multi-dimensional especializado ;
• ou um data warehouse implementado com a tecnologia de banco de dados relacional,
mas otimizado para a tarefa de análise. Neste caso os dados são modelados utilizando
um esquema especialmente projetado para balancear performance e volume de dados.
Normalmente, uma representação desnormalizada conhecida por esquema estrela
(vide sub-seção 7.2) é utilizada
Sistemas OLAP que implementam a primeira abordagem são chamados de MOLAP e aqueles
que implementam a segunda são chamados de ROLAP (Relational-OLAP).
Uma outra abordagem é a utilização de ferramentas front-end com capacidade de extrair e
representar dados em múltiplas dimensões utilizando um banco de dados sem nenhuma
funcionalidade para suportar a visão multi-dimensional. Esta abordagem é conhecida por
desktop OLAP. Mas as abordagens MOLAP e ROLAP são as mais utilizadas devido ao grande
volume de dados que são capazes de manipular.
A integração dos sistemas OLAP e data warehouse pode ser feita utilizando um dos cenários a
seguir:
No cenário 1, uma ferramenta ROLAP fornece um front-end para um data warehouse. Neste
caso, o acesso aos dados é feito via um modelo multi-dimensional dos negócios mapeado na
estrutura do data warehouse. Este cenário é apropriado para empresas que analisam uma
significante porção dos dados do data warehouse.
No cenário 2, a ferramenta OLAP tem seu próprio banco de dados multi-dimensional que é
carregado com dados oriundos do data warehouse. O cenário 3 é similar ao 1 sendo que a
diferença é o servidor multi-dimensional (vide seçao 7.3 , MOLAP x ROLAP). Os cenários 2 e 3
são mais apropriados quando um segmento específico dos dados é utilizado na análise.
Exemplos de soluções MOLAP, ROLAP e desktop OLAP são fornecidos a seguir.
Servidor de Banco de Dados Multi-Dimensional
o Arbor Software Essbase
o Information Builders FOCUS/Fusion
o Holistics Systems Holos
o Hyperion Enterprise
o Kenan Technologies Acumate ES
o Oracle Express Server
o Pilot (D&B) LightShip Server
o Planning Sciences GentiumDB
o Sinper TM/1
Sistema ROLAP
o Andyne PaBLO
o Cognos PowerPlay
o Information Advantage DecisionSuite 3.0
o Informix-MetaCube
o MicroStrategy DSS Agent
o Prodea Beacon
Cliente MOLAP
• Comshare Commander EIS/OLAP
• Holistics Systems Holos
• Kenan Technologies Acutrieve
• Oracle Express Objects e Express Analyzer
• Pilot (D&B) LightShip Professional
• Planning Sciences Gentium
Desktop OLAP
• Andyne GQL
• Brio BrioQuery
• Business Objects BusinessObjects
• Cognos Impromptu
Nas sub-seções a seguir são apresentados os conceitos básicos da modelagem dimensional e
do esquema estrela e, por último, as características e as diferenças das abordagens MOLAP e
ROLAP.
Modelo Multi-Dimensional
Esta técnica de modelagem permite a visualização multi-dimensional do universo de uma
organização. Para os analistas das empresas, esta é uma forma mais natural, fácil e intuitiva de
trabalhar. As grandes vantagens deste modelo são a sua simplicidade e o fato de poder ser
implementado em diferentes tipos de banco de dados, relacional, multi-dimensional ou
orientado a objetos.
Através de comparações com o modelo entidade-relacionamento, são apresentadas a seguir
as principais características do modelo multi-dimensional. Suponha a seguinte tabela de uma
base relacional :
Produto Região Vendas
Leite Sul 50
Leite Sudeste 260
Leite Nordeste 100
Leite Centro Oeste 40
Leite Norte 70
Iogurte Sul 80
Iogurte Sudeste 190
Iogurte Nordeste 120
Iogurte Centro Oeste 140
Iogurte Norte 20
Manteiga Sul 10
Manteiga Sudeste 300
Manteiga Nordeste 55
Manteiga Centro Oeste 80
Manteiga Norte 200
Requeijão Sul 130
Requeijão Sudeste 230
Requeijão Nordeste 75
Requeijão Centro Oeste 40
Requeijão Norte 100
Tabela 3 - Tabela relacional
Uma maneira mais natural para representar a tabela acima seria utilizar uma matriz bi-
dimensional :
Sul Sudeste Nordeste Centro Oeste Norte
Leite 50 260 100 40 70
Iogurte 80 190 120 140 20
Manteiga 10 300 55 80 200
Requeijão 130 230 75 40 100
Tabela 4 - Tabela dimensional
No modelo multi-dimensional, a matriz apresentada acima representa o fator "Vendas"
dimensionado por "Produtos" e "Regiões". Consultas do tipo "Qual foi a venda de manteiga
na região sul ?" seriam executadas, na tabela relacional, acessando apenas um registro. No
entanto, consultas do tipo "Qual foi o total de vendas na região Nordeste ? " seriam executadas
acessando muitos valores e totalizando-os. Em uma base relacional, dependendo do seu
tamanho, a tarefa de acessar os valores e agregá-los (totalizar) pode tomar um tempo
considerável. No modelo multi-dimensional, a segunda consulta seria executada acessando a
coluna "Nordeste" e agregando os valores. Entretanto, neste modelo o tempo de resposta
ainda depende da quantidade de valores a serem agregados. O que muitos usuários desejam
de suas aplicações é um tempo de resposta consistente, independentemente da consulta
executada. A maneira de se obter tempo de resposta consistente é consolidar (ou pré-
agregar) todos os totais e sub-totais. Na verdade isto pode ser perfeitamente alcançado em
uma base relacional. Continuando o exemplo da tabela relacional, a consolidação se daria da
seguinte maneira :
Produto Região Vendas
Leite Sul 50
Leite Sudeste 260
Leite Nordeste 100
Leite Centro Oeste 40
Leite Norte 70
Iogurte Sul 80
Iogurte Sudeste 190
Iogurte Nordeste 120
Iogurte Centro Oeste 140
Iogurte Norte 20
Manteiga Sul 10
Manteiga Sudeste 300
Manteiga Nordeste 55
Manteiga Centro Oeste 80
Manteiga Norte 200
Requeijão Sul 130
Requeijão Sudeste 230
Requeijão Nordeste 75
Requeijão Centro Oeste 40
Requeijão Norte 100
Tabela 5 - Tabela Relacional
Produto Total
Leite 520
Iogurte 550
Manteiga 645
Requeijão 575
Tabela 6 - Consolidação
Região Total
Sul 270
Sudeste 980
Nordeste 350
Centro Oeste 300
Norte 390
Total 2290
Tabela 7 - Consolidação
No modelo dimensional a consolidação se daria da seguinte maneira :
Sul Sudeste Nordeste
Centro
Oeste
Norte Total
Leite 50 260 100 40 70 520
Iogurte 80 190 120 140 20 550
Manteiga 10 300 55 80 200 645
Requeijão 130 230 75 40 100 575
Total 270 980 350 300 390 2290
Tabela 8 - Consolidação
Observando os dois modelos, percebe-se que o dimensional, além de ser mais claro, requer
menos espaço.
Antes de prosseguir com conceitos do modelo dimensional alguma terminologia deve ser
introduzida : "sul", "sudeste", e etc são membros de entrada da dimensão "Região" . Os
totais são membros de saída. "leite", "iogurte" , "manteiga", "requeijão" e "total" são
membros de entrada da dimensão "Produto" . A intersecção das duas dimensões é chamada
de célula ou medida. No exemplo acima existem 30 células. Este conjunto (ou área) de
células representa uma variável. Variáveis geralmente são medidas numéricas tais como
vendas, custos, lucros e etc...
Esta é uma hierarquia simples onde cada membro de entrada tem apenas um nível de
detalhamento. No próximo esquema é mostrado uma hierarquia com múltiplos níveis.
Neste esquema , as regiões representam níveis mais genéricos e as cidades representam os
níveis mais detalhados. Na terminologia dimensional, a ação de ir de um nível genérico para
um mais detalhado é chamado de drill-down. A ação inversa é chamada de drill-up.
Múltiplos níveis de hierarquia podem ser implementados através de múltiplas dimensões (uma
para cada nível) ou dimensões hierárquicas. A hierarquia "estado-cidade" seria
implementada da seguinte maneira utilizando-se múltiplas dimensões :
Esta solução apresenta dois problemas : o primeiro é que haverá uma célula vazia na
intersecção de cada cidade com um estado que não seja o seu, gerando uma base de dados
altamente esparsa. O segundo problema surge quando o número de níveis da hierarquia
aumenta. Torna-se extremamente complicado trabalhar com várias dimensões.
Dimensões hierárquicas é uma solução que se adeqüa melhor aos múltiplos níveis de uma
hierarquia. A figura abaixo ilustra o esquema multi-hierárquico apresentado acima.
Quando utiliza dimensões hierárquicas, o servidor OLAP "entende" da hierarquia implementada
e sabe como agregar os dados. Por exemplo, o servidor "sabe" que não deve somar os dados
de "estado" e "região" porque os dados do "estado" já foram incluídos na "região".
Outro aspecto muito importante do modelo dimensional se refere às variáveis. Como já
mencionado antes, variáveis geralmente são medidas numéricas tais como "vendas" , "preço" ,
"custo" , etc. Variáveisdevem incorporar regras de consolidação, isto é, ações que devem ser
feitas quando se passa de um nível de detalhamento para outro. Por exemplo, somar os dados
de "vendas" ou tirar a média do "preço" quando se passa do nível "cidade" para o nível
"estado". Variáveis podem ter outros atributos tais como descrição , unidade, regra de
conversão e etc.
Outro conceito a ser introduzido neste ponto é variável derivada. Uma variável é dita
derivada quando é aplicado um cálculo ao dado, antes deste ser apresentado ao usuário. Para
o usuário é como se o dado estivesse na base de dados no entanto, a transformação é feita no
momento da consulta.
Esquema Estrela (Star Schema)
O esquema estrela é a representação do modelo dimensional em bancos de dados
relacionais. No esquema estrela existe uma tabela dominante no centro do esquema. Esta é a
única tabela com múltiplos relacionamentos para as outras tabelas. As outras tabelas possuem
um único relacionamento para a tabela central. A tabela central é chamda fato (fact table) e as
outras tabelas são chamadas de dimensão (dimension table). A figura abaixo ilustra o
esquema estrela.
A tabela fato é onde uma ou mais medidas numéricas dos negócios da empresa são
armazenadas. Os fatos podem ser "vendas" , "custo" , "unidades vendidas" , etc. Os fatos
devem ser numéricos porque eles serão agregados utilizando-se operações tais como, média ,
soma, contagem e etc. Não faz sentido executar tais operações em dado textual. Os fatos
podem ser aditivos, semi-aditivos e nao-aditivos. Um fato é aditivo quando pode ser
agregado em todas as dimensões. Por exemplo, "vendas" pode ser agregado em qualquer
combinação das dimensões "tempo", "produto" e "loja". Um fato é semi-adititivo quando ele não
é adititvo em uma dimensão. Por exemplo, o número de empregados é aditivo nos diferentes
departamentos da empresa mas não é aditivo na dimensão "tempo". Um fato é não-aditivo
quando não pode ser agregado em nenhuma dimensão. Não faz muito sentido utilizar um fato
deste tipo mas um uso para ele seria uma simples contagem. Quando uma tabela não tem
nenhum fato associado a ela, a tabela é dita ser sem-fato (factless table). Isto acontece
quando a tabela fato representa eventos que não tem nenhuma medida numérica associada,
apenas a sua própria ocorrência. Por exemplo, a matrícula de um aluno em determinada
matéria.
As tabelas de dimensão descrevem os fatos. Geralmente as colunas são textos e as tabelas
são altamente de-normalizadas para que o desenho da base fique simples. Uma dimensão
contém uma ou mais hierarquias que podem ser decompostas em tabelas separadas, gerando
uma estrutura conhecida por snowflake. A próxima figura ilustra uma estrutura snowflake.
Na verdade, snowflake significa a normalização da tabela. Isto elimina redundância e diminui o
espaço em disco. Mas, em um data warehouse, redundância não é importante porque não é
um ambiente transacional, operações de update não ocorrem com freqüencia. Espaço físico
também é irrelevante porque a tabela fato é que ocupará a maior parte deste espaço.
Para uma boa performance do esquema estrela, é importante determinar o nível de
consolidação, ou a granularidade, dos fatos. O fato pode estar no nível de transação, por
exemplo, a venda individual de determinado produto, ou o fato pode ser armazenado com uma
consolidação maior, como por exemplo, a venda de determinada linha de produtos em um dia.
Armazenando o fato a nível de transação faz com que o tamanho da tabela fato se torne
excessivo e, além disso, este nível de detalhamento pode ser de pouca utilidade.
MOLAP x ROLAP
Multi-dimensional OLAP (MOLAP) é uma classe de sistemas que permite a execução de
análises sofisticadas usando como gerenciador de dados um banco de dados multi-
dimensional. Em um banco de dados MOLAP os dados são mantidos em arranjos e indexados
de maneira a prover uma ótima performance no acesso a qualquer elemento. O indexamento, a
antecipação da maneira como os dados serão acessados e o alto grau de agregação dos
dados fazem com que sistemas MOLAP tenham uma excelente performance. Além de serem
rápidos, outra grande vantagem destes sistemas é o rico e complexo conjunto de funções de
análise que oferecem.
A maneira de se implentar os arranjos de dados pode variar entre fornecedores de soluções
MOLAP. Existem as arquiteturas hiper-cubos e multi-cubos. Na arquiteturahiper-cubo
existe um único cubo onde cada medida é referenciada por todas as outras dimensões. Por
exemplo, um cubo onde a medida "vendas" é referenciada pelas dimensões "produto" , "ano" ,
"mes", "estado" e "cidade" . Além da dificuldade em visualizar tal "cubo" (com 5 dimensões !!!)
outros problemas desta abordagem são a maior necessidade de espaço em disco e a
existência de um mecanismo para controlar a esparsidade dos dados que ocorre quando não
existe uma medida na interseção das dimensões. Por exemplo, quando um produto não é
vendido em determinado estado. A grande vantagem é a consistência no tempo de resposta
que é independente do número de dimensões envolvidas na consulta.
Na arquitetura multi-cubos uma medida é referenciada por dimensões selecionadas. Em um
cubo, a medida "vendas" é referenciada pelas dimensões "semestre" , "estado" e "produto" e
em outro cubo, a medida "custo" é referenciada pelas dimensões "mes" e "departamento". Esta
arquitetura é escalável e utiliza menos espaço em disco. A performance é melhor em cada
cubo individualmente, no entanto, consultas que requerem acesso a mais de um cubo podem
exigir processamentos complexos para garantir a consistência do tempo de resposta.
Existem algumas limitações nos sistemas MOLAP. Bancos de dados multi-dimensionais são
sistemas proprietários que não seguem padrões (linguagem, API) estabelecidos pela indústria
de banco de dados. Isto se torna uma desvantagem para tais sistemas, uma vez que a
arquitetura não é aberta. A utilização das estruturas dimensionais adotadas também traz
algumas desvantagens. Mudanças do modelo dimensional requerem uma re-organização do
banco de dados e a estrutura de cubos não suporta a criação ad hoc de visões multi-
dimensionais. Além desta falta de flexibilidade, sistemas MOLAP enfretam problemas quanto a
escalabilidade porque um dos recursos para garantir a excelente performance é manter os
índices dos arranjos na memória e isto acaba limitando bancos de dados multi-dimesnional a
20 ou 30 gigabytes de dados tornando-os, desta maneira, mais apropriados para data marts ou
organizações com pequenos data warehouses.
Sistemas ROLAP fornecem análise multi-dimensional de dados armazenados em uma base de
dados relacional. Atualmente existem duas maneiras de se fazer este trabalho :
• fazer todo o processamento dos dados no servidor da base de dados. O servidor OLAP
gera os comandos SQL em múltiplos passos e as tabelas temporárias necessárias
para o processamento das consultas;
• ou executar comandos SQL para recuperar os dados mas fazer todo o processamento
(incluindo joins e agregações) no servidor OLAP.
Além das características básicas de sistemas OLAP, servidores ROLAP devem também :
• Utilizar metadados para descrever o modelo dos dados e para auxiliar na construção
das consultas. Desta maneira um analista pode executar suas análises utilizando seus
próprios termos.
• Criar comandos SQL otimizados para os bancos de dados com o qual trabalha.
A principal vantagem de se adotar uma solução ROLAP reside na utilização de uma tecnologia
estabelecida, de arquitetura aberta e padronizada como é a relacional, beneficiando-se da
diversidade de plataformas, escalabilidade e paralelismo de hardware ( SMP e MPP) .
Quanto as limitações, pode-se citar o pobre conjunto de funções para análise, a inadeqäação
do esquema estrela para atualização dos dados e as soluções proprietárias para metadados
que acaba por anular muitas das vantagens do uso da tecnologia relacional.
MOLAP OU ROLAP ? Qual escolher ? Atualmente existe um grande debate sobre esta questão
e se possível, este debate deve ser deixado para os fornecedores. Para quem vai utilizar a
tecnologia o mais importante é entender os negócios da empresa para então decidir pela
solução que melhor atende o volume de dados e as necessidades de análise da empresa.
Provavelmente este debate não terá um vencedor. Já é notado que existe uma convergência
destas duas tecnologias. Fornecedores MOLAP têm adicionado funcionalidade ROLAP nos
seus produtos e similarmente, fornecedores ROLAP têm enriquecido a funcionalidade e
performance de seus servidores.
Conclusão
Data warehouse e OLAP são as respostas as demandas de usuários que precisam tomar
decisões em uma
organização. Data warehouse e OLAP fazem parte de uma arquitetura de sistemas para
suporte a decisão. Data
warehouse provê a integração dos dados e OLAP oferece os mecanismos que realmente tira
os benefícios do data
warehouse. A utilização em conjunto destas duas tecnologias dão às empresas os meios para
medir e gerenciar seus
negócios eficientemente.

Weitere ähnliche Inhalte

Andere mochten auch

Olap and data warehouse -inmon 050204 u
Olap and data warehouse -inmon 050204 uOlap and data warehouse -inmon 050204 u
Olap and data warehouse -inmon 050204 uTalita Lima
 
Gestão do conhecimento usando data mining
Gestão do conhecimento usando data miningGestão do conhecimento usando data mining
Gestão do conhecimento usando data miningTalita Lima
 
15.03.26 gestão do conhecimento usando data mining
15.03.26   gestão do conhecimento usando data mining15.03.26   gestão do conhecimento usando data mining
15.03.26 gestão do conhecimento usando data miningTalita Lima
 
14.01.02 business intelligence no ambiente
14.01.02    business intelligence no ambiente14.01.02    business intelligence no ambiente
14.01.02 business intelligence no ambienteTalita Lima
 
A evoluo do business intelligence
A evoluo do business intelligenceA evoluo do business intelligence
A evoluo do business intelligenceTalita Lima
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informaçãoTalita Lima
 
Análise da gestão do orçamento de vendas com a utilização do bi o caso bar...
Análise da gestão do orçamento de vendas com a utilização do bi    o caso bar...Análise da gestão do orçamento de vendas com a utilização do bi    o caso bar...
Análise da gestão do orçamento de vendas com a utilização do bi o caso bar...Talita Lima
 
(Ebook pdf) olap
(Ebook   pdf) olap(Ebook   pdf) olap
(Ebook pdf) olapTalita Lima
 
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...Talita Lima
 
Estudo de caso sobre business intelligence
Estudo de caso sobre business intelligenceEstudo de caso sobre business intelligence
Estudo de caso sobre business intelligenceTalita Lima
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTalita Lima
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentahoTalita Lima
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationJarley Nóbrega
 

Andere mochten auch (15)

Big data
Big dataBig data
Big data
 
Olap and data warehouse -inmon 050204 u
Olap and data warehouse -inmon 050204 uOlap and data warehouse -inmon 050204 u
Olap and data warehouse -inmon 050204 u
 
Gestão do conhecimento usando data mining
Gestão do conhecimento usando data miningGestão do conhecimento usando data mining
Gestão do conhecimento usando data mining
 
15.03.26 gestão do conhecimento usando data mining
15.03.26   gestão do conhecimento usando data mining15.03.26   gestão do conhecimento usando data mining
15.03.26 gestão do conhecimento usando data mining
 
14.01.02 business intelligence no ambiente
14.01.02    business intelligence no ambiente14.01.02    business intelligence no ambiente
14.01.02 business intelligence no ambiente
 
A evoluo do business intelligence
A evoluo do business intelligenceA evoluo do business intelligence
A evoluo do business intelligence
 
Bi mercado (1)
Bi mercado (1)Bi mercado (1)
Bi mercado (1)
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informação
 
Análise da gestão do orçamento de vendas com a utilização do bi o caso bar...
Análise da gestão do orçamento de vendas com a utilização do bi    o caso bar...Análise da gestão do orçamento de vendas com a utilização do bi    o caso bar...
Análise da gestão do orçamento de vendas com a utilização do bi o caso bar...
 
(Ebook pdf) olap
(Ebook   pdf) olap(Ebook   pdf) olap
(Ebook pdf) olap
 
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...
As piores-praticas-em-business-intelligence-razoes-para-o-sucesso-das-aplicac...
 
Estudo de caso sobre business intelligence
Estudo de caso sobre business intelligenceEstudo de caso sobre business intelligence
Estudo de caso sobre business intelligence
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literatura
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentaho
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data Integration
 

Ähnlich wie 12.08.22 olap

Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)EderPereira33
 
Business Intelligence com o microsoft sql server
Business Intelligence com o microsoft sql serverBusiness Intelligence com o microsoft sql server
Business Intelligence com o microsoft sql serverMilson
 
Oltp artigo 1
Oltp artigo 1Oltp artigo 1
Oltp artigo 1kaze002
 
Data warehousing
Data warehousingData warehousing
Data warehousingacistec
 
Administraçao de sistemas aula 8 16 set
Administraçao de sistemas  aula 8 16 setAdministraçao de sistemas  aula 8 16 set
Administraçao de sistemas aula 8 16 setVicente Willians Nunes
 
Introdução a data warehouse e olap
Introdução a data warehouse e olapIntrodução a data warehouse e olap
Introdução a data warehouse e olapFlavia Martins Bispo
 
Introdução a data warehouse e olap
Introdução a data warehouse e olapIntrodução a data warehouse e olap
Introdução a data warehouse e olapFernando Palma
 
20130301 white paper modelagem de processos de negócio (bpm)_soft_expert
20130301 white paper modelagem de processos de negócio (bpm)_soft_expert20130301 white paper modelagem de processos de negócio (bpm)_soft_expert
20130301 white paper modelagem de processos de negócio (bpm)_soft_expertSamuel Gonsales
 
Apresentação Final
Apresentação FinalApresentação Final
Apresentação Finalbetinho87
 
Sistemas De Apoio a Decisão
Sistemas De Apoio a DecisãoSistemas De Apoio a Decisão
Sistemas De Apoio a DecisãoWillame Tiberio
 
A03 paper - perfil business intelligence - a cadeia de processamento
A03   paper - perfil business intelligence - a cadeia de processamentoA03   paper - perfil business intelligence - a cadeia de processamento
A03 paper - perfil business intelligence - a cadeia de processamentoMarcelo Krug
 
úLtimo dia
úLtimo diaúLtimo dia
úLtimo diaBruce Ds
 

Ähnlich wie 12.08.22 olap (20)

Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)
 
OLAP, BI, EIS
OLAP, BI, EISOLAP, BI, EIS
OLAP, BI, EIS
 
OLAP
OLAPOLAP
OLAP
 
Business Intelligence com o microsoft sql server
Business Intelligence com o microsoft sql serverBusiness Intelligence com o microsoft sql server
Business Intelligence com o microsoft sql server
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Oltp artigo 1
Oltp artigo 1Oltp artigo 1
Oltp artigo 1
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 
Administraçao de sistemas aula 8 16 set
Administraçao de sistemas  aula 8 16 setAdministraçao de sistemas  aula 8 16 set
Administraçao de sistemas aula 8 16 set
 
Introdução a data warehouse e olap
Introdução a data warehouse e olapIntrodução a data warehouse e olap
Introdução a data warehouse e olap
 
Introdução a data warehouse e olap
Introdução a data warehouse e olapIntrodução a data warehouse e olap
Introdução a data warehouse e olap
 
20130301 white paper modelagem de processos de negócio (bpm)_soft_expert
20130301 white paper modelagem de processos de negócio (bpm)_soft_expert20130301 white paper modelagem de processos de negócio (bpm)_soft_expert
20130301 white paper modelagem de processos de negócio (bpm)_soft_expert
 
SAD e OLAP
SAD e OLAPSAD e OLAP
SAD e OLAP
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Apresentação Final
Apresentação FinalApresentação Final
Apresentação Final
 
Sistemas De Apoio a Decisão
Sistemas De Apoio a DecisãoSistemas De Apoio a Decisão
Sistemas De Apoio a Decisão
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
A03 paper - perfil business intelligence - a cadeia de processamento
A03   paper - perfil business intelligence - a cadeia de processamentoA03   paper - perfil business intelligence - a cadeia de processamento
A03 paper - perfil business intelligence - a cadeia de processamento
 
úLtimo dia
úLtimo diaúLtimo dia
úLtimo dia
 
Blue it
Blue itBlue it
Blue it
 

12.08.22 olap

  • 1. 2.4.12 - OLAP OLAP (On-Line Analytical Processing) representa um conjunto de tecnologias projetadas para suportar análise e consultas ad hoc. Sistemas OLAP ajudam analistas e executivos a sintetizarem informações sobre a empresa, através de comparações, visões personalizadas, análise histórica e projeção de dados em vários cenários de "e se ..." . Sistemas OLAP são implementados para ambientes multi-usuário, arquitetura cliente-servidor e oferecem respostas rápidas e consistentes às consultas iterativas executadas pelos analistas , independente do tamanho e complexidade do banco de dados. A característica principal dos sistemas OLAP é permitir uma visão conceitualmulti- dimensional dos dados de uma empresa. A visão muti-dimensional é muito mais útil para os analistas do que a tradicional visão tabular utilizada nos sistemas de processamento de transação. Ela é mais natural, fácil e intuitiva, permitindo a visão em diferentes perspectivas dos negócios da empresa e desta maneira tornando o analista um explorador da informação. A modelagem dimensional é a técnica utilizada para se ter uma visão multi-dimensional dos dados. Nesta técnica os dados são modelados em uma estrutura dimensional conhecida por cubo. As dimensões do cubo representam os componentes dos negócios da empresa tais como "cliente", "produto" , "fornecedor" e "tempo". A célula resultante da interseção das dimensões é chamada de medida e geralmente representa dados numéricos tais como "unidades vendidas" , "lucro" e "total de venda". Além dos componentes dimensão e medida outro importante aspecto do modelo multi-dimensional é a consolidação dos dados uma vez que para a tarefa de análise são mais úteis e significativos a agregação (ou sumarização) dos valores indicativos dos negócios. Além da visão multi-dimensional dos dados da empresa, outras importantes características dos sistemas OLAP são : • Análise de tendências. A tecnologia OLAP é mais do que uma forma de visualizar a história dos dados. Deve, também, ajudar os usuários a tomar decisões sobre o futuro, permitindo a construção de cenários ( "e se ...") a partir de suposições e fórmulas aplicadas, pelos analistas, aos dados históricos disponíveis ; • Busca automática (reach-through) de dados mais detalhados que não estão disponíveis no servidor OLAP. Detalhes não são normalmente importantes na tarefa de análise mas quando necessários, o servidor OLAP deve ser capaz de buscá-los; • Dimensionalidade genérica;
  • 2. • Operação trans-dimensional. Possibilidade de fazer cálculos e manipulação de dados através diferentes dimensões; • Possibilidade de ver os dados de diferentes pontos de vista (slice and dice), mediante a rotação (pivoting) do cubo e a navegação (drill-up/drill-down) entre os níveis de agregação; • Conjunto de funções de análise e cálculos não triviais com os dados. Quanto a localização dos dados a serem utilizados na análise, atualmente existem duas abordagens para este local : • Um banco de dados multi-dimensional especializado ; • ou um data warehouse implementado com a tecnologia de banco de dados relacional, mas otimizado para a tarefa de análise. Neste caso os dados são modelados utilizando um esquema especialmente projetado para balancear performance e volume de dados. Normalmente, uma representação desnormalizada conhecida por esquema estrela (vide sub-seção 7.2) é utilizada Sistemas OLAP que implementam a primeira abordagem são chamados de MOLAP e aqueles que implementam a segunda são chamados de ROLAP (Relational-OLAP). Uma outra abordagem é a utilização de ferramentas front-end com capacidade de extrair e representar dados em múltiplas dimensões utilizando um banco de dados sem nenhuma funcionalidade para suportar a visão multi-dimensional. Esta abordagem é conhecida por desktop OLAP. Mas as abordagens MOLAP e ROLAP são as mais utilizadas devido ao grande volume de dados que são capazes de manipular. A integração dos sistemas OLAP e data warehouse pode ser feita utilizando um dos cenários a seguir: No cenário 1, uma ferramenta ROLAP fornece um front-end para um data warehouse. Neste caso, o acesso aos dados é feito via um modelo multi-dimensional dos negócios mapeado na estrutura do data warehouse. Este cenário é apropriado para empresas que analisam uma significante porção dos dados do data warehouse. No cenário 2, a ferramenta OLAP tem seu próprio banco de dados multi-dimensional que é carregado com dados oriundos do data warehouse. O cenário 3 é similar ao 1 sendo que a diferença é o servidor multi-dimensional (vide seçao 7.3 , MOLAP x ROLAP). Os cenários 2 e 3 são mais apropriados quando um segmento específico dos dados é utilizado na análise.
  • 3. Exemplos de soluções MOLAP, ROLAP e desktop OLAP são fornecidos a seguir. Servidor de Banco de Dados Multi-Dimensional o Arbor Software Essbase o Information Builders FOCUS/Fusion o Holistics Systems Holos o Hyperion Enterprise o Kenan Technologies Acumate ES o Oracle Express Server o Pilot (D&B) LightShip Server o Planning Sciences GentiumDB o Sinper TM/1 Sistema ROLAP o Andyne PaBLO o Cognos PowerPlay o Information Advantage DecisionSuite 3.0 o Informix-MetaCube o MicroStrategy DSS Agent o Prodea Beacon Cliente MOLAP • Comshare Commander EIS/OLAP • Holistics Systems Holos • Kenan Technologies Acutrieve • Oracle Express Objects e Express Analyzer • Pilot (D&B) LightShip Professional • Planning Sciences Gentium Desktop OLAP
  • 4. • Andyne GQL • Brio BrioQuery • Business Objects BusinessObjects • Cognos Impromptu Nas sub-seções a seguir são apresentados os conceitos básicos da modelagem dimensional e do esquema estrela e, por último, as características e as diferenças das abordagens MOLAP e ROLAP. Modelo Multi-Dimensional Esta técnica de modelagem permite a visualização multi-dimensional do universo de uma organização. Para os analistas das empresas, esta é uma forma mais natural, fácil e intuitiva de trabalhar. As grandes vantagens deste modelo são a sua simplicidade e o fato de poder ser implementado em diferentes tipos de banco de dados, relacional, multi-dimensional ou orientado a objetos. Através de comparações com o modelo entidade-relacionamento, são apresentadas a seguir as principais características do modelo multi-dimensional. Suponha a seguinte tabela de uma base relacional : Produto Região Vendas Leite Sul 50 Leite Sudeste 260 Leite Nordeste 100 Leite Centro Oeste 40 Leite Norte 70 Iogurte Sul 80 Iogurte Sudeste 190 Iogurte Nordeste 120 Iogurte Centro Oeste 140 Iogurte Norte 20 Manteiga Sul 10 Manteiga Sudeste 300 Manteiga Nordeste 55
  • 5. Manteiga Centro Oeste 80 Manteiga Norte 200 Requeijão Sul 130 Requeijão Sudeste 230 Requeijão Nordeste 75 Requeijão Centro Oeste 40 Requeijão Norte 100 Tabela 3 - Tabela relacional Uma maneira mais natural para representar a tabela acima seria utilizar uma matriz bi- dimensional : Sul Sudeste Nordeste Centro Oeste Norte Leite 50 260 100 40 70 Iogurte 80 190 120 140 20 Manteiga 10 300 55 80 200 Requeijão 130 230 75 40 100 Tabela 4 - Tabela dimensional No modelo multi-dimensional, a matriz apresentada acima representa o fator "Vendas" dimensionado por "Produtos" e "Regiões". Consultas do tipo "Qual foi a venda de manteiga na região sul ?" seriam executadas, na tabela relacional, acessando apenas um registro. No entanto, consultas do tipo "Qual foi o total de vendas na região Nordeste ? " seriam executadas acessando muitos valores e totalizando-os. Em uma base relacional, dependendo do seu tamanho, a tarefa de acessar os valores e agregá-los (totalizar) pode tomar um tempo considerável. No modelo multi-dimensional, a segunda consulta seria executada acessando a coluna "Nordeste" e agregando os valores. Entretanto, neste modelo o tempo de resposta ainda depende da quantidade de valores a serem agregados. O que muitos usuários desejam de suas aplicações é um tempo de resposta consistente, independentemente da consulta executada. A maneira de se obter tempo de resposta consistente é consolidar (ou pré- agregar) todos os totais e sub-totais. Na verdade isto pode ser perfeitamente alcançado em
  • 6. uma base relacional. Continuando o exemplo da tabela relacional, a consolidação se daria da seguinte maneira : Produto Região Vendas Leite Sul 50 Leite Sudeste 260 Leite Nordeste 100 Leite Centro Oeste 40 Leite Norte 70 Iogurte Sul 80 Iogurte Sudeste 190 Iogurte Nordeste 120 Iogurte Centro Oeste 140 Iogurte Norte 20 Manteiga Sul 10 Manteiga Sudeste 300 Manteiga Nordeste 55 Manteiga Centro Oeste 80 Manteiga Norte 200 Requeijão Sul 130 Requeijão Sudeste 230 Requeijão Nordeste 75 Requeijão Centro Oeste 40 Requeijão Norte 100 Tabela 5 - Tabela Relacional Produto Total Leite 520 Iogurte 550 Manteiga 645 Requeijão 575
  • 7. Tabela 6 - Consolidação Região Total Sul 270 Sudeste 980 Nordeste 350 Centro Oeste 300 Norte 390 Total 2290 Tabela 7 - Consolidação No modelo dimensional a consolidação se daria da seguinte maneira : Sul Sudeste Nordeste Centro Oeste Norte Total Leite 50 260 100 40 70 520 Iogurte 80 190 120 140 20 550 Manteiga 10 300 55 80 200 645 Requeijão 130 230 75 40 100 575 Total 270 980 350 300 390 2290 Tabela 8 - Consolidação Observando os dois modelos, percebe-se que o dimensional, além de ser mais claro, requer menos espaço. Antes de prosseguir com conceitos do modelo dimensional alguma terminologia deve ser introduzida : "sul", "sudeste", e etc são membros de entrada da dimensão "Região" . Os totais são membros de saída. "leite", "iogurte" , "manteiga", "requeijão" e "total" são
  • 8. membros de entrada da dimensão "Produto" . A intersecção das duas dimensões é chamada de célula ou medida. No exemplo acima existem 30 células. Este conjunto (ou área) de células representa uma variável. Variáveis geralmente são medidas numéricas tais como vendas, custos, lucros e etc... Esta é uma hierarquia simples onde cada membro de entrada tem apenas um nível de detalhamento. No próximo esquema é mostrado uma hierarquia com múltiplos níveis. Neste esquema , as regiões representam níveis mais genéricos e as cidades representam os níveis mais detalhados. Na terminologia dimensional, a ação de ir de um nível genérico para um mais detalhado é chamado de drill-down. A ação inversa é chamada de drill-up. Múltiplos níveis de hierarquia podem ser implementados através de múltiplas dimensões (uma para cada nível) ou dimensões hierárquicas. A hierarquia "estado-cidade" seria implementada da seguinte maneira utilizando-se múltiplas dimensões :
  • 9. Esta solução apresenta dois problemas : o primeiro é que haverá uma célula vazia na intersecção de cada cidade com um estado que não seja o seu, gerando uma base de dados altamente esparsa. O segundo problema surge quando o número de níveis da hierarquia aumenta. Torna-se extremamente complicado trabalhar com várias dimensões. Dimensões hierárquicas é uma solução que se adeqüa melhor aos múltiplos níveis de uma hierarquia. A figura abaixo ilustra o esquema multi-hierárquico apresentado acima.
  • 10. Quando utiliza dimensões hierárquicas, o servidor OLAP "entende" da hierarquia implementada e sabe como agregar os dados. Por exemplo, o servidor "sabe" que não deve somar os dados de "estado" e "região" porque os dados do "estado" já foram incluídos na "região". Outro aspecto muito importante do modelo dimensional se refere às variáveis. Como já mencionado antes, variáveis geralmente são medidas numéricas tais como "vendas" , "preço" , "custo" , etc. Variáveisdevem incorporar regras de consolidação, isto é, ações que devem ser feitas quando se passa de um nível de detalhamento para outro. Por exemplo, somar os dados de "vendas" ou tirar a média do "preço" quando se passa do nível "cidade" para o nível "estado". Variáveis podem ter outros atributos tais como descrição , unidade, regra de conversão e etc. Outro conceito a ser introduzido neste ponto é variável derivada. Uma variável é dita derivada quando é aplicado um cálculo ao dado, antes deste ser apresentado ao usuário. Para o usuário é como se o dado estivesse na base de dados no entanto, a transformação é feita no momento da consulta. Esquema Estrela (Star Schema) O esquema estrela é a representação do modelo dimensional em bancos de dados relacionais. No esquema estrela existe uma tabela dominante no centro do esquema. Esta é a
  • 11. única tabela com múltiplos relacionamentos para as outras tabelas. As outras tabelas possuem um único relacionamento para a tabela central. A tabela central é chamda fato (fact table) e as outras tabelas são chamadas de dimensão (dimension table). A figura abaixo ilustra o esquema estrela. A tabela fato é onde uma ou mais medidas numéricas dos negócios da empresa são armazenadas. Os fatos podem ser "vendas" , "custo" , "unidades vendidas" , etc. Os fatos devem ser numéricos porque eles serão agregados utilizando-se operações tais como, média , soma, contagem e etc. Não faz sentido executar tais operações em dado textual. Os fatos podem ser aditivos, semi-aditivos e nao-aditivos. Um fato é aditivo quando pode ser agregado em todas as dimensões. Por exemplo, "vendas" pode ser agregado em qualquer combinação das dimensões "tempo", "produto" e "loja". Um fato é semi-adititivo quando ele não é adititvo em uma dimensão. Por exemplo, o número de empregados é aditivo nos diferentes departamentos da empresa mas não é aditivo na dimensão "tempo". Um fato é não-aditivo quando não pode ser agregado em nenhuma dimensão. Não faz muito sentido utilizar um fato deste tipo mas um uso para ele seria uma simples contagem. Quando uma tabela não tem nenhum fato associado a ela, a tabela é dita ser sem-fato (factless table). Isto acontece quando a tabela fato representa eventos que não tem nenhuma medida numérica associada, apenas a sua própria ocorrência. Por exemplo, a matrícula de um aluno em determinada matéria.
  • 12. As tabelas de dimensão descrevem os fatos. Geralmente as colunas são textos e as tabelas são altamente de-normalizadas para que o desenho da base fique simples. Uma dimensão contém uma ou mais hierarquias que podem ser decompostas em tabelas separadas, gerando uma estrutura conhecida por snowflake. A próxima figura ilustra uma estrutura snowflake. Na verdade, snowflake significa a normalização da tabela. Isto elimina redundância e diminui o espaço em disco. Mas, em um data warehouse, redundância não é importante porque não é um ambiente transacional, operações de update não ocorrem com freqüencia. Espaço físico também é irrelevante porque a tabela fato é que ocupará a maior parte deste espaço. Para uma boa performance do esquema estrela, é importante determinar o nível de consolidação, ou a granularidade, dos fatos. O fato pode estar no nível de transação, por exemplo, a venda individual de determinado produto, ou o fato pode ser armazenado com uma consolidação maior, como por exemplo, a venda de determinada linha de produtos em um dia. Armazenando o fato a nível de transação faz com que o tamanho da tabela fato se torne excessivo e, além disso, este nível de detalhamento pode ser de pouca utilidade. MOLAP x ROLAP
  • 13. Multi-dimensional OLAP (MOLAP) é uma classe de sistemas que permite a execução de análises sofisticadas usando como gerenciador de dados um banco de dados multi- dimensional. Em um banco de dados MOLAP os dados são mantidos em arranjos e indexados de maneira a prover uma ótima performance no acesso a qualquer elemento. O indexamento, a antecipação da maneira como os dados serão acessados e o alto grau de agregação dos dados fazem com que sistemas MOLAP tenham uma excelente performance. Além de serem rápidos, outra grande vantagem destes sistemas é o rico e complexo conjunto de funções de análise que oferecem. A maneira de se implentar os arranjos de dados pode variar entre fornecedores de soluções MOLAP. Existem as arquiteturas hiper-cubos e multi-cubos. Na arquiteturahiper-cubo existe um único cubo onde cada medida é referenciada por todas as outras dimensões. Por exemplo, um cubo onde a medida "vendas" é referenciada pelas dimensões "produto" , "ano" , "mes", "estado" e "cidade" . Além da dificuldade em visualizar tal "cubo" (com 5 dimensões !!!) outros problemas desta abordagem são a maior necessidade de espaço em disco e a existência de um mecanismo para controlar a esparsidade dos dados que ocorre quando não existe uma medida na interseção das dimensões. Por exemplo, quando um produto não é vendido em determinado estado. A grande vantagem é a consistência no tempo de resposta que é independente do número de dimensões envolvidas na consulta. Na arquitetura multi-cubos uma medida é referenciada por dimensões selecionadas. Em um cubo, a medida "vendas" é referenciada pelas dimensões "semestre" , "estado" e "produto" e em outro cubo, a medida "custo" é referenciada pelas dimensões "mes" e "departamento". Esta arquitetura é escalável e utiliza menos espaço em disco. A performance é melhor em cada cubo individualmente, no entanto, consultas que requerem acesso a mais de um cubo podem exigir processamentos complexos para garantir a consistência do tempo de resposta. Existem algumas limitações nos sistemas MOLAP. Bancos de dados multi-dimensionais são sistemas proprietários que não seguem padrões (linguagem, API) estabelecidos pela indústria de banco de dados. Isto se torna uma desvantagem para tais sistemas, uma vez que a arquitetura não é aberta. A utilização das estruturas dimensionais adotadas também traz algumas desvantagens. Mudanças do modelo dimensional requerem uma re-organização do banco de dados e a estrutura de cubos não suporta a criação ad hoc de visões multi- dimensionais. Além desta falta de flexibilidade, sistemas MOLAP enfretam problemas quanto a escalabilidade porque um dos recursos para garantir a excelente performance é manter os índices dos arranjos na memória e isto acaba limitando bancos de dados multi-dimesnional a 20 ou 30 gigabytes de dados tornando-os, desta maneira, mais apropriados para data marts ou organizações com pequenos data warehouses. Sistemas ROLAP fornecem análise multi-dimensional de dados armazenados em uma base de dados relacional. Atualmente existem duas maneiras de se fazer este trabalho :
  • 14. • fazer todo o processamento dos dados no servidor da base de dados. O servidor OLAP gera os comandos SQL em múltiplos passos e as tabelas temporárias necessárias para o processamento das consultas; • ou executar comandos SQL para recuperar os dados mas fazer todo o processamento (incluindo joins e agregações) no servidor OLAP. Além das características básicas de sistemas OLAP, servidores ROLAP devem também : • Utilizar metadados para descrever o modelo dos dados e para auxiliar na construção das consultas. Desta maneira um analista pode executar suas análises utilizando seus próprios termos. • Criar comandos SQL otimizados para os bancos de dados com o qual trabalha. A principal vantagem de se adotar uma solução ROLAP reside na utilização de uma tecnologia estabelecida, de arquitetura aberta e padronizada como é a relacional, beneficiando-se da diversidade de plataformas, escalabilidade e paralelismo de hardware ( SMP e MPP) . Quanto as limitações, pode-se citar o pobre conjunto de funções para análise, a inadeqäação do esquema estrela para atualização dos dados e as soluções proprietárias para metadados que acaba por anular muitas das vantagens do uso da tecnologia relacional. MOLAP OU ROLAP ? Qual escolher ? Atualmente existe um grande debate sobre esta questão e se possível, este debate deve ser deixado para os fornecedores. Para quem vai utilizar a tecnologia o mais importante é entender os negócios da empresa para então decidir pela solução que melhor atende o volume de dados e as necessidades de análise da empresa. Provavelmente este debate não terá um vencedor. Já é notado que existe uma convergência destas duas tecnologias. Fornecedores MOLAP têm adicionado funcionalidade ROLAP nos seus produtos e similarmente, fornecedores ROLAP têm enriquecido a funcionalidade e performance de seus servidores. Conclusão Data warehouse e OLAP são as respostas as demandas de usuários que precisam tomar decisões em uma organização. Data warehouse e OLAP fazem parte de uma arquitetura de sistemas para suporte a decisão. Data warehouse provê a integração dos dados e OLAP oferece os mecanismos que realmente tira os benefícios do data warehouse. A utilização em conjunto destas duas tecnologias dão às empresas os meios para
  • 15. medir e gerenciar seus negócios eficientemente.