1. Banco de Dados I e II: 06/01/2010 - 07/01/2010
Compartilhar Denunciar abuso Próximo blog» Criar um blog Login
BANCO DE DADOS I E II
NOMES: ALEX GOUVEA - ELISANGELA DA SILVA BEIJE - ELISANGELA DUARTE - RICARDO MAZZI
ARQUIVO
DATA WIREHOUSE Junho (1)
Junho (1)
quinta-feira, 17 de junho de 2010
DATA WIREHOUSE
SEGUIDORES
Conceitos. Seguir
Google Friend Connect
O conceito de Data Wirehouse surgiu da necessidade de integrar dados
Seguidores (5)
corporativos espalhados em diferentes máquinas e sistemas operacionais, para
torná-los acessíveis a todos os usuários dos níveis decisórios (NAVARRO,
1996). Entretanto, essa integração deve ser feita com uma seleção cuidadosa e
otimizada dos dados já que a prioridade na utilização do ambiente do DW é o
processamento de consultas e não o processamento de transações. A Figura 1
Já é um membro?Fazer login
ilustra toda a estrutura interna que o ambiente de DW representa.
Figura 1: Estrutura interna do DW
Acesso Digital
GED - Organização,
Gerenciamento de
Documentos e Guarda
Digital
www.acessodigital.com.br
Art Vison Divisória
forro
Divisórias Eucatex
Divisorias e Forro e
Descrição. Gesso Acartona
www.artvison.com.br
“Um Data Warehouse é uma coleção de dados orientados a assuntos,
integrados, variáveis com o tempo, não voláteis, para suporte ao processo SAS Cursos e
gerencial de tomada de decisão.”(INMON, 1997, p.14) Treinamentos
Pode-se destacar as principais características de um Data Warehouse (que no Aumente o poder de
sua equipe fazer
português significa, literalmente armazém de dados) como a orientação a
ainda mais usando o
assunto, a padronização dos dados (integração), os dados não se perdem nos SAS
processos do banco de dados (volatilidade), armazenagem dos registros em www.Brainworks.com.br
uma série temporal, os dados são sumarizados (resumidos), a não necessidade Business
de normalização e um conjunto de informações sobre os dados armazenados Intelligence
Microsoft Business
(metadados).
Intelligence - BI sem
Tabela 1: Características de um Data Warehouse investimento em
licenças
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
2. Banco de Dados I e II: 06/01/2010 - 07/01/2010
www.accertato.com.br
Característica Descrição
Orientação a assunto Dados organizados de modo como o usuário se Consolidação de
Processos
refere a ele Conferência Sobre
Integração Inconsistências são removidas e informações Consolidação de
conflitantes, isto é, os dados são “limpos” Processos e Redução
de Custos.
Não volátil Somente leitura de dados, dados não atualizado SharedServicesLatam.com
por usuários.
Séries Históricas Os dados estão em séries históricas, não somente
na situação corrente.
Resumidos Os dados operacionais estão/são agregados. Apple Google Microsoft
Abrangência Mantêm uma série temporal, considerando que
Grupo de Apple e RIM paga US$4,5
mais dados serão armazenados. Terra Brasil
Não normalizado Dados podem ser redundantes. A Apple ea Research In Motion são
Metadados Dados sobre dados. parte do consórcio de seis
Arquitetura do Data Warehouse. companhias que pagaram 4,5 bilhões
de dólares por patentes
A arquitetura do Data Warehouse pode variar conforme o tipo de assunto remanescentes da falida Nortel
abordado, isso ocorre devido as necessidades que variam de empresa para Networks, em um leilão muito
empresa. disputado no qual o Google ea Intel
saíram derrotados. ...
Um exemplo de arquitetura de um DW pode ser visto na figura 1 com seus
Artigos relacionados »
componentes descritos a seguir:
Figura 2: Arquitetura do projeto de DW (Figura adaptada de KIMBALL Especialista em tecnologia prevê
(1998). Terra Brasil
A Apple pode ter muito dinheiro em
caixa e rapidamente ter crescido
tanto a ponto de ser a companhia de
tecnologia mais valiosa do mundo,
mas as previsões para o futuro da
empresa não são muito promissoras.
Pelo menos, é o que pensa Paul
Hochman, ...
Samsung desiste de processo contra
Tecnologia.com.pt
A Samsung desistiu do processo
contra a Apple, que pretendia a
suspensão das vendas do iPad e
iPhone. Quem avança esta notícia é
Camada de banco de dados: Corresponde aos dados dos o site Bloomberg. Segundo o site, a
Samsung desistiu da queixa contra a
sistemas operacionais da organização, junto com dados
Apple, que queria que o iPad eo
provenientes de outras fontes externas que serão tratados e iPhone não fossem ...
integrados para compor o DW. Pode ser, por exemplo, o banco Artigos relacionados »
de dados dos produtos de uma empresa ou dos fornecedores. Samsumg inicia novo processo contra
Camada de acesso aos dados: Esta camada é responsável pela AFP
ligação entre as 20 ferramentas de acesso à informação e os SEUL — A gigante sul-coreana das
telecomunicações Samsung
bancos de dados operacionais (comunica-se com diferentes
Electronics anunciou nesta quinta-
SGBDs). Pode ser a representação dos dados fontes no feira que abriu um processo contra a
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
3. Banco de Dados I e II: 06/01/2010 - 07/01/2010
ambiente de DW ou o ponto de comunicação entre as americana Apple para impedir a
ferramentas de manipulação de dados com os dados do DW. importação aos Estados Unidos de
vários de seus produtos mais
Camada de gerenciamento de replicação: Esta camada inclui
famosos fabricados no ...
todos os processos necessários para selecionar, editar, resumir, Artigos relacionados »
combinar e carregar o DW e as correspondentes informações powered by
de acesso a partir das bases operacionais. Exemplificando,
seriam os módulos de integração dos dados, podendo ser um
cálculo de média de um dado em uma tabela fonte para ser
armazenado no DW.
Camada de dados intermediários: Gerencia o transporte de
informações pelo ambiente de redes. É usada para isolar
aplicações, operacionais ou informacionais, e entregá-las em
locais e tempos determinados.
Camada do DW: O DW corresponde aos dados usados para
fins ”informacionais” (analíticos). Em alguns casos, DW é
simplesmente uma visão lógica ou virtual dos dados, podendo
de fato não envolver o armazenamento destes dados. Como
exemplo, poderia ser um DW que visa analisar o Clima de
uma região, tendo como fonte de dados a média da
temperatura das regiões estudadas (seguindo um hierarquia:
bacia hidrográfica, sub-bacias, ponto de medição).
Camada de acesso à informação: É a camada com a qual os
usuários finais interagem. Representa as ferramentas que o
usuário utiliza para navegar pelos dados de DW. Podemos citar
uma ferramenta, produzida pela Oracle, Oracle 9i Discoverer.
Também envolve o hardware e software utilizado para
obtenção de relatórios, planilhas, gráficos e outros.
Camada de gerenciamento de processos: Está envolvida com
o controle das diversas tarefas a serem realizadas para
construir e manter as informações do dicionário de dados e do
DW. Contribui para manter o DW atualizado e consistente. É o
gerente de todo o DW, um exemplo de aplicativo que executa
essa tarefa é a ferramenta Oracle 9i Warehouse Builder.
Camada de metadados (dicionários de dados): Metadados
são as informações sobre os dados mantidos pela organização.
Para poder manter a funcionalidade de um ambiente de DW é
necessário ter disponível uma grande variedade de metadados,
desde
dados sobre as visões dos usuários até dados sobre os bancos
de dados operacionais.
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
4. Banco de Dados I e II: 06/01/2010 - 07/01/2010
Arquitetura Genérica
A arquitetura genérica compreende a camada dos dados
operacionais que serão acessados pela camada de acesso a
dados. As camadas de gerenciamento de processos, transporte
e data warehouse são responsáveis por distribuir os dados e
estão no centro da arquitetura. A camada de acesso à
informação possibilita a extração das informações do DW
utilizando um conjunto de ferramentas.
Figura 3: Arquitetura genética DW.
Arquitetura de Duas Camadas
A arquitetura de duas camadas utiliza um servidor, juntamente
com aplicações front end, que são ferramentas que realizam
operações sobre os dados consultados e os transformam em
informações úteis para os usuários, os componentes back end
são ferramentas responsáveis pela extração, limpeza e cargas
dos dados, mais conhecidas como ETL também são utilizadas
neste tipo de arquitetura.
Figura 4: Arquitetura duas camadas DW.
Arquitetura de Três Camadas
A arquitetura de três camadas suporta vários usuários e
serviços devido a sua flexibilidade, as informações ficam
armazenadas em várias camadas. Na primeira camada estão as
interfaces que trabalham com o usuário, onde geralmente são
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
5. Banco de Dados I e II: 06/01/2010 - 07/01/2010
gráficas. Na segunda camada estão os servidores de banco de
dados e aplicações e, por isso, têm a necessidade de ter um
acesso eficiente e veloz aos dados compartilhados, e na última
ficam armazenadas as fontes de dados. A arquitetura de três
camadas é a mais utilizada pelos analistas.
Figura 5: Arquitetura três camadas DW.
Ferramentas de acesso.
As maneira em que os dados são extraídos e integrados com
cada processo distinto do DW. As funções para a
transformação dos dados são:
• Extração: retirada dos dados dos sistemas transacionais e
armazenagem na área de Data Stage;
• Carga de dimensões processadas: realimentação do processo
para garantir a representação correta dos dados em novo
formato.
• Carga, Replicação e Recuperação: quando pronto, o dado é
carregado no Data Mart correspondente e são criados (ou
atualizados) índices para melhorar a performance das consulta.
• Alimentação: apresenta as visões do Data Mart de acordo
com as necessidades dos usuários.
• Carga dos resultados dos modelos: serve para realimentar
possíveis modificações no Data Mart, caso este não esteja
adequado a aplicação que o utiliza.
Para as operações de consultas destaca-se:
a) cadastrar consulta: define consultas gerenciais baseadas na
modelagem dimensional do cubo de decisão;
b) visualizar e configurar consultas: acesso e configuração
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
6. Banco de Dados I e II: 06/01/2010 - 07/01/2010
sobre as consultas cadastradas.
Exemplos de Banco de dados para Data
Warehouse.
• Adabas D - Software AG
• Advanced Pick - Pick Systems
• Broadbase Server - Broadbase Information Systems
• DB2 - IBM
• Fast-Count DBMS - MegaPlex Software
• HOPS - HOPS International
• Microsoft SQL Server - Microsoft
• MK Platform - Synergistics Services Group
• Model 204 - Computer Corp. of America
• NonStop SQL - Tandem
• Ngram Transform-DB - Triada
Entre outros.
Os principais passos para criar um modelo.
1. Desenvolver um modelo conceitual da atividade do negócio
ou processo a ser suportado por um banco de dados;
2. Usar esse modelo de mais alto nível para criar o modelo
lógico de dados. O modelo
lógico provê muito mais detalhes e é independente da
implementação;
3. Transformar o modelo lógico em um modelo físico
detalhado com cada implementação do banco de dados. O
modelo físico é chamado de esquema.
Para os novos bancos de dados, o primeiro passo é definir a
atividade do negócio ou o processo. Isso envolve ajustamento
de dados (incluindo entrevistas com usuários potenciais) e um
entendimento do processo do negócio a ser suportado.
Em um DW o modelo conceitual é baseado em fatos,
dimensões e hierarquias. A informação em um DW é usada
para pesquisa completa, sumarização e organização dos dados.
Ou seja, estas informações consistem em uma base que dá
suporte a análise e busca do conhecimento.
Características:
• A informação é vista em intervalos de tempo,
preferencialmente em transações individuais;
• A informação é disposta numa visão global do negócio;
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
7. Banco de Dados I e II: 06/01/2010 - 07/01/2010
O objetivo da modelagem de dados é converter os conceitos
da organização em uma forma que pode ser desenvolvida em
uma estrutura de dados, refletindo o modelo da organização,
de modo que a informação possa ser extraída por usuários do
sistema.
Para as operações de montagem de projeto destacam-se os
seguintes casos de uso:
a) cadastrar Data Warehouse: cria um novo projeto de DW
baseado no modelo dimensional estrela;
b) cadastrar dimensão: grava as definições referentes a uma
dimensão bem como seus atributos e chave primária;
c) cadastrar cubo: grava as definições referentes a um cubo
de decisão bem como seus indicadores e dimensões
relacionadas.
Exemplo de ferramentas.
A ferramenta para a construção de um DW conta com dois
atores: o usuário de consultas e o administrador projetista.
Neste trabalho, a ênfase principal é com as funções
disponibilizadas ao administrador, uma vez que ao usuário
caberá apenas a tarefa de efetuar as consultas.
As operações realizadas pelo administrador podem ser
divididas nos seguintes processos: montagem do projeto de
DW, consultas, metadados e recursos adicionais da ferramenta.
Outros recursos adicionais da ferramenta são:
a) exportar metadados: exporta todas as definições referentes
a um projeto de DW em padrão XML,
b) importar metadados: importa para o sistema um novo
projeto de DW gerado em XML;
c) visualizar agendamento: apresenta ao administrador todos
os agendamentos de fontes do dia corrente que ainda estão em
aberto para processamento;
d) visualizar log de mensagens: mostra as principais
ocorrências dentro do sistema como informações de
importação, erro e tratamento de exceções;
e) limpar Data Warehouse: processa limpeza de dados e do
conteúdo dos projetos de DW do sistema;
f) cadastrar usuário: cria novos usuários para acesso ao
sistema.
Exemplos de utilização.
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]
8. Banco de Dados I e II: 06/01/2010 - 07/01/2010
Desenvolver um sistema de Data Warehouse não é uma tarefa
simples, ela requer o entendimento de vários conceitos e
domínio de tecnologias que devem ser conciliadas para
trabalhar em conjunto. Sistemas de Apoio a Decisão (SAD),
redes de computadores, servidores, Sistemas de Gerenciamento
de Banco de Dados (SGBD) são exemplos de tecnologias que
devem ser integradas.
POSTADO POR GR UPO ÀS 11:39
REAÇÕES: engraçado (0) interessante (0) legal (0)
0 COMENTÁRIOS
Postagens mais recentes Início Postagens mais antigas
Assinar: Postagens (Atom)
http://bancodedadosi.blogspot.com/2010_06_01_archive.html[04/07/2011 01:16:59]