SlideShare ist ein Scribd-Unternehmen logo
1 von 8
Downloaden Sie, um offline zu lesen
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 1/8
AULA 06 ­ DAta mining, data marts, GRANULARIDADE
Autor: Marcos Pacheco
Seja bem­vindo de volta para mais uma aula de sistemas de informação aplicados. Nesta aula você irá estudar mais a fundo
os conceitos relacionados com data warehouse e conhecer também os conceitos de mineração de dados e data marts. Além
disso, você analisará um dos aspectos mais importantes de um dataware house, a granularidade. Começaremos com a
mineração de dados.
Mineração de Dados Data Mining
A mineração de dados (Data Mining) é a técnica que define a maneira pela qual os dados de um Data Warehouse são
processados para identificar fatores e tendências chaves. Estes fatores e tendências têm como objetivo ajudar os gerentes a
tomarem decisões estratégicas nas operações empresariais. Através da mineração de dados, estes gerentes podem obter
vantagens competitivas no mercado.
O conhecimento pleno das técnicas de mineração de dados é fundamental para que sistemas atinjam com sucesso seus
objetivos estratégicos. Portanto, de forma geral podemos dizer que um data mining é a identificação automatizada de
padrões e de relacionamentos de um data warehouse.
Apesar da palavra automatizada, que foi citada anteriormente, é importante salientar que isso não significa que um data
mining é automático e que não precisa de intervenção. É necessário que analistas entendam do negócio da empresa e
parametrizem as aplicações e algoritmos para descobrirem padrões úteis nos resultados das extrações dos dados. Data
mining inclui técnicas, processos e ferramentas utilizadas para extrair informação ou padrões de grande volume de dados.
Portanto, um data mining não é automático, é um processo e necessita de supervisão, pois é iterativo. É fundamental no
caso do data mining conhecer os conceitos dos algoritmos utilizados na mineração de dados para poder colocar os
parâmetros corretos nos sistemas. É também muito importante conhecer o negócio da organização. Desta forma, os
sistemas de data mining não são intuitivos e nem simples, pois fazem parte de um processo complexo de análise de
conjunto de dados. Este dados não necessariamente necessitam pertencer a um data warehouse e tem por objetivo a
descoberta de padrões interessantes que possam representar informações úteis. Para saber mais sobre como estes padrões
são encontrados, sugiro que você pesquise sobre os algoritmos usados em data mining, em especial os algoritmos: a priori,
por amostragem, árvore de padrão frequente (árvore fp) e de partição.
Em um data mining, a descoberta de novos padrões e regras é sustentada por conhecimento indutivo e este conhecimento
pode ser representado de várias formas. Se este conhecimento não estiver estruturado, sua representação pode ser realizada
por regras ou por lógica proposicional. Já se houver uma forma estruturada do conhecimento, ele pode ser representado por
redes semânticas, redes neurais, árvores de decisão ou hierarquias de classes. Em essência, a extração de dados é o
equivalente a encontrar pepitas de ouro em uma montanha de dados. Esta tarefa difícil de encontrar ouro escondido
depende muito do poder dos computadores e da parametrização precisa dos algoritmos. A Figura 1 mostra o fluxo usual da
mineração de dados em busca de conhecimento estratégico para a empresa.
Figura 1 ­ Fluxo para alcance de conhecimento via um data mining
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 2/8
Fonte: http://upload.wikimedia.org/wikipedia/commons/f/f4/Wum_summary.jpg
Em um data mining “com avançadas técnicas de estatística e usando técnicas de inferência, é possível descobrir fatos num
grande banco de dados, inclusive aqueles para internet” (STAIR; REYNOLDS, 2008, p.157). Em uma ferramenta de
consulta comum existem hipóteses especificas que são testadas pelos usuários, já no data mining existem ferramentas de
análise embutidas no sistema para produzir, automaticamente, uma hipótese sobre padrões e anomalias identificadas no
dado e então prever um comportamento futuro.
Um data mining, então, funciona como um avaliador de um data warehouse que é capaz de extrair informações preciosas
(minerar os dados) para que os usuários tenham respostas para perguntas produzidas pelo data mining e não por esses
usuários.
Uma aplicação típica do data mining é realizada por empresas de cartões de crédito que possuem agentes automatizados de
data mining, que buscam no data warehouse padrões de consumo sutis para, com isso evitar e identificar fraudes. Embora a
mineração de dados seja um termo relativamente novo, a tecnologia não é. As empresas têm utilizado, por anos,
computadores poderosos para peneirar volumes de dados de scanners de supermercado para analisar relatórios de pesquisa
de mercado. No entanto, as inovações contínuas no poder de processamento do computador, mais espaço em disco, e
software de estatística aumentaram drasticamente a precisão da análise e reduziram o custo desta tecnologia.
A mineração de dados é principalmente usada hoje por empresas com um foco forte do consumidor: varejo, organizações
de comunicação, financeira e de marketing. Ela permite que essas empresas determinem as relações entre os fatores
internos como preço, posicionamento do produto e fatores externos como indicadores econômicos, concorrência e
demografia do cliente e que lhes permite determinar o impacto sobre as vendas, satisfação do cliente e os lucros
corporativos.
Você já deve ter ouvido falar de alguém que recebeu um telefonema da operadora do cartão de crédito quando da compra
de algum item que fugia de seu padrão de consumo, uma geladeira por exemplo. Pois era o data mining, a mineração de
dados, indicando que poderia ser uma fraude, pois o cliente nunca comprou eletrodomésticos no cartão. O objetivo da
mineração de dados é, portanto, analisar e compreender as tendências do passado e prever tendências futuras. Ao prever
tendências futuras, as organizações empresariais podem posicionar melhor seus produtos e serviços para o ganho
financeiro. Os métodos tradicionais de análise de dados, envolvendo consulta e relatórios em sistemas OLTP, não podem
lidar com estas tarefas em que o data mining está presente.
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 3/8
Um outro exemplo do uso dos data minings é descrito por Stair e Reynolds (2008, p.157):
Uma companhia norte­americana de telefonia celular, por meio do sistema de informação MineSet da Silicon Graphics,
pesquisa montanhas de dados de chamadas, visando localizar números de telefones clonados. Já alguns fabricantes coletam
dados no chão de suas fábricas para identificar um defeito numa linha de montagem ininterrupta, o qual, somente meses
depois o mecanismo em uso seria descoberto.
Usos específicos de mineração de dados também incluem:
A segmentação de mercado ­ identificar as características comuns dos clientes que compram os mesmos produtos de
sua empresa;
A rotatividade de clientes ­ prever quais clientes estão propensos a deixar a sua empresa e ir para um concorrente;
Detecção de fraudes ­ identificar quais as transações são mais suscetíveis de serem fraudulentas;
Marketing interativo ­ prever o que cada indivíduo irá acessar em um site e o que é mais provável que ele esteja
interessado em ver;
Análise de mercado ­ entender que produtos ou serviços são comumente comprados em conjunto; por exemplo,
cervejas e fraldas realizadas por homens no final de semana (Sabendo disso uma rede supermercados famosa colocou
uma Gôndola de Cervejas ao lado das Fraudas).
O data mining (mineração de dados) pode ser realizado em qualquer base de dados. Não é necessário um data warehouse
para obrigar a existência da técnica de mineração de dados (data mining). Portanto, indicar que um data mining precisa
estar associado, obrigatoriamente, a um data warehouse está incorreto. Você pode, inclusive, aplicar a técnica de mineração
de dados às bases de dados de sistemas transacionais ­ OLTP.
É evidente que a existência de um data warehouse ­ OLAP ­ atrelado a um data mining é o mais usual e facilita a aplicação
e gerenciamento da técnica. Inclusive, sistemas OLAP têm como característica disponibilizar suporte para a tecnologia de
data mining. Conforme destacam Landon e Landon (2011, p.158):
[...] consultas tradicionais de banco de dados respondem a perguntas como: ‘quantas unidades de produtos número 403
foram expedidas em fevereiro de 2010?’ O OLAP, ou análise multidimensional, dá apoio a requisições de informações
muito complexas, tais como: ‘compare as vendas do produto 403 com o planejamento, por trimestre e por região de vendas
nos últimos dois anos.
No exemplo anterior, o data mining irá ajudar a descobrir padrões de respostas e até mesmo criar consultas que não seriam
possíveis apenas com o OLAP. Através da inferência de regras e aplicação de algoritmos complexos será realizada, pelo
data mining, a descoberta de padrões e relacionamentos ocultos em grandes bancos de dados para prever comportamentos
futuros. Um artigo interessante é mostrado a seguir e indica claramente o poder da utilização de um data mining. Veja que
ele usa no texto, ao invés de minerar dados, o termo sinônimo garimpar dados:
Uma enorme quantidade de empresas está usando cada vez mais a tecnologia dos softwares para garimpar dados, sobre
base de dados das empresas, traçando correlações em torno dos hábitos dos consumidores, atingindo mais de 200 variantes.
Toda vez que um internauta entra em um site para pesquisar um produto, de qualquer gênero, o sistema de garimpo entra
em ação, buscando rastros deixados pelos usuários. A engrenagem do Data Mining é formada por modelos matemáticos
que faz uma construção de diversos cenários, antecipando minuciosamente o comportamento futuro do consumidor,
funcionando como uma espécie de oráculo.
A empresa Amil cruzou uma longa lista de informações, sobre exames, consultas e cirurgias de seus clientes, conseguindo
identificar quais usuários eram hipertensos, obesos, diabéticos e até colesterol acima do recomendado. Treinou uma equipe
para entrar em contato com seus clientes, com a intenção de lembrar os clientes a data da próxima consulta, com esta
iniciativa, o número de internações hospitalares reduziu 48%. (BISPO, 2011, s.p.)
E o termo data marts, você conhece? Vejamos.
Data marts
Os data marts carregam consigo o objetivo de um data warehouse, porém os data marts são subconjuntos dos Data
Warehouses. Os data Marts armazenam um subconjunto de dados referentes a um único aspecto do negócio da empresa. Já
o Data Warehouse armazena todos os dados de um empreendimento em um único banco de dados.
Enquanto um Data Mart trata de problema departamental ou local, um Data Warehouse envolve o esforço de toda a
companhia para que o suporte a decisões atue em todos os níveis da organização. As principais diferenças entre Data Mart
e Data Warehouse estão relacionadas, portanto, ao tamanho e o escopo do problema a ser resolvido. De acordo com
Kimball (2002, p. 36): “Um Data Mart é um Data Warehouse de menor capacidade e complexidade usado para atender a
uma unidade específica de negócios. Portanto, são tipicamente mais fáceis de construir e manter.”
Observe a seguir, na Figura 2, que os data marts são exatamente partes menores e mais específicas de um data warehouse.
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 4/8
Figura 2 ­ Data Marts
Fonte: O Autor
Muitas organizações já utilizam armazéns de dados (data warehouses) para trazer vários bancos de dados em conjunto e
torná­los disponíveis para mineração de dados e outras formas de análise. Conforme você já estudou, um armazém de
dados (data warehouse) é uma coleção de dados, geralmente atuais e históricos, obtidos a partir de várias bases de dados
OLTP. A organização pode utilizar estes dados para efetuar uma análise multidimensional (OLAP) para a tomada de
decisão estratégica. O objetivo, claro, é trazer para um só lugar conjuntos chaves de dados utilizados pela organização.
Ao reunir essa quantidade enorme de dados em um data warehouse, a análise dos mesmos torna­se muito difícil. Para
resolver este problema, as organizações usam o que são chamados de data marts. Data marts são conjuntos de dados
relacionados que são agrupados e separados do corpo principal dos dados no data warehouse. Observe como ocorre este
movimento na figura 2.
Data marts são projetados para serem disponibilizados para grupos específicos de usuários. Por exemplo, dados sobre a
fabricação podem ser colocados em um data mart e disponibilizados para o departamento de produção. Dados de recursos
humanos podem ser colocados em outro data mart e serem fornecidos aos funcionários de recursos humanos.
Essa abordagem faz com que seja mais fácil para cada grupo, ou comunidade na organização, acessar os dados e efetuar as
análises de que precisam. No entanto, nem tudo são flores! Deverá haver um cuidado especial para não serem criadas ilhas
separadas de informação, pois isso acarretará na perda de capacidade de análise global destes dados.
Um Data Mart, segundo Inmon (2005), é uma coleção de assuntos organizados para dar suporte à tomada de decisão e eles
estão baseados nas necessidades de um determinado departamento. O mesmo Inmom (2005) destaca as diferenças entre
data mart e data warehouse. Ele comenta que um data mart é departamental (única área), que está no nível tático da
organização, e é otimizado para acesso e análise com poucas fontes de dados, possuindo um menor tempo de
implementação para ser desenvolvido.
Desta forma, um data mart é uma versão especial de armazém de dados (data warehouse). Como data warehouses, data
marts contêm uma visão dos dados operacionais dos sistemas transacionais(OLTP) para permitir que decisões sobre as
estratégias de negócios possam ser tomadas com base em análise de tendências e experiências passadas.
A principal diferença em relação a um data warehouse é que a criação de um data mart é especificado para uma
necessidade de dados selecionados, destacando a facilidade de acesso a informações relevantes.
Já o data warehouse está inserido no nível estratégico da organização em múltiplas áreas, é otimizado para armazenamento
de gerenciamento de grandes volumes de dados através de muitas fontes de dados e que, portanto, possui múltiplos estágios
de implementação acarretando em um maior tempo de desenvolvimento.
Observe, na figura a seguir, um esquema que indica um dataware house, onde estão presentes, também, os data marts.
Figura 3 ­ Ambiente de um data warehouse
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 5/8
Fonte: http://en.wikipedia.org/wiki/File:Data_warehouse_overview.JPG
Observe na Figura 2 em que contexto está inserido um data warehouse e os data marts. Veja também a presença de sistemas
de informação importantes como SCM e ERP. Os sistemas ERP e SCM já foram apresentados para você na aula 4. O termo
ETL significa Extract – Transformation ­ Load ou Extração Transformação Carga. Este mecanismo de ETL faz parte de
ferramentas de software que possuem como função a extração de dados em diversos outros sistemas para então transformar
estes dados usando regras de negócios. Ao final, é tarefa do procedimento ETL efetuar uma carga destes dados em um Data
Warehouse ou data mart.
Olhando mais uma vez para Figura 3, você observa o ODS (Operational Data Storage) e Staging Area. Estas são regiões de
armazenamento de dados que servem como repositório temporário dos dados transacionais (OLTP) antes de serem
carregados para o data warehouse. Estas áreas representam um armazenamento intermediário dos dados, promovendo a
integração dos dados do ambiente operacional antes de sua atualização (carga) no DW.
No passado, um ODS era considerado apenas como uma cópia dos ambientes de sistemas transacionais em uma empresa.
Atualmente, o ODS ou Staging area é denominado de Dynamic Data Storage (DDS). Veja como Machado (2007, p.37)
explica este termo DDS:
Esta nova concepção difere da original quanto à periodicidade de armazenamento. Ao contrário do ODS original, ele não
armazena dados apenas para a carga em um DW. O DSS não é volátil, seus dados são armazenados ao longo do tempo e
sofre alterações incrementais, desta forma com o decorrer do tempo pode se tornar o data warehouse.
O ODS não é fundamental no projeto de um data warehouse embora esteja presente em muitos projetos. A ênfase de um
data mart é em atender as demandas específicas de um determinado grupo de usuários do conhecimento em termos de
análise, conteúdo, apresentação e facilidade de uso. Usuários de um data mart podem esperar ter dados apresentados em
termos que são familiares.
Depois de você estudar os conceitos de data mining e data marts, é chegada a hora de abordar mais conceitos sobre data
warehouse. O Primeiro deles é a granularidade que você observa a seguir.
Granularidade de um data warehouse
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 6/8
A granularidade é considerada o aspecto mais importante de um data warehouse. Mas o que é isso? A granularidade refere­
se ao nível de sumarização dos elementos de detalhes disponíveis nos dados. Conforme revela Machado (2007, p.59),
“Quanto mais detalhe existir, mais baixo será o nível de granularidade, quanto menos detalhe existir mais alto será o nível
de granularidade”.
A granularidade possui alta influência na questão do volume de dados existentes em um data warehouse e também
determina o tipo de consulta que pode ser realizada sobre estes dados. Este volume de dados é equalizado a depender do
nível de detalhe de uma consulta. Observe na Figura 4 um pouco mais sobre o conceito de granularidade.
Figura 4 ­ Granularidade x Detalhes dos dados
Fonte: Adaptado de Machado (2007, p.61)
Quanto maior o volume destes dados, menor o desempenho das consultas ao sistema. A granularidade é o menor nível de
informações armazenadas na tabela de fatos, esta profundidade do nível de dados é conhecida como granularidade. Por
exemplo, na dimensão, data o nível de granularidade poderia ser ano, mês, trimestre, período, semana, dia.
Os armazéns de dados (data warehouses) são construídos usando modelos de dados dimensionais que consistem de tabelas
de fato e tabelas de dimensão. Tabelas de dimensão são utilizadas para descrever as dimensões, eles contêm dimensão de
chaves, valores e atributos.
Por exemplo, a dimensão de tempo conteria a cada hora, dia, semana, mês, trimestre e ano o que ocorreu desde que
começaram suas operações comerciais. A dimensão do produto pode conter um nome e a descrição dos produtos que você
vende, seu preço unitário, cor, peso e outros atributos.
Tabelas de dimensão são normalmente pequenas, variando de alguns a vários milhares de linhas. Ocasionalmente, podem
possuir dimensões relativamente grandes. Por exemplo, uma empresa de cartão de crédito pode ter uma dimensão grande
de clientes com milhões de linhas presentes na tabela do banco de dados.
Embora possa haver outros atributos que você armazena no banco de dados relacional, armazéns de dados podem não
precisar de todos esses atributos. Por exemplo, o número de clientes de telefone, endereços de e­mail e outras informações
de contato não seriam necessárias para o armazém. Tenha em mente que os armazéns de dados são usados para tomar
decisões estratégicas, analisando tendências e essas informações administrativas e operacionais como endereços e
telefones, não são relevantes neste caso.
Um data warehouse não deve ser uma ferramenta a ser utilizada nas operações diárias de negócios. Por outro lado, você
pode ter alguns relatórios que incluam estes elementos de dados que não são necessários para a análise de dados
estratégica.
Observe que o termo tabela de fatos está em destaque. As tabelas de fatos contêm chaves para tabelas de dimensão bem
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 7/8
como fatos mensuráveis que os analistas de dados gostariam de examinar. Por exemplo, uma loja de venda de peças
automotivas pode ter em uma tabela de fato o registro de uma venda de cada item.
A tabela de fatos de uma entidade educacional pode controlar as horas e créditos de disciplinas concedidas aos estudantes.
Uma padaria poderia ter uma tabela que registra fabricação de vários produtos de panificação.
Veja a seguir um texto conceituando estas duas tabelas, a de fato e a de dimensão.
As tabelas Fato servem para armazenar medidas numéricas associadas a eventos de negócio. Uma tabela fato contém vários
fatos, correspondentes a cada uma de suas linhas. Cada fato pode armazenar uma ou mais medidas numéricas, que
constituem os valores objetos da análise dimensional. Possuem como chave­primária, normalmente um campo multi­key,
formado pelas chaves primárias das dimensões que com ela se relacionam. Normalmente armazenam muito mais linhas do
que as tabelas Dimensão, e merecem cuidado especial em função do seu alto volume. Contém dados normalmente aditivos
(manipulados por soma, média, etc.) e relativamente estáticos.
As tabelas Dimensão representam entidades de negócios e constituem as estruturas de entrada que servem para armazenar
informações como tempo, geografia, produto, cliente, etc. As tabelas Dimensão têm uma relação 1:N com a tabela Fato, e
possuem um número significativamente menor de linhas do que as tabelas Fato. Possuem múltiplas colunas de informação,
algumas das quais representam a sua hierarquia. Apresentam sempre uma chave primária, que lhes confere unicidade,
chave essa que participa da tabela Fato, como parte da sua chave múltipla. Devem ser entendidas como as tabelas que
realizam os filtros de valores aplicados na manipulação dos fatos e por onde as consultas entram no ambiente de DW/DM.
(BARBIERI, 2001, p. 81)
As tabelas de fatos podem crescer e ficar muito grandes, com milhões ou até bilhões de linhas. É importante identificar o
nível mais baixo de fatos que façam sentido para o negócio de uma empresa. Esta identificação é, muitas vezes, referida
como “grão” (granularidade) do fato na tabela. Por exemplo, para uma empresa de faturamento de saúde pode ser
suficiente o nível mês para acompanhar o faturamento. Neste caso, dados diários e horários podem não existir no data
warehouse ou não serem relevantes.
Por outro lado, os analistas de um armazém de linha de montagem podem estar muito preocupados em número de produtos
defeituosos que foram fabricados a cada hora. Da mesma forma, um data warehouse de marketing pode abranger a
atividade de um grupo de consumidores com um determinado nível de renda, ao invés de conter registros sobre as compras
realizadas por cada indivíduo.
A tabela de fato integra diferentes formas e ocorrências de dados granulares em uma única estrutura física. As diferentes
unidades de dados que são integrados em uma tabela de fato têm um tema comum e uma dependência (direta ou indireta)
na chave primária da tabela de fato.
Por exemplo, a chave primária de uma tabela de fatos pode ser o número do pedido. Com base no uso e requisitos, esta
tabela de fatos pode conter dados sobre:
A parte que foi encomendada
O custo da peça que foi encomendada
As especificações da expedição de ordem
O cliente que fez o pedido
O nome do cliente que fez a encomenda
O lugar onde a ordem foi feita
O número de telefone contido na ordem de compra
O fornecedor que fornece a parte que foi encomendada
O número de peças no inventário a partir da data do pedido
As cores disponíveis para a parte em circunstâncias normais
Os descontos disponíveis no momento da colocação da ordem de compra
A principal razão na qual você gostaria de criar uma tabela de fato dentro de um data warehouse (armazém de dados) é que
os dados contidos dentro de uma tabela fato são muito mais fáceis e eficientes de acessar.
Pense sobre isso. Se você fosse o sistema, o que você prefere fazer: sair e pegar um único registro de dados com tudo que
você precisa dentro do registro, ou sair e pegar um monte de discos, cada um com uma pequena quantidade de dados no
registro, e depois tem que se virar e unir todas as peças de dados juntos? Claro, é muito mais fácil e muito mais eficiente
obter um único registro de um grupo de registros. Portanto, o caminho leva a criação de uma tabela de fatos.
Na próxima aula serão abordados conceitos de operações OLAP como Drill Down e Roll up e também serão analisados as
arquiteturas de servidores OLAP, ROLAP, MOLAP, HOLAP e esquemas multidimensionais Star Schema x Snow Flakes.
Até lá!
SÍntese
09/04/2016 aula06_sistemas_inf_aplicados
https://unifacs.blackboard.com/bbcswebdav/institution/unifacs/conteudo_ead2/ma­cursos/sistemas­informacao­aplicados/aula06_sistemas_inf_aplicados.h… 8/8
Nesta aula, você viu o que é a mineração de dados e como ela pode ajudar empresas em busca de padrões interessantes
sobre seus negócios e clientes. Observou que um data mining funciona como um avaliador de um data warehouse que é
capaz de extrair informações preciosas (minerar os dados). Além disso, você estudou, também, os data marts que são um
Data Warehouse de menor capacidade e complexidade usado para atender a uma unidade específica de negócios. O
importante conceito de granularidade foi abordado assim como as tabelas de fato e de dimensão.
questÃo para ReflexÃo
Quais empresas são mais interessadas no uso da mineração de dados? Você conhece alguma empresa que usa o conceito de
data mining e que já fez alguma análise interessante? Caso não conheça pesquise e compartilhe o resultado no fórum da
disciplina.
Leituras indicadas
Avaliação da eficiência da gerência de redes de telecomunicações usando técnicas de bi: disponível em:
http://www.simpoi.fgvsp.br/arquivo/2007/artigos/E2007_T00358_PCN67139.pdf
Sites Indicados
http://www.microsoft.com/brasil/servidores/bi/bicapabilities/data­mining.aspx
http://www.oracle.com/br/products/database/options/advanced­analytics/overview/index.html
ReferÊncias
BARBIERI, Carlos. BI – Business Intelligence: Modelagem & Tecnologia. 1. ed. Rio de Janeiro: Axcel Books, 2001
LAUDON, Kenneth C.,; LAUDON, Jane P. Sistemas de informação gerenciais. São Paulo: Pearson Prentice­Hall, 2011.
MACHADO, Felipe Nery Rodrigues. Tecnologia e projeto de data warehouse: uma visão multidimensional. 3. ed São
Paulo: Érica, 2007.
STAIR, Ralph; M. REYNOLDS, George W. Princípios de Sistemas de Informação. 6. ed. São Paulo: Cengage Learning,
2008.

Weitere ähnliche Inhalte

Was ist angesagt?

A experiência de uma empresa de P&D na construção de uma política de governan...
A experiência de uma empresa de P&D na construção de uma política de governan...A experiência de uma empresa de P&D na construção de uma política de governan...
A experiência de uma empresa de P&D na construção de uma política de governan...Projeto RCAAP
 
Exploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olapExploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olapKlaytonAlves
 
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...Everton Souza
 
Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Leandro Rezende
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoAntonioEE256
 
38664419 artigo-data warehouse
38664419 artigo-data warehouse38664419 artigo-data warehouse
38664419 artigo-data warehousediochel
 
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelBig Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelCarlos Barbieri
 
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosEduardo de Lucena Falcão
 

Was ist angesagt? (18)

Data mining
Data miningData mining
Data mining
 
A experiência de uma empresa de P&D na construção de uma política de governan...
A experiência de uma empresa de P&D na construção de uma política de governan...A experiência de uma empresa de P&D na construção de uma política de governan...
A experiência de uma empresa de P&D na construção de uma política de governan...
 
Exploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olapExploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olap
 
KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
 
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...
Capítulo 05 - Fundamentos da inteligência de negócios: gestão da informação e...
 
Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisão
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Data Mining
Data Mining Data Mining
Data Mining
 
38664419 artigo-data warehouse
38664419 artigo-data warehouse38664419 artigo-data warehouse
38664419 artigo-data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Apresentação data mining
Apresentação data miningApresentação data mining
Apresentação data mining
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelBig Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
 
Metadados
MetadadosMetadados
Metadados
 
Business Intelligence - Data Warehouse
Business Intelligence - Data WarehouseBusiness Intelligence - Data Warehouse
Business Intelligence - Data Warehouse
 
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
 

Andere mochten auch

Snowdaytransformation
SnowdaytransformationSnowdaytransformation
SnowdaytransformationNnenna Umeh
 
Carta gastronomica-do-alentejo
Carta gastronomica-do-alentejoCarta gastronomica-do-alentejo
Carta gastronomica-do-alentejoGonçalo Ferreira
 
Chapitre 14: I. Les conditions de l'apprentissage
Chapitre 14: I. Les conditions de l'apprentissageChapitre 14: I. Les conditions de l'apprentissage
Chapitre 14: I. Les conditions de l'apprentissagePierrot Caron
 
Perifericos de almacenamiento y de comunicacion
Perifericos de almacenamiento y de comunicacionPerifericos de almacenamiento y de comunicacion
Perifericos de almacenamiento y de comunicacionFrancisco Elias Rojas
 
Marco curricular nacional_-_3ra_versión
Marco curricular nacional_-_3ra_versiónMarco curricular nacional_-_3ra_versión
Marco curricular nacional_-_3ra_versiónJavier Olguin
 
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~Hideaki Tokida
 
Adam is an atom methinks finis
Adam is an atom methinks finisAdam is an atom methinks finis
Adam is an atom methinks finisWynn Wolfe
 

Andere mochten auch (11)

Drogas
DrogasDrogas
Drogas
 
Snowdaytransformation
SnowdaytransformationSnowdaytransformation
Snowdaytransformation
 
Carta gastronomica-do-alentejo
Carta gastronomica-do-alentejoCarta gastronomica-do-alentejo
Carta gastronomica-do-alentejo
 
Chapitre 14: I. Les conditions de l'apprentissage
Chapitre 14: I. Les conditions de l'apprentissageChapitre 14: I. Les conditions de l'apprentissage
Chapitre 14: I. Les conditions de l'apprentissage
 
Perifericos de almacenamiento y de comunicacion
Perifericos de almacenamiento y de comunicacionPerifericos de almacenamiento y de comunicacion
Perifericos de almacenamiento y de comunicacion
 
Marco curricular nacional_-_3ra_versión
Marco curricular nacional_-_3ra_versiónMarco curricular nacional_-_3ra_versión
Marco curricular nacional_-_3ra_versión
 
Larprocessen
LarprocessenLarprocessen
Larprocessen
 
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~
ビジネス変革の基盤となるIBM Bluemix ~基礎から最新の取り組みまで~
 
Adam is an atom methinks finis
Adam is an atom methinks finisAdam is an atom methinks finis
Adam is an atom methinks finis
 
Presentación1
Presentación1Presentación1
Presentación1
 
Etc copy
Etc   copyEtc   copy
Etc copy
 

Ähnlich wie Data Mining, Data Marts e Granularidade

Artigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaArtigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaWosley Arruda
 
SGBDs Orientado a Objetos e Aplicações de Data mining
SGBDs Orientado a Objetos e Aplicações de Data miningSGBDs Orientado a Objetos e Aplicações de Data mining
SGBDs Orientado a Objetos e Aplicações de Data miningdanielpazleonardi
 
Inteligencia de negócios
Inteligencia de negóciosInteligencia de negócios
Inteligencia de negóciosDaniel Nóro
 
Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Wosley Arruda
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big datacictec
 
Sistema de Apoio a Decisao
Sistema de Apoio a DecisaoSistema de Apoio a Decisao
Sistema de Apoio a DecisaoDenilson Sousa
 
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...Ricardo Dubsky de Matos
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaDenodo
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisNatalia Fernandes
 
Mineração_de_Dados.pptx
Mineração_de_Dados.pptxMineração_de_Dados.pptx
Mineração_de_Dados.pptxadrian990162
 

Ähnlich wie Data Mining, Data Marts e Granularidade (20)

Data mesh-pt
Data mesh-ptData mesh-pt
Data mesh-pt
 
PETIC Casa Civil 2009-2010
PETIC Casa Civil 2009-2010PETIC Casa Civil 2009-2010
PETIC Casa Civil 2009-2010
 
Artigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaArtigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolha
 
Estudo de Caso: O Hotel do Bosque
Estudo de Caso: O Hotel do BosqueEstudo de Caso: O Hotel do Bosque
Estudo de Caso: O Hotel do Bosque
 
SGBDs Orientado a Objetos e Aplicações de Data mining
SGBDs Orientado a Objetos e Aplicações de Data miningSGBDs Orientado a Objetos e Aplicações de Data mining
SGBDs Orientado a Objetos e Aplicações de Data mining
 
Inteligencia de negócios
Inteligencia de negóciosInteligencia de negócios
Inteligencia de negócios
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
 
Dutra (2)
Dutra (2)Dutra (2)
Dutra (2)
 
Sistema de Apoio a Decisao
Sistema de Apoio a DecisaoSistema de Apoio a Decisao
Sistema de Apoio a Decisao
 
dq
dqdq
dq
 
Aula Data Mining
Aula Data MiningAula Data Mining
Aula Data Mining
 
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...
APLICAÇÃO DO BIG DATA NA INDÚSTRIA E SUAS VANTAGENS EM RELAÇÃO AOS MODELOS TR...
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudança
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neurais
 
Mineração_de_Dados.pptx
Mineração_de_Dados.pptxMineração_de_Dados.pptx
Mineração_de_Dados.pptx
 
jjjjjjjjjjjjjjj
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
jjjjjjjjjjjjjjj
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Artigo big data_final
Artigo big data_finalArtigo big data_final
Artigo big data_final
 

Data Mining, Data Marts e Granularidade