O documento apresenta os resultados de um benchmark entre o banco de dados LucidDB e o MySQL para aplicações de Business Intelligence. O LucidDB mostrou tempos de resposta melhores que o MySQL para queries complexas em um banco de dados dimensional, enquanto utilizou menos memória. Ambos sistemas se comportaram de forma similar ao variar a memória disponível.
1. Benchmark LucidDB x MySQL para
aplicações de Business Intelligence
fmasanori @ gmail.com
22 de outubro de 2011
slideshare.net/fmasanori
2. • Apresentação
• Business Intelligence
• Modelagem dimensional
• LucidDB
• Base de dados para testes
• Resultados
• Créditos
• Perguntas e sugestões
3. • Computação IME-USP
• Mestrado ITA
• ed e lint Cobra Tecnologia
• Credicard Mastercard – sistema autorização
• PriceWaterhouseCoopers
• Itaú BankBoston
• Docente nas disciplinas: algoritmos, estrutura
de dados, data warehouse
• Interesses: Python, Data Warehouse,
Pentaho, Google Technology, Facebook
4. BI no mercado mundial, Gartner:
2009: +3.8 %
2010: +13.4%
América Latina:
2010: +19.5%
5. Arquitetura genérica de um sistema de
Business Intelligence
FONTE DE DADOS PROCESSO DE ETL DATA WAREHOUSE APRESENTAÇÃO
CENTRAL DASHBOARDS OLAP
WAREHOUSE
Arquivos ÁREA DE ESTÁGIO
SGBD
SGBD
ETL DATA
DSS
SGBD MINING
ETL ETL
ERP
DOCUMENTOS
Arquivos
CRM DATA MARTS
(Luiz H. N. Lorena, 2011)
6. Star Schema
TEMPO
CLIENTE PRODUTO
VENDAS
PROMOÇÃO LOJA
(Luiz H. N. Lorena, 2011)
9. Operacional x Analítico
Operacional Analítico
Propósito Executar um processo Avaliar um processo
Estilo interação Insert, update, delete, query Query (read-only)
Escopo interação Transação individual Agregação
Padrão query Previsível e estável Imprevisível
Foco temporal Atual Histórico e atual
Otimização Update concorrente Query (agregação)
Projeto ER na 3FN Star Schema ou Cubo
(Adamson, 2010)
12. 1º Banco de Dados open source dedicado
para aplicações de Business Intelligence
Ligações: DynamoBI, Pentaho OLAP server
13. • Base para testes: World Class Movies
• Base LGPL
• Data Warehouse (star schema)
• MySQL 5.5
• LucidDB
• Apache Jmeter
• Oracle VirtualBox
14. • Qual o gênero de filme gerou mais
receitas no ano de 2008?
• Como o lucro está evoluindo com o
tempo ?
• Qual o horário do dia os consumidores
fazem mais locações?
• As promoções foram efetivas no ano de
2008?
17. Outros resultados
• ETL nos dois bancos tranquilo
• MySQL ocupou 72% a mais de espaço em
disco
• LucidDB e MySQL mantiveram os tempos
ao reduzirmos a memória disponível para o
limite do LucidDB
• LucidDB e MySQL mantiveram a relação ao
reduzirmos a memória disponível para o
limite do MySQL
19. Outros créditos
• Timo Elliott (SAP), tetris colunar
• Luiz H. Lorena, figuras DW
• KIMBALL, R., ROSS, M., The Data
Warehouse Toolkit, The Complete Guide To
Dimensional Modeling, Wiley, 2002
• ADAMSON, C., Star Schema, The Complete
Reference, McGrawHill, 2010.