O documento discute estratégias de inteligência de negócios (BI) para tomar decisões mais rápidas e seguras nas empresas. Apresenta a ferramenta de código aberto Pentaho como uma opção para projetos de BI que permite relatórios, análises, dashboards e mineração de dados de forma gratuita. Discutem os principais componentes da suíte Pentaho como Kettle para ETL, Mondrian para OLAP e Weka para mineração de dados.
1. Tornar sua organização mais
competitiva pode ser mais
livre do que você imagina!
CAMPUS PARTY 2011 – SÃO PAULO
18 DE JANEIRO DE 2011
2. Por que BI?
Utilizando estratégias de Inteligência de
Negócios (Business Intelligence - BI) é possível
tomar decisões mais rápidas e seguras para
sua empresa. E utilizando a ferramenta certa de
BI você garante o sucesso de seu projeto!
4. Data Warehouse
Um data warehouse nada mais é do que um
banco de dados contendo dados
extraídos do ambiente de produção da empresa,
que foram selecionados e depurados, tendo
sido otimizados para processamento de consulta e
não para processamento de transações. Em
geral, um data warehouse requer a consolidação
de outros recursos de dados, além dos
armazenados em banco de dados relacionais,
como informações provenientes de planilhas
eletrônicas, documentos textuais, etc. [INMON,
1999].
5. Pensadores (DW)
Bill Inmon
http://www.inmoncif.com/home/
&
Ralph Kimball
http://www.rkimball.com/html/about.html
9. Pentaho
O Pentaho atualmente é a plataforma de
inteligência de negócios de código aberto mais
popular e poderosa no mundo.
10. Pentaho Corp.
●
Fundada em 2004;
●
Sede em Orlando, Florida, Estados Unidos;
●
Aportes financeiros de fundos de investimentos
como Enterprise Associates, investidores do
SugarCRM, Xensource, Index Ventures,
investidores do MySQL, Zend e outros.
11. Por que Pentaho?
●
Funciona;
●
Tecnologia Java;
●
Código Aberto;
●
Robusto;
●
Confiável;
●
Gratuito;
●
Apoio da Comunidade;
●
Já foi testado por muitas empresas.
12. Links Importantes
●
http://wiki.pentaho.com
●
http://forums.pentaho.com/
●
http://sourceforge.net/projects/pentaho/
13. Possibilidades
Permite realizar consultas, relatórios, análise de
informações (OLAP), painéis (dashboards) para
controle gerencial, ETL e mineração de dados
(Data Mining).
15. Vantagens
Custo Zero de Licença do Pentaho;
Desenvolvimento customizado dos Indicadores
de Negócios (Relatórios, Cubos e Dashboards);
Acesso web aos Indicadores independente de
sistema operacional (Windows, Linux, Mac,
iPhone).
18. Blogs Pentaho
Blog Doug Moran (Pentaho Community Guy)
http://dougmoran.blogspot.com/
Blog Matt Casters (Kettle Guy)
http://www.ibridge.be/
Blog Julian Hyde (Mondrian Guy)
http://julianhyde.blogspot.com/
Blog Thomas Morgner (Reporting Guy)
http://www.sherito.org/
Blog Pedro Alves (CDF Guy)
http://pedroalves-bi.blogspot.com/
Blog Roland Bouman (Author of Pentaho Solutions Book)
http://rpbouman.blogspot.com/
20. Licença
A plataforma Pentaho é distribuída como Código
Aberto através da Licença Pública da Pentaho
(PPL,do inglês, Pentaho Public License). Uma
cópia desta licença está disponível em
http://www.pentaho.org/license.
A PPL é similar à Licença Pública do Mozilla
V1.1, com exceção de um atributo adicional.
21. Pentaho CE ou EE
Pentaho CE (Community Edition) = gratuita;
Pentaho EE (Enterprise Edition) = paga;
Para realizar comparações entre as versões
acesse:
http://www.pentaho.com/products/enterprise/ent
erprise_comparison.php
26. Kettle (ETL)
Também conhecido como PDI (Pentaho Data
Integration);
Realiza integração de dados entre empresas e
sistemas;
Lê e escreve mais de 10 formatos de SGBD,
como Oracle, PostgreSQL, SQL Server, etc;
Importa arquivos texto, excel e bases de dados;
Responsável pelos processos de ETL.
27. Kettle (ETL)
Desenvolvido por profissionais que trabalharam
em empresas como a Informatica e SAS;
Comparavél com as ferramentas comerciais;
Ambiente gráfico que possibilita a criação dos
processos de ETL de forma visual.
42. Report Designer
Também conhecido como PRD (Pentaho Report
Designer);
Auxilia na criação de relatórios;
Muito parecido com outras ferramentas
comerciais;
Pode-se também utilizar o iReport para criar
relatórios.
46. WEKA – Data Mining
• Weka (Waikato Environment for Knowledge
Analysis)
• Ferramenta de Data Mining criada em 1993
pela “University of Waikato” (Nova Zelândia);
• Desenvolvida em Java;
• Recebe o SIGKDD Data Mining and
Knowledge Discovery Service Award em
2005;
• Em 2006 é comprada pela Pentaho;
• GNU – General Public License.
• Site: http://www.cs.waikato.ac.nz/ml/weka/
48. Weka na CPBR10
Oficina: Data Mining Weka na Campus Party
2010 pelos Campuseiros Ary Fagundes Bressane
Neto (pesquisador de Inteligência Artificial) e
Flávio Soares Corrêa da Silva (livre docente da
USP)
Link da Oficina:
http://blog.professorcoruja.com/2010/02/software-
livre-oficina-data-mining-weka.html
50. CDF Dashboard
Editor
Ferramenta web criada pela Comunidade (Pedro
Alves e outros) para facilitar o desenvolvimento
de dashboards.
Informações sobre o projeto:
http://code.google.com/p/cdf-de/
59. Servidor Pentaho
Executa dentro de um
Webserver com J2EE:
Apache Tomcat
JBOSS
60. Escolha do BD
A versão default do Pentaho vem pronta para
execução, não existindo a necessidade de
configuração do Banco de Dados com as tabelas
do BI Server.
Porém existe a possibilidade de alterar as
configurações do hibernate para o Pentaho
funcionar com outros bancos de dados como:
MySQL, Oracle ou PostgreSQL.
68. Comunidade
O Perfil da Comunidade Pentaho:
Empresas Públicas;
Empresas Privadas;
Universidades
Alunos de Graduação;
Alunos de Pós-Graduação;
Professores;
69. Quantos somos
●
No Brasil há cerca de 1000 pessoas
cadastradas nas listas de Pentaho e muitas
outras que utilizam a ferramenta mas não
fazem parte destas listas.
70. Como participamos
●
Fórum de discussão da Pentaho (Oficial);
●
IRC;
●
Twitter;
●
Listas de discussão;
●
Blogs;
●
E-mails;
●
Encontros nacionais e internacionais.