Este documento fornece um resumo da plataforma de Business Intelligence (BI) de código aberto Pentaho. Ele descreve as principais ferramentas da Pentaho como Kettle para ETL, Mondrian para OLAP, jPivot e Report Designer para relatórios, Weka para mineração de dados e CDF para dashboards. O documento também discute a comunidade Pentaho no Brasil e contribuições para ensinar outros sobre como usar a plataforma Pentaho.
Pentaho BI: Inteligência de Negócios com Software Livre
1. Pentaho: Inteligência de
Negócios utilizando Software
Livre.
Festival Latino Americano de Instalação de
Software Livre – São Paulo - 9 de abril de 2011
2. Por que BI?
Utilizando estratégias de Inteligência de
Negócios (Business Intelligence - BI) é possível
tomar decisões mais rápidas e seguras para
sua empresa. E utilizando a ferramenta certa de
BI você garante o sucesso de seu projeto!
8. Pentaho
O Pentaho atualmente é a plataforma de
inteligência de negócios de código aberto mais
popular e poderosa no mundo.
No link abaixo você encontra um video contando
a história da Pentaho de forma divertida
http://blog.professorcoruja.com/2011/04/pentaho-
team-2009-pick-pentaho.html
9. Pentaho Corp.
●
Fundada em 2004;
●
Sede em Orlando, Florida, Estados Unidos;
●
Aportes financeiros de fundos de investimentos
como Enterprise Associates, investidores do
SugarCRM, Xensource, Index Ventures,
MySQL, Zend e outros.
10. Por que Pentaho?
●
Funciona;
●
Tecnologia Java;
●
Código Aberto;
●
Robusto;
●
Confiável;
●
Gratuito;
●
Apoio da Comunidade;
●
Testado por muitas empresas.
11. Links Importantes
●
http://wiki.pentaho.com
●
http://forums.pentaho.com/
●
http://sourceforge.net/projects/pentaho/
12. Possibilidades
Permite realizar consultas, relatórios, análise de
informações (OLAP), painéis (dashboards) para
controle gerencial, ETL e mineração de dados
(Data Mining).
14. Vantagens
Custo Zero de Licença do Pentaho;
Desenvolvimento customizado dos Indicadores
de Negócios (Relatórios, Cubos e Dashboards);
Acesso web aos Indicadores independente de
sistema operacional (Windows, Linux, Mac,
iPhone).
17. Blogs Pentaho
Blog Doug Moran (Pentaho Community Guy)
http://dougmoran.blogspot.com/
Blog Matt Casters (Kettle Guy)
http://www.ibridge.be/
Blog Julian Hyde (Mondrian Guy)
http://julianhyde.blogspot.com/
Blog Thomas Morgner (Reporting Guy)
http://www.sherito.org/
Blog Pedro Alves (CDF Guy)
http://pedroalves-bi.blogspot.com/
Blog Roland Bouman (Author of Pentaho Solutions Book)
http://rpbouman.blogspot.com/
19. Licença
A plataforma Pentaho é distribuída como Código
Aberto através da Licença Pública da Pentaho
(PPL,do inglês, Pentaho Public License). Uma
cópia desta licença está disponível em
http://www.pentaho.org/license.
A PPL é similar à Licença Pública do Mozilla
V1.1, com exceção de um atributo adicional.
20. Pentaho CE ou EE
Pentaho CE (Community Edition): gratuita;
Pentaho EE (Enterprise Edition): paga;
Para realizar comparações entre as versões
acesse:
http://www.pentaho.com/products/enterprise/ent
erprise_comparison.php
25. Kettle (ETL)
Também conhecido como PDI (Pentaho Data
Integration);
Realiza integração de dados entre empresas e
sistemas;
Lê e escreve mais de 10 formatos de SGBD,
como Oracle, PostgreSQL, SQL Server, etc;
Importa arquivos texto, excel e bases de dados;
Responsável pelos processos de ETL.
26. Kettle (ETL)
Desenvolvido por profissionais que trabalharam
em empresas como a Informatica e SAS;
Comparavél com as ferramentas comerciais;
Ambiente gráfico que possibilita a criação dos
processos de ETL de forma visual.
41. Report Designer
Também conhecido como PRD (Pentaho Report
Designer);
Auxilia na criação de relatórios;
Muito parecido com outras ferramentas
comerciais;
Pode-se também utilizar o iReport para criar
relatórios.
45. WEKA – Data Mining
• Weka (Waikato Environment for Knowledge
Analysis)
• Ferramenta de Data Mining criada em 1993
pela “University of Waikato” (Nova Zelândia);
• Desenvolvida em Java;
• Recebe o SIGKDD Data Mining and
Knowledge Discovery Service Award em
2005;
• Em 2006 é comprada pela Pentaho;
• GNU – General Public License.
• Site: http://www.cs.waikato.ac.nz/ml/weka/
47. Weka na CPBR10
Oficina: Data Mining Weka na Campus Party
2010 pelos Campuseiros Ary Fagundes Bressane
Neto (pesquisador de Inteligência Artificial) e
Flávio Soares Corrêa da Silva (livre docente da
USP)
Link da Oficina:
http://blog.professorcoruja.com/2010/02/software-
livre-oficina-data-mining-weka.html
49. CDF Dashboard
Editor
Ferramenta web criada pela Comunidade (Pedro
Alves e outros) para facilitar o desenvolvimento
de dashboards.
Informações sobre o projeto:
http://code.google.com/p/cdf-de/
65. Comunidade
O Perfil da Comunidade Pentaho:
Empresas Públicas;
Empresas Privadas;
Universidades:
Alunos de Graduação;
Alunos de Pós-Graduação;
Professores.
66. Quantos somos
●
No Brasil há cerca de 1000 pessoas
cadastradas nas listas de Pentaho e muitas
outras que utilizam a ferramenta mas não
fazem parte destas listas.
67. Como participamos
●
Fórum de discussão da Pentaho (Oficial);
●
IRC;
●
Twitter;
●
Listas de discussão;
●
Blogs;
●
E-mails;
●
Encontros nacionais e internacionais.
71. Introdução
●
Acesse os links abaixo para uma introdução ao
Pentaho
http://blog.professorcoruja.com/2009/03/ent
endendo-o-pentaho-faq.html
http://blog.professorcoruja.com/2011/01/intr
oducao-ao-pentaho.html
72. Instalação
●
Acesse os links abaixo para aprender a fazer
uma instalação básica e uma outra um pouco
mais avançada do Pentaho
http://blog.professorcoruja.com/2009/09/co
mo-instalar-o-pentaho.html
http://blog.professorcoruja.com/2011/01/ins
talacao-avancada-do-pentaho-bi.html
74. Dashboards
●
Video-aula de como criar um dashboard
http://blog.professorcoruja.com/2011/02/vid
eo-aula-gratuita-criacao-de-um.html
75. Mondrian
●
Entenda mais sobre o Mondrian OLAP Server
http://blog.professorcoruja.com/2010/05/ent
endendo-o-mondrian-olap-server.html
76. Tabelas Agregadas
●
Entenda mais sobre tabelas agregadas
http://blog.professorcoruja.com/2010/11/me
lhore-performance-de-seus-cubos-
olap.html
http://blog.professorcoruja.com/2010/11/pe
ntaho-aggregation-designer-
overview.html
77. Tabelas Agregadas
●
Entenda mais sobre o Mondrian OLAP Server
http://blog.professorcoruja.com/2010/11/me
lhore-performance-de-seus-cubos-
olap.html