SlideShare ist ein Scribd-Unternehmen logo
1 von 50
Downloaden Sie, um offline zu lesen
Oficina de Pentaho


 Wesley Seidel Carvalho
    wesley.seidel@gmail.com
    www.ime.usp.br/~wesleys
O que é BI?
●   São muitos os conceitos.

●   Vamos falar da idéia:
●   A idéia é que um sistema de BI possua, dentre
    outras as seguintes características [Caiçara
    Júnior]:
    ●   Fornecer informações relevantes para auxiliar na
        tomada de decisão;
    ●   Disponíveis a qualquer momento;
    ●   Fácil utilização.
BI possui muitos nomes:
●   Para empresários:
    ●   busca de mercado;
    ●   Inteligência competitiva;


●   Para outros:
    ●   relatório;
    ●   análises;
    ●   análise do negócio;
    ●   suporte a decisão.
OLTP
●   On-Line Transactional Processing
Ué? Mas eu não consigo gerar esses dados e
 análises direto de um sistema transacional?
Sim, só que...
●   As organizações geralmente possuem:
    ●   Mais de um sistema;
    ●   Sistemas armazenam em fontes distintas;
         –   MySql, SQL Server, Texto, XML ...
    ●   Existencia de planilhas;
    ●   Diferença entre representações de um mesma
        informação;
         –   M/F, 0/1, H/M ...
    ●   Etc...
E agora? Quem poderá me Salvar?
Opssss... Bem... Que tal:
●   Sistemas de apoio à decisão (SAD)


    ou

●   Sistemas OLAP (On-Line Analytical
    Processing);
O que é OLAP ?
●   Sistema de informação utilizado para viabilizar
    a análise da empresa e auxiliar na tomada de
    decisão. [Segundo Machado (2004)]
OLTP vs OLAP
                OLTP                           OLAP
Origem dos      Dados operacionais             Dados consolidados
dados                                          Vários Sistemas OLTP's
Propósito dos   Controlar e executar tarefas   Auxiliar o planejamento, resolução
dados           fundamentais do negócio        de problemas e suporte a decisão
Organização     Entidade Relacionamento;       Modelagem Multi-dimensional;
dos dados       Normalizado                    De-normalizado
Idade dos       Presente                       Histórico, Atual e Projetado
dados
Velocidade de   Geralmente muito rápido;       Depende da quantidade de dados;
processamento                                  cargas podem levar horas
Consultas       Relativamente simples;         Mais complexas;
                Retorna “poucos” registros;    Envolvem agregações;



                                       ...
Mais sobre OLAP:
●   Sistemas OLAP oferecem:
    ●   Diferentes perspectivas, n-dimensões;
        –   visão multidimensional das informações
    ●   De forma rápida;
    ●   Consistente;
    ●   Normalmente na forma de CUBOS OLAP's.
CUBOS OLAP's ?
CUBOS OLAP's ?
●   Cubos é uma forma de representação dos
    dados em um formato Multi-dimensional.
CUBOS OLAP's ?




          http://msdn.microsoft.com/pt-br/library/ms175449.aspx
CUBOS OLAP's
      ●   Cada face representa um
          aspecto do assunto que se
          deseja analisar
          ●   ( Dimensão );


      ●   Cada célula é representada
          por uma medida;
          ●   (Campo da tabela de Fatos );


      ●   É possível observar várias
          visões do dado que está
          sendo apresentado.
Composição de um CUBO

                ou

composição modelo multidimensional:
Composição de um CUBO
●   Fatos ou Tabela Fato:
    ●   Eventos que nos interessam avaliar;


●   Dimensões:
    ●   São os elementos que compõe um fato;
        –   Ex:
             ●   Produtos, períodos ( dia, mês, trimestre, ano ... ), segmento de clientes,
                 fornecedores, ...;


    ●   Hierarquias da dimensão:
        –   Período: Ano → Mês → Dia
        –   Localização: País → Estados → Cidades → Bairros
Composição de um CUBO
●   Métricas:
    ●   São os valores que estamos interessados em
        medir.

        –   Ex:
             ●   Qnt de produtos vendidos;
             ●   Lucro obtido (R$);
             ●   Quantidade de votos;
Representação lógica de um CUBO:
●   Baseada no modelo relacional;
●   Esquemas:
    ●   Estrela (star schema)
        –   A Tabela Fato no centro e as Dimensões ao seu redor;


    ●   Floco de Neve (snowflake)
        –   Parecido o esquema estrela, porém normaliza as
            hierarquias das dimensões;
Esquema Estrela
Esquema Estrela
Snowflake
Snowflake
Operações Básica de um sistema
               OLAP:
●   Dril-Down:
    ●   Nível mais detalhados;
●   Dril-Up ou Roll-up:
    ●   Nível mais agregados;
●   Slice:
    ●   Redução de escopo e mantendo a mesma perspectiva;
●   Dice:
    ●   Mudança de perspectiva;
●   Pivoting:
    ●   Alterar eixos de visualização.
E o Datawarehouse? O que é ?
●   Um conjunto de dados para apoio a decisão e
    possui as características [Inmon]:
    ●   -Orientado a assuntos
        –   Ao invés de aplicações;
    ●   -Integrado
        –   Adaptação e padronização dos dados vindos de diferentes
            sistemas;
    ●   -Não volátil:
        –   Sem atualizações, e sim carga inicial ou incremental e
            modo de acesso apenas leitura ;
    ●   -Variável em relação ao tempo.
ETL
●   É a etapa do processo de construção de um
    DW que consiste em:
●   Extract:
    ●   Dados dos OLTP's
●   Transformation:
    ●   Limpeza e Transformação ( padronização )
●   Load:
    ●   “Alimentar” o DW.
Como tudo isso funciona junto ?
Data
E   Warehouse
                  Sistema
T                    BI
L
    DM1 DM2 DM3
A Pentaho BI Suite.




      O que é?
A Pentaho BI Suite.
●   Pentaho BI Suite é uma plataforma Open
    Source para desenvolvimento de Soluções em
    Business Intelligence.



●   Mantida pela Empresa Pentaho ela é suportada
    por comunidades de usuários e
    desenvolvedores ao redor do mundo
A Pentaho BI Suite.
●   Composta por diversas ferramentas:
    ●   Para analistas e Gestores:




    ●   Para a equipe de desenvolvimento do projeto de BI
Arquitetura
Servidor BI




Responsável pelo gerenciamento dos indicadores,
compartilhamento entre os usuários, controle de
acesso, origem dos dados, entre outras coisas.
Servidor BI
PAC( Pentaho Administrator Console)
PRD (Pentaho Report Designer)
PDI (Pentaho Data Integration)
PSW (Pentaho Schema Workbench)
PME (Pentaho Metadata Editor)
Weka
???????
          PDI
                               PSW
                  ???????               PRD



                  Data
            E   Warehouse                 PME
                              Sistema     (Ad-Hoc)
            T                    BI
            L
                DM1 DM2 DM3




                Weka
Nossa Oficina!
Efetuar um pequeno ETL
●   Origem:
    ●   extras/dados/candidatos_2008.csv

can_id;                                    nomecand;
ano;                                       nomeurna;
turno;                                     data_nasc;
codmun;                                    codnasc;
                                           sexo;
codibge6;
                                           estciv;
codcargo;                                  inst;
codcand;                                   ocup;
codpart;                                   cpf;
siglapart;                                 leg;
nomepart;                                  sit_pos;
PDI (Pentaho Data Integration)
Esquema Estrela.

 DIM_Cargos                       DIM_Partidos




                    FATO_Candidatos




DIM_Municipios
                                      DIM_Pessoas
PSW (Pentaho Schema Workbench)
Mãos à Obra.
Referências
●   INMON. W. H., Como construir um Data warehouse (tradução da
    segunda edição), editora campus, 1997.
●   KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: O guia completo
    para modelagem dimensional.
●   LIMA, Thalles da Silva, CARVALHO, Wesley Seidel, Montando um cubo
    Olap com o MS Analisys Services, 2007.
●   SOUZA, Caio Moreno, Integração de ferramentas de código aberto (java,
    pentaho e android) e mapas, aplicada a projetos de inteligência de
    negócios, 2010 (Monografia).
●   BOBSIN, Juliana Bitello, Uma solução bi utilizando ferramentas open
    source, 2010 (Monografia).
●   CARNIEL, Anderson, BJIN OLAP: Uma ferramenta OLAP baseada no
    índice bitmap de junção, 2012 (TCC).
●   Suíte Pentaho. <http://www.pentaho.com>.
Obrigado !

Weitere ähnliche Inhalte

Was ist angesagt?

Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...Caio Moreno
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoAmbiente Livre
 
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Caio Moreno
 
Aula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIAula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIJarley Nóbrega
 
Introdução ao BI
Introdução ao BIIntrodução ao BI
Introdução ao BIpichiliani
 
Apostila de banco de dados e sql
Apostila de banco de dados e sqlApostila de banco de dados e sql
Apostila de banco de dados e sqlLindomar ...
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data WarehouseMessias Batista
 
Apostila de banco de dados e sql
Apostila de banco de dados e sqlApostila de banco de dados e sql
Apostila de banco de dados e sqlYara Santos
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data WarehouseJeorgeCarmona
 
Estilização do Pentaho BI Server
Estilização do Pentaho BI ServerEstilização do Pentaho BI Server
Estilização do Pentaho BI ServerIT4biz IT Solutions
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMarco Garcia
 
38664419 artigo-data warehouse
38664419 artigo-data warehouse38664419 artigo-data warehouse
38664419 artigo-data warehousediochel
 

Was ist angesagt? (20)

Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI Pentaho
 
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
 
Aula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIAula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDI
 
Data Warehouse - Modelagem
Data Warehouse - ModelagemData Warehouse - Modelagem
Data Warehouse - Modelagem
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Business Intelligence - Data Warehouse
Business Intelligence - Data WarehouseBusiness Intelligence - Data Warehouse
Business Intelligence - Data Warehouse
 
Banco de dados e sql
Banco de dados e sqlBanco de dados e sql
Banco de dados e sql
 
Introdução ao BI
Introdução ao BIIntrodução ao BI
Introdução ao BI
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Apostila de banco de dados e sql
Apostila de banco de dados e sqlApostila de banco de dados e sql
Apostila de banco de dados e sql
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data Warehouse
 
Apostila de banco de dados e sql
Apostila de banco de dados e sqlApostila de banco de dados e sql
Apostila de banco de dados e sql
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Estilização do Pentaho BI Server
Estilização do Pentaho BI ServerEstilização do Pentaho BI Server
Estilização do Pentaho BI Server
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho Day
 
38664419 artigo-data warehouse
38664419 artigo-data warehouse38664419 artigo-data warehouse
38664419 artigo-data warehouse
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Banco de dados
Banco de dadosBanco de dados
Banco de dados
 

Andere mochten auch

Webinar: Conhecendo a solução Pentaho, líder em Business Analytics
Webinar: Conhecendo a solução Pentaho, líder em Business AnalyticsWebinar: Conhecendo a solução Pentaho, líder em Business Analytics
Webinar: Conhecendo a solução Pentaho, líder em Business AnalyticsRicardo Gouvêa
 
Construindo um data warehouse com Pentaho e Docker
Construindo um data warehouse com Pentaho e DockerConstruindo um data warehouse com Pentaho e Docker
Construindo um data warehouse com Pentaho e DockerWellington Marinho
 
Building a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerBuilding a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerWellington Marinho
 
Sugestão de indicadores para bi de prefeituras
Sugestão de indicadores para bi de prefeiturasSugestão de indicadores para bi de prefeituras
Sugestão de indicadores para bi de prefeiturasIT4biz IT Solutions
 
Sugestão de indicadores para bi prefeituras
Sugestão de indicadores para bi prefeiturasSugestão de indicadores para bi prefeituras
Sugestão de indicadores para bi prefeiturasIT4biz IT Solutions
 
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...IT4biz IT Solutions
 
Filiação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federaisFiliação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federaisRommel Carvalho
 
Modelo de Dados: Entendendo e “re-”construindo...
Modelo de Dados: Entendendo e “re-”construindo...Modelo de Dados: Entendendo e “re-”construindo...
Modelo de Dados: Entendendo e “re-”construindo...Wesley Seidel
 
Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...Rommel Carvalho
 
Ferramentas para Mineração de Dados
Ferramentas para Mineração de DadosFerramentas para Mineração de Dados
Ferramentas para Mineração de DadosManoel Amaro
 
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate SearchTurbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate SearchPaulo César M Jeveaux
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceIT4biz IT Solutions
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Rommel Carvalho
 
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SagePentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SageVinicius Elyseu
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneAndré Luis Schwerz
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosRubem Ventura Alves
 
Weka em aplicações java
Weka em aplicações javaWeka em aplicações java
Weka em aplicações javaMarcio Palheta
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentahoTalita Lima
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationJarley Nóbrega
 

Andere mochten auch (20)

Webinar: Conhecendo a solução Pentaho, líder em Business Analytics
Webinar: Conhecendo a solução Pentaho, líder em Business AnalyticsWebinar: Conhecendo a solução Pentaho, líder em Business Analytics
Webinar: Conhecendo a solução Pentaho, líder em Business Analytics
 
Construindo um data warehouse com Pentaho e Docker
Construindo um data warehouse com Pentaho e DockerConstruindo um data warehouse com Pentaho e Docker
Construindo um data warehouse com Pentaho e Docker
 
Building a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerBuilding a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and Docker
 
Sugestão de indicadores para bi de prefeituras
Sugestão de indicadores para bi de prefeiturasSugestão de indicadores para bi de prefeituras
Sugestão de indicadores para bi de prefeituras
 
Sugestão de indicadores para bi prefeituras
Sugestão de indicadores para bi prefeiturasSugestão de indicadores para bi prefeituras
Sugestão de indicadores para bi prefeituras
 
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...
Cidade Aberta BI - O Gestor de BI Open Source 100% livre para as prefeituras ...
 
Filiação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federaisFiliação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federais
 
Modelo de Dados: Entendendo e “re-”construindo...
Modelo de Dados: Entendendo e “re-”construindo...Modelo de Dados: Entendendo e “re-”construindo...
Modelo de Dados: Entendendo e “re-”construindo...
 
Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...
 
Ferramentas para Mineração de Dados
Ferramentas para Mineração de DadosFerramentas para Mineração de Dados
Ferramentas para Mineração de Dados
 
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate SearchTurbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...
 
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SagePentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
 
Relatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta WekaRelatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta Weka
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de Dados
 
Weka em aplicações java
Weka em aplicações javaWeka em aplicações java
Weka em aplicações java
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentaho
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data Integration
 

Ähnlich wie BI Suite Pentaho

TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreCaio Moreno
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreIT4biz IT Solutions
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...tdc-globalcode
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Caio Moreno
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...IT4biz IT Solutions
 
Pentaho inteligência de negócios utilizando software livre campus party 2011
Pentaho  inteligência de negócios utilizando software livre   campus party 2011Pentaho  inteligência de negócios utilizando software livre   campus party 2011
Pentaho inteligência de negócios utilizando software livre campus party 2011Campus Party Brasil
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDatatdc-globalcode
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...tdc-globalcode
 
Business Intelligence - Palestra
Business Intelligence - PalestraBusiness Intelligence - Palestra
Business Intelligence - PalestraMarco Garcia
 
Business intelligence x Datamining
Business intelligence x DataminingBusiness intelligence x Datamining
Business intelligence x DataminingLeonardo Holanda
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 

Ähnlich wie BI Suite Pentaho (20)

TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
13 banco-de-dados
13 banco-de-dados13 banco-de-dados
13 banco-de-dados
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
 
Pentaho inteligência de negócios utilizando software livre campus party 2011
Pentaho  inteligência de negócios utilizando software livre   campus party 2011Pentaho  inteligência de negócios utilizando software livre   campus party 2011
Pentaho inteligência de negócios utilizando software livre campus party 2011
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
 
Bi microsoft & pentaho
Bi microsoft & pentahoBi microsoft & pentaho
Bi microsoft & pentaho
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
 
Business Intelligence - Palestra
Business Intelligence - PalestraBusiness Intelligence - Palestra
Business Intelligence - Palestra
 
Business intelligence x Datamining
Business intelligence x DataminingBusiness intelligence x Datamining
Business intelligence x Datamining
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 

BI Suite Pentaho

  • 1. Oficina de Pentaho Wesley Seidel Carvalho wesley.seidel@gmail.com www.ime.usp.br/~wesleys
  • 2. O que é BI? ● São muitos os conceitos. ● Vamos falar da idéia: ● A idéia é que um sistema de BI possua, dentre outras as seguintes características [Caiçara Júnior]: ● Fornecer informações relevantes para auxiliar na tomada de decisão; ● Disponíveis a qualquer momento; ● Fácil utilização.
  • 3. BI possui muitos nomes: ● Para empresários: ● busca de mercado; ● Inteligência competitiva; ● Para outros: ● relatório; ● análises; ● análise do negócio; ● suporte a decisão.
  • 4. OLTP ● On-Line Transactional Processing
  • 5. Ué? Mas eu não consigo gerar esses dados e análises direto de um sistema transacional?
  • 6. Sim, só que... ● As organizações geralmente possuem: ● Mais de um sistema; ● Sistemas armazenam em fontes distintas; – MySql, SQL Server, Texto, XML ... ● Existencia de planilhas; ● Diferença entre representações de um mesma informação; – M/F, 0/1, H/M ... ● Etc...
  • 7. E agora? Quem poderá me Salvar?
  • 8. Opssss... Bem... Que tal: ● Sistemas de apoio à decisão (SAD) ou ● Sistemas OLAP (On-Line Analytical Processing);
  • 9. O que é OLAP ? ● Sistema de informação utilizado para viabilizar a análise da empresa e auxiliar na tomada de decisão. [Segundo Machado (2004)]
  • 10. OLTP vs OLAP OLTP OLAP Origem dos Dados operacionais Dados consolidados dados Vários Sistemas OLTP's Propósito dos Controlar e executar tarefas Auxiliar o planejamento, resolução dados fundamentais do negócio de problemas e suporte a decisão Organização Entidade Relacionamento; Modelagem Multi-dimensional; dos dados Normalizado De-normalizado Idade dos Presente Histórico, Atual e Projetado dados Velocidade de Geralmente muito rápido; Depende da quantidade de dados; processamento cargas podem levar horas Consultas Relativamente simples; Mais complexas; Retorna “poucos” registros; Envolvem agregações; ...
  • 11. Mais sobre OLAP: ● Sistemas OLAP oferecem: ● Diferentes perspectivas, n-dimensões; – visão multidimensional das informações ● De forma rápida; ● Consistente; ● Normalmente na forma de CUBOS OLAP's.
  • 13. CUBOS OLAP's ? ● Cubos é uma forma de representação dos dados em um formato Multi-dimensional.
  • 14. CUBOS OLAP's ? http://msdn.microsoft.com/pt-br/library/ms175449.aspx
  • 15. CUBOS OLAP's ● Cada face representa um aspecto do assunto que se deseja analisar ● ( Dimensão ); ● Cada célula é representada por uma medida; ● (Campo da tabela de Fatos ); ● É possível observar várias visões do dado que está sendo apresentado.
  • 16. Composição de um CUBO ou composição modelo multidimensional:
  • 17. Composição de um CUBO ● Fatos ou Tabela Fato: ● Eventos que nos interessam avaliar; ● Dimensões: ● São os elementos que compõe um fato; – Ex: ● Produtos, períodos ( dia, mês, trimestre, ano ... ), segmento de clientes, fornecedores, ...; ● Hierarquias da dimensão: – Período: Ano → Mês → Dia – Localização: País → Estados → Cidades → Bairros
  • 18. Composição de um CUBO ● Métricas: ● São os valores que estamos interessados em medir. – Ex: ● Qnt de produtos vendidos; ● Lucro obtido (R$); ● Quantidade de votos;
  • 19. Representação lógica de um CUBO: ● Baseada no modelo relacional; ● Esquemas: ● Estrela (star schema) – A Tabela Fato no centro e as Dimensões ao seu redor; ● Floco de Neve (snowflake) – Parecido o esquema estrela, porém normaliza as hierarquias das dimensões;
  • 24. Operações Básica de um sistema OLAP: ● Dril-Down: ● Nível mais detalhados; ● Dril-Up ou Roll-up: ● Nível mais agregados; ● Slice: ● Redução de escopo e mantendo a mesma perspectiva; ● Dice: ● Mudança de perspectiva; ● Pivoting: ● Alterar eixos de visualização.
  • 25. E o Datawarehouse? O que é ? ● Um conjunto de dados para apoio a decisão e possui as características [Inmon]: ● -Orientado a assuntos – Ao invés de aplicações; ● -Integrado – Adaptação e padronização dos dados vindos de diferentes sistemas; ● -Não volátil: – Sem atualizações, e sim carga inicial ou incremental e modo de acesso apenas leitura ; ● -Variável em relação ao tempo.
  • 26. ETL ● É a etapa do processo de construção de um DW que consiste em: ● Extract: ● Dados dos OLTP's ● Transformation: ● Limpeza e Transformação ( padronização ) ● Load: ● “Alimentar” o DW.
  • 27. Como tudo isso funciona junto ?
  • 28. Data E Warehouse Sistema T BI L DM1 DM2 DM3
  • 29. A Pentaho BI Suite. O que é?
  • 30. A Pentaho BI Suite. ● Pentaho BI Suite é uma plataforma Open Source para desenvolvimento de Soluções em Business Intelligence. ● Mantida pela Empresa Pentaho ela é suportada por comunidades de usuários e desenvolvedores ao redor do mundo
  • 31. A Pentaho BI Suite. ● Composta por diversas ferramentas: ● Para analistas e Gestores: ● Para a equipe de desenvolvimento do projeto de BI
  • 33. Servidor BI Responsável pelo gerenciamento dos indicadores, compartilhamento entre os usuários, controle de acesso, origem dos dados, entre outras coisas.
  • 36. PRD (Pentaho Report Designer)
  • 37. PDI (Pentaho Data Integration)
  • 38. PSW (Pentaho Schema Workbench)
  • 40. Weka
  • 41.
  • 42. ??????? PDI PSW ??????? PRD Data E Warehouse PME Sistema (Ad-Hoc) T BI L DM1 DM2 DM3 Weka
  • 44. Efetuar um pequeno ETL ● Origem: ● extras/dados/candidatos_2008.csv can_id; nomecand; ano; nomeurna; turno; data_nasc; codmun; codnasc; sexo; codibge6; estciv; codcargo; inst; codcand; ocup; codpart; cpf; siglapart; leg; nomepart; sit_pos;
  • 45. PDI (Pentaho Data Integration)
  • 46. Esquema Estrela. DIM_Cargos DIM_Partidos FATO_Candidatos DIM_Municipios DIM_Pessoas
  • 47. PSW (Pentaho Schema Workbench)
  • 49. Referências ● INMON. W. H., Como construir um Data warehouse (tradução da segunda edição), editora campus, 1997. ● KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: O guia completo para modelagem dimensional. ● LIMA, Thalles da Silva, CARVALHO, Wesley Seidel, Montando um cubo Olap com o MS Analisys Services, 2007. ● SOUZA, Caio Moreno, Integração de ferramentas de código aberto (java, pentaho e android) e mapas, aplicada a projetos de inteligência de negócios, 2010 (Monografia). ● BOBSIN, Juliana Bitello, Uma solução bi utilizando ferramentas open source, 2010 (Monografia). ● CARNIEL, Anderson, BJIN OLAP: Uma ferramenta OLAP baseada no índice bitmap de junção, 2012 (TCC). ● Suíte Pentaho. <http://www.pentaho.com>.