SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Universidade Federal de Alagoas (UFAL) 
Instituto de Computação (IC) 
Apache Tajo 
Michel de S. Miranda E-mail: micheldsmiranda@gmail.com 
10/06/2014
Roteiro … 
oO que é o Apache Tajo; 
oQuem Utiliza; 
oInstalação; 
oLinguagem de Manipulação de Dados; 
oApresentação e; 
oDemonstração em uma Base de Dados. 
2
Apache Tajo ... 
•É um sistema de armazenamento de dados relacional e distribuídos para Hadoop; 
•Projetado permite a consultas de baixa latência e escaláveis; 
•Agregação on-line; 
•ETL (extract-processo de transformar-carga) em conjuntos de dados armazenados no HDFS (Hadoop Distributed File System) e outras fontes de dados. 
3
Apache Tajo ... 
•Características: 
1.Rápido e Eficiente; 
2.Escalável; 
3.Compatível e; 
4.Fácil. 
4
Apache Tajo ... 
•Características: Rápido e Eficiente: 
Totalmente distribuído em mecanismo de processamento de consulta SQL; 
Otimização de consulta avançada e; 
Análise interativa em conjunto de dados razoável. 
5
Apache Tajo ... 
•Características: Escalável 
A tolerância a falhas e programação dinâmica para consultas de longa duração e; 
Possui algoritmos para conjuntos de dados maior do que a memória principal. 
6
Apache Tajo ... 
•Características: Compatível 
Conformidade com os padrões (ANSI / ISO SQL); 
Suporte de acesso Hive MetaStore; 
Suporte de driver JDBC e; 
Vários formatos de arquivo de apoio, tais como CSV, rcfile, RowFile, SequenceFile e Parquet. 
7
Apache Tajo ... 
•Características: Fácil 
Funções definidas pelo usuário; 
Shell interativo; 
Backup e; 
Asynchronous / Synchronous Java API. 
8
Apache Tajo ... 
•História.... 
Começou em 2010 no Laboratório de Banco de Dados da Universidade da Coreia; 
 Entrou no Apache Incubator em Março de 2013 e; 
Apache Tajo está em uso em Gruter, Universidade da Coreia, e SK Telecom. 
9
Apache Tajo ... 
•História.... 
Software Apache Tajo é distribuído sobre a licença Apache v2.0; 
O software encontra-se na Apache Tajo™. 0.8.0 
10
Apache Tajo ... 
•Quem utiliza ...... 
11
Apache Tajo ... 
•Aplicações 
oPodemos aplicar o Tajo para analisar grandes conjuntos de dados em tempo real. 
Controle de trafego aéreo; 
Telecomunicações; 
Sistemas Financeiros; 
Entre outros. 
12
Apache Tajo ... 
•Linguagem de Manipulação de Dado 
13
Apache Tajo ... 
•Instalação 
oRealizada em 2 PARTES 
14
Apache Tajo ... 
•Instalação Parte I – Downloads e Instalação dos Softwares 
1.VM; 
2.Maven 3.1; 
3.Java 1.6 
4.Make 
5.Protocol buffer 2.5.0 
6.Versão 2.4 do Radoop; 
7.Tajo 0.8.0; 
15
Apache Tajo ... 
•Instalação Parte II – Configuração 
1.TAJO_HOME; 
2.JAVA_HOME e; 
3. HADOOP_HOME. 
16
Apache Tajo ... 
•Apresentação 
•Criação do arquivo “data.csv” 
17
Apache Tajo ... 
•Apresentação 
•Acessando o Tajo SQL “tsql” 
18
Apache Tajo ... 
•Apresentação 
•Criando tabela e inserindo os dados do arquivo “data.csv” 
19
Apache Tajo ... 
•Apresentação 
•Apresentado os atributo da tabela “ d ” 
20
Apache Tajo ... 
•Apresentação 
•Realizando uma consulta SQL 
21
Apache Tajo ... 
•Demonstração em uma Base da Dados 
oDados Abertos do Brasil 
oUnidade Básica de Saúde 
oAtualizada em 04/2013 
oA base possui 37691 linhas 
oDisponível em: ABD 
22
Referências 
•Apache Tajo. Disponível em:<http://tajo.apache.org/>. Acessado em 06 de Junho de 2014. 
•The Apache Software Foundation Announces Apache™ Tajo™ as a Top-Level Project. Disponível em: <http://citrix.ulitzer.com/no de/3036803>. Acessado em 06 de Junho de 2014. 
•Máquina Virtual Linux com o Apache Tajo instalado e configurado para uso. Disponível em:<https://www.dropbox.com/s/ 10i401f54vxrfrb/micheldefault140214158885393776.rar>.

Weitere ähnliche Inhalte

Ähnlich wie Apache Tajo: Sistema de armazenamento e consultas distribuídas para Hadoop

Rodando uma API Com Django Rest Framework no Google Cloud
Rodando uma API Com Django Rest Framework  no Google CloudRodando uma API Com Django Rest Framework  no Google Cloud
Rodando uma API Com Django Rest Framework no Google CloudAlvaro Viebrantz
 
Internet das coisas - A Revolução já começou
Internet das coisas - A Revolução já começouInternet das coisas - A Revolução já começou
Internet das coisas - A Revolução já começouJose Wilker
 
Template_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdfTemplate_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdfValdir Adorni
 
Project HA
Project HAProject HA
Project HAKarpv
 
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Ricardo Ferreira
 
JBoss-WildFly - Avançado
JBoss-WildFly - AvançadoJBoss-WildFly - Avançado
JBoss-WildFly - AvançadoAdriano Schmidt
 
Meetup Zabbix Day FMB - O que é o Zabbix
Meetup Zabbix Day FMB - O que é o ZabbixMeetup Zabbix Day FMB - O que é o Zabbix
Meetup Zabbix Day FMB - O que é o ZabbixJulio Pantarotto
 
Gerência - Aula 01
Gerência - Aula 01Gerência - Aula 01
Gerência - Aula 01Marcus Lucas
 
Seguranca da Informação - Firewall iptables
Seguranca da Informação - Firewall iptablesSeguranca da Informação - Firewall iptables
Seguranca da Informação - Firewall iptablesLuiz Arthur
 
IntroduçãO Ao Desenvolvimento Web 2
IntroduçãO Ao Desenvolvimento Web   2IntroduçãO Ao Desenvolvimento Web   2
IntroduçãO Ao Desenvolvimento Web 2Maurício Linhares
 
Apache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataApache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataAmbiente Livre
 

Ähnlich wie Apache Tajo: Sistema de armazenamento e consultas distribuídas para Hadoop (20)

Rodando uma API Com Django Rest Framework no Google Cloud
Rodando uma API Com Django Rest Framework  no Google CloudRodando uma API Com Django Rest Framework  no Google Cloud
Rodando uma API Com Django Rest Framework no Google Cloud
 
Tecnologia Java
Tecnologia JavaTecnologia Java
Tecnologia Java
 
Internet das coisas - A Revolução já começou
Internet das coisas - A Revolução já começouInternet das coisas - A Revolução já começou
Internet das coisas - A Revolução já começou
 
containers-workshop
containers-workshopcontainers-workshop
containers-workshop
 
Template_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdfTemplate_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdf
 
Project HA
Project HAProject HA
Project HA
 
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
 
JBoss-WildFly - Avançado
JBoss-WildFly - AvançadoJBoss-WildFly - Avançado
JBoss-WildFly - Avançado
 
Meetup Zabbix Day FMB - O que é o Zabbix
Meetup Zabbix Day FMB - O que é o ZabbixMeetup Zabbix Day FMB - O que é o Zabbix
Meetup Zabbix Day FMB - O que é o Zabbix
 
De 1 a 1.000.00 de usuários
De 1 a 1.000.00 de usuáriosDe 1 a 1.000.00 de usuários
De 1 a 1.000.00 de usuários
 
Gerência - Aula 01
Gerência - Aula 01Gerência - Aula 01
Gerência - Aula 01
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Seguranca da Informação - Firewall iptables
Seguranca da Informação - Firewall iptablesSeguranca da Informação - Firewall iptables
Seguranca da Informação - Firewall iptables
 
IntroduçãO Ao Desenvolvimento Web 2
IntroduçãO Ao Desenvolvimento Web   2IntroduçãO Ao Desenvolvimento Web   2
IntroduçãO Ao Desenvolvimento Web 2
 
Artigo Rodolfho
Artigo  RodolfhoArtigo  Rodolfho
Artigo Rodolfho
 
Artigo Rodolfho
Artigo RodolfhoArtigo Rodolfho
Artigo Rodolfho
 
Artigo Rodolfho
Artigo RodolfhoArtigo Rodolfho
Artigo Rodolfho
 
Artigo Rodolfho
Artigo RodolfhoArtigo Rodolfho
Artigo Rodolfho
 
JBoss Fuse Workshop Desenvolvimento - Parte 1
JBoss Fuse Workshop Desenvolvimento - Parte 1JBoss Fuse Workshop Desenvolvimento - Parte 1
JBoss Fuse Workshop Desenvolvimento - Parte 1
 
Apache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big DataApache Flink a Quarta Geração do Big Data
Apache Flink a Quarta Geração do Big Data
 

Apache Tajo: Sistema de armazenamento e consultas distribuídas para Hadoop

  • 1. Universidade Federal de Alagoas (UFAL) Instituto de Computação (IC) Apache Tajo Michel de S. Miranda E-mail: micheldsmiranda@gmail.com 10/06/2014
  • 2. Roteiro … oO que é o Apache Tajo; oQuem Utiliza; oInstalação; oLinguagem de Manipulação de Dados; oApresentação e; oDemonstração em uma Base de Dados. 2
  • 3. Apache Tajo ... •É um sistema de armazenamento de dados relacional e distribuídos para Hadoop; •Projetado permite a consultas de baixa latência e escaláveis; •Agregação on-line; •ETL (extract-processo de transformar-carga) em conjuntos de dados armazenados no HDFS (Hadoop Distributed File System) e outras fontes de dados. 3
  • 4. Apache Tajo ... •Características: 1.Rápido e Eficiente; 2.Escalável; 3.Compatível e; 4.Fácil. 4
  • 5. Apache Tajo ... •Características: Rápido e Eficiente: Totalmente distribuído em mecanismo de processamento de consulta SQL; Otimização de consulta avançada e; Análise interativa em conjunto de dados razoável. 5
  • 6. Apache Tajo ... •Características: Escalável A tolerância a falhas e programação dinâmica para consultas de longa duração e; Possui algoritmos para conjuntos de dados maior do que a memória principal. 6
  • 7. Apache Tajo ... •Características: Compatível Conformidade com os padrões (ANSI / ISO SQL); Suporte de acesso Hive MetaStore; Suporte de driver JDBC e; Vários formatos de arquivo de apoio, tais como CSV, rcfile, RowFile, SequenceFile e Parquet. 7
  • 8. Apache Tajo ... •Características: Fácil Funções definidas pelo usuário; Shell interativo; Backup e; Asynchronous / Synchronous Java API. 8
  • 9. Apache Tajo ... •História.... Começou em 2010 no Laboratório de Banco de Dados da Universidade da Coreia;  Entrou no Apache Incubator em Março de 2013 e; Apache Tajo está em uso em Gruter, Universidade da Coreia, e SK Telecom. 9
  • 10. Apache Tajo ... •História.... Software Apache Tajo é distribuído sobre a licença Apache v2.0; O software encontra-se na Apache Tajo™. 0.8.0 10
  • 11. Apache Tajo ... •Quem utiliza ...... 11
  • 12. Apache Tajo ... •Aplicações oPodemos aplicar o Tajo para analisar grandes conjuntos de dados em tempo real. Controle de trafego aéreo; Telecomunicações; Sistemas Financeiros; Entre outros. 12
  • 13. Apache Tajo ... •Linguagem de Manipulação de Dado 13
  • 14. Apache Tajo ... •Instalação oRealizada em 2 PARTES 14
  • 15. Apache Tajo ... •Instalação Parte I – Downloads e Instalação dos Softwares 1.VM; 2.Maven 3.1; 3.Java 1.6 4.Make 5.Protocol buffer 2.5.0 6.Versão 2.4 do Radoop; 7.Tajo 0.8.0; 15
  • 16. Apache Tajo ... •Instalação Parte II – Configuração 1.TAJO_HOME; 2.JAVA_HOME e; 3. HADOOP_HOME. 16
  • 17. Apache Tajo ... •Apresentação •Criação do arquivo “data.csv” 17
  • 18. Apache Tajo ... •Apresentação •Acessando o Tajo SQL “tsql” 18
  • 19. Apache Tajo ... •Apresentação •Criando tabela e inserindo os dados do arquivo “data.csv” 19
  • 20. Apache Tajo ... •Apresentação •Apresentado os atributo da tabela “ d ” 20
  • 21. Apache Tajo ... •Apresentação •Realizando uma consulta SQL 21
  • 22. Apache Tajo ... •Demonstração em uma Base da Dados oDados Abertos do Brasil oUnidade Básica de Saúde oAtualizada em 04/2013 oA base possui 37691 linhas oDisponível em: ABD 22
  • 23.
  • 24. Referências •Apache Tajo. Disponível em:<http://tajo.apache.org/>. Acessado em 06 de Junho de 2014. •The Apache Software Foundation Announces Apache™ Tajo™ as a Top-Level Project. Disponível em: <http://citrix.ulitzer.com/no de/3036803>. Acessado em 06 de Junho de 2014. •Máquina Virtual Linux com o Apache Tajo instalado e configurado para uso. Disponível em:<https://www.dropbox.com/s/ 10i401f54vxrfrb/micheldefault140214158885393776.rar>.