SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
基于Cloudera Impala的
联邦SQL执行引擎
SequoiaSQL
王涛
SequoiaDB(巨杉数据库)CTO
taoewang@sequoiadb.com
提纲
1

Cloudera Impala 简介

2

SequoiaDB 简介

3

SequoiaSQL 增强特性

4

使用场景

5

性能指标
Real Time SQL Query Engine

CLOUDERA IMPALA 简介
SQL-On-Hadoop

IBM BigSQL

SQL-H

Stinger

Presto
Cloudera Impala 特性
通用性

高性能

•针对交易与分析系统
•支持从毫秒到小时级查询

价值:
提升应用开发效率
减少学习成本
提升运行性能

•C++执行内核
•运行时代码生成(LLVM)
•原生的SQL执行引擎
通用性

高性能

兼容性

兼容性

•支持HDFS与HBase数据源
•支持Hive的metastore
•支持HQL
•接口与Hive保持兼容(JDBC)

volume
Impala 架构
Document NoSQL Database

SEQUOIADB简介
SequoiaDB
文档类NoSQL数据库
•
•
•
•
•
•

JSON数据类型
并行执行引擎
线性水平扩张
MPP – 无单点故障
在压缩数据上执行SQL
保持数据接近CPU/核

应用程序层

调度层
SequoiaDB 架构图
应用层
协调节点

编目分片

...

调度层

网络层
数据存
储层

数据分片

数据分片

数据分片

...
JSON格式与查询
需要更多的时间被行业用户接受
{
name: “Tim”,
age: 30,
phone: [
12345,
67890
]

}

CREATE TABLE EMP
( NAME CHAR(10),
AGE INTEGER,
PHONE1 INTEGER,
PHONE2 INTEGER
);
INSERT INTO EMP
VALUES ( “Tim”, 30,
12345, 67890 ) ;
Federation Engine

SEQUOIASQL 增强特性
SequoiaSQL联邦执行引擎
• SequoiaSQL 是基于开源项目开
发的SQL执行引擎
– Cloudera Impala

•
•
•
•

不仅仅是“SQL-on-Hadoop”
支持JDBC
兼容Hive驱动
增强功能
– 加入SequoiaDB与关系型数据库
的读写接口
– 将metastore嵌入SequoiaDB
– 增加Update/Delete/Merge语句
– 谓词条件下压

Application
SQL
JDBC

SequoiaSQL Engine
Federated Database
Metastore嵌入SequoiaDB
SequoiaDB

元存储在Derby或者其他关
元存储在SequoiaDB,无需
系型数据库
依赖其他数据库
需要依赖Hive的配置文件

数据默认存储在SequoiaDB,
扩展表可映射 HDFS 和
数据默认存储在HDFS
HBASE
SequoiaDB

SequoiaDB

SequoiaDB
Update/Delete/Merge
SequoiaSQL

查询
添加
更改
删除
MERGE

半结构化

查询
覆盖添加

非结构化

查询

结构化
查询谓词下压,利用数据库索引提升性能
查询

SELECT * FROM T, K WHERE
T.Price > 1000 AND T.id = K.id

关联

数据存储层
HDFS
Database

T.Price > 1000
HDFS
批量扫描

索引扫描

优势:
1.减少网络数据传输
2.利用数据库索引提升性能
SequoiaSQL 应用架构

JDBC/API接口
Pig

Hive

SequoiaSQL
MapReduce
分布式计算框架

HDFS
分布式存储引擎

SequoiaDB

关系型
数据库
SequoiaSQL 系统架构
其他
数据源

应用层

SequoiaSQL

调度层

Oracle
编目分片

协调节点

HDFS

...

HBase
DB2
MySQL

网络层
数据存
储层

MongoDB
etc…
数据分片

数据分片

数据分片

...
NoSQL in Industry

USE CASES
交易流水归档历史查询
面临的挑战
•

•

•

每天需要入库归档超
过100GB数据
用户需要能够并发、
实时、由多个维度访
问超过2年的历史数
据
当前Oracle数据库无
法满足实时查询的需
求

解决方式
•

•

•

•

使用MapReduce与
Hive作为ETL处理的
补充进行数据清洗和
转换
使用Hive将最终结果
并行加载入
SequoiaDB
使用SequoiaDB,在
常用查询字段上建立
多个索引保证查询性
能
使用SequoiaSQL进行
实时数据查询

最终结果
•

•
•

•
•

可以在线针对2年内
的历史数据进行多条
件检索
高数据压缩比节省数
据存储空间
利于细分客户群,发
现高价值用户,降低
客户流失率
帮助自营产品、套餐
等设计与创新
提升客户体验,进行
策略管控
交易流水归档历史查询
Legacy
Systems
IBM
UDB
ESE

TCPIP

Oracle
10G
SAS

TCPIP

End Users

TCPIP

TCPIP
Management

ODS & IDS
SPSS

Cube
Analysts
Other
Sources
New
Systems

TCPIP

TCPIP

…

Web App

SequoiaSQL

TCPIP

Text Data
Manual
Input

Hive

Data Mart
Users

TCPIP
HDFS

SequoiaDB

R

Web App
Users
交易流水归档历史查询
Hadoop
Platform

业务系
统

HDFS
数据录入

SequoiaDB
Hive

数据录入

SequoiaSQL

Web
服务

一级分行用户

当日归档数据
二级行管理员

客户分群
数据分析

Web
服务
营业厅叫号机

文本数据

报表展现
精准
推送

手工输入数据

移动设备
Performance Benchmark

性能指标
SQL1:
SQL5:
SELECT
select
cttb.appg_mode
ac_nm,appg_date,cst_id,dep_acno,tran_ty
,cttb.appg_date
pe,tran_amount from
,cttb.tran_code
sdbmassdata.local_sdb_ch_bank limit 10;
SQL2:
select count(cst_id) from
sdbmassdata.local_sdb_ch_bank;

SQL3:
select * from
sdbmassdata.local_sdb_ch_bank order by
tran_amount limit 10 ;
SQL4:
select max(tran_amount) from
sdbmassdata.local_sdb_ch_bank group by
ac_nm,appg_date,cst_id,dep_acno,tran_a
mount,tran_type limit 10;

表名

记录数

local_sdb_ch_bank

20,000,000

local_bancs_cusm_f

70,602

…<300+字段>
local_ctis_txn_tif_b
22,869,263
,dhit.cst_tp_code as_f
,dhit.ssn_avg_bal local_dep_hist_inf_t 313,721
mp
,dhit.dpstm_term
FROM
sdbmassdata.local_ctis_txn_tif_bas_f cttb
LEFT OUTER JOIN
sdbmassdata.local_dep_hist_inf_tmp dhit
ON (
cttb.ACT_NO = dhit.DEP_ACNO
AND dhit.STAT_DT = '2012-02-01'
)
LEFT OUTER JOIN
sdbmassdata.local_BANCS_CUSM_F bcf
ON (dhit.CST_ID =
bcf.CI03_CUST_ACCT_NO) limit 1;
SequoiaSQL Hive性能对比
700
SQL
SQL
SQL
SQL
SQL

600
500

1
2
3
4
5

SequoiaSQL Hive
0.49
96.903
22.28
147.087
316.26
600.164
38.18
231.108
20.69
578.676

400
SequoiaSQL
300

Hive

200

环境:
3台物理机
每台7个数据分区组

100
0
SQL 1

SQL 2

SQL 3

SQL 4

SQL 5
Roadmap

产品路标规划
产品路标规划

•
•
•
•

其他Join方式实现
聚合下压
排序下压
….

2013.12.31

•
•
•
•

支持嵌套类型
支持数组类型
添加其他数据源
…

•
•

基于成本的性能优化
….

2014.12.31
王涛
taoewang@sequoiadb.com

Weitere ähnliche Inhalte

Was ist angesagt?

賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報Wales Chen
 
2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀Wales Chen
 
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管ChiaHsien Lee
 
Serverless api gateway + lambda
Serverless api gateway + lambdaServerless api gateway + lambda
Serverless api gateway + lambdaLeon Li
 
AWS_Educate_Team_SCU_Volunteer_Training_0909
AWS_Educate_Team_SCU_Volunteer_Training_0909AWS_Educate_Team_SCU_Volunteer_Training_0909
AWS_Educate_Team_SCU_Volunteer_Training_0909土撥 JIE
 
使用Amazon Machine Learning 創建智能應用程式
使用Amazon Machine Learning 創建智能應用程式使用Amazon Machine Learning 創建智能應用程式
使用Amazon Machine Learning 創建智能應用程式Amazon Web Services
 
Team Foundation Server
Team Foundation ServerTeam Foundation Server
Team Foundation Server國昭 張
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具Amazon Web Services
 
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)锐 张
 
00.exalogic概览
00.exalogic概览00.exalogic概览
00.exalogic概览Meng He
 
W3CTech美团react专场-Thinking in React
W3CTech美团react专场-Thinking in ReactW3CTech美团react专场-Thinking in React
W3CTech美团react专场-Thinking in React美团点评技术团队
 
Query store查詢調校新利器
Query store查詢調校新利器Query store查詢調校新利器
Query store查詢調校新利器Rico Chen
 
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議給開發人員的資料庫效能建議
給開發人員的資料庫效能建議Rico Chen
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具Amazon Web Services
 
Confluent流处理平台之Kafka新技术分享
Confluent流处理平台之Kafka新技术分享Confluent流处理平台之Kafka新技术分享
Confluent流处理平台之Kafka新技术分享confluent
 
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...Alan Tsai
 
零到千万可扩展架构 AWS Architecture Overview
零到千万可扩展架构 AWS Architecture Overview零到千万可扩展架构 AWS Architecture Overview
零到千万可扩展架构 AWS Architecture OverviewLeon Li
 
查詢調校不求人
查詢調校不求人查詢調校不求人
查詢調校不求人Rico Chen
 
Teched 2012 60分钟构建私有云
Teched 2012 60分钟构建私有云Teched 2012 60分钟构建私有云
Teched 2012 60分钟构建私有云Cheng Zhang
 

Was ist angesagt? (20)

賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報
 
2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀
 
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
 
Serverless api gateway + lambda
Serverless api gateway + lambdaServerless api gateway + lambda
Serverless api gateway + lambda
 
AWS_Educate_Team_SCU_Volunteer_Training_0909
AWS_Educate_Team_SCU_Volunteer_Training_0909AWS_Educate_Team_SCU_Volunteer_Training_0909
AWS_Educate_Team_SCU_Volunteer_Training_0909
 
使用Amazon Machine Learning 創建智能應用程式
使用Amazon Machine Learning 創建智能應用程式使用Amazon Machine Learning 創建智能應用程式
使用Amazon Machine Learning 創建智能應用程式
 
Team Foundation Server
Team Foundation ServerTeam Foundation Server
Team Foundation Server
 
Customer Sharing: Hiiir
Customer Sharing: HiiirCustomer Sharing: Hiiir
Customer Sharing: Hiiir
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
 
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
 
00.exalogic概览
00.exalogic概览00.exalogic概览
00.exalogic概览
 
W3CTech美团react专场-Thinking in React
W3CTech美团react专场-Thinking in ReactW3CTech美团react专场-Thinking in React
W3CTech美团react专场-Thinking in React
 
Query store查詢調校新利器
Query store查詢調校新利器Query store查詢調校新利器
Query store查詢調校新利器
 
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議給開發人員的資料庫效能建議
給開發人員的資料庫效能建議
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
 
Confluent流处理平台之Kafka新技术分享
Confluent流处理平台之Kafka新技术分享Confluent流处理平台之Kafka新技术分享
Confluent流处理平台之Kafka新技术分享
 
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...
2018 beijing azure bootcamp-azure migration - 2018 北京 azure bootcamp azure 搬遷...
 
零到千万可扩展架构 AWS Architecture Overview
零到千万可扩展架构 AWS Architecture Overview零到千万可扩展架构 AWS Architecture Overview
零到千万可扩展架构 AWS Architecture Overview
 
查詢調校不求人
查詢調校不求人查詢調校不求人
查詢調校不求人
 
Teched 2012 60分钟构建私有云
Teched 2012 60分钟构建私有云Teched 2012 60分钟构建私有云
Teched 2012 60分钟构建私有云
 

Ähnlich wie 王涛:基于Cloudera impala的非关系型数据库sql执行引擎

Application express overview_cn_final -v2
Application express overview_cn_final -v2Application express overview_cn_final -v2
Application express overview_cn_final -v2TravelSky
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Etu Solution
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介Herman Wu
 
hicloud PaaS 雲創平台 for java developer
hicloud PaaS 雲創平台 for java developerhicloud PaaS 雲創平台 for java developer
hicloud PaaS 雲創平台 for java developerhicloud-paas
 
Oracle Compute Cloud Service介绍
Oracle Compute Cloud Service介绍Oracle Compute Cloud Service介绍
Oracle Compute Cloud Service介绍Zhaoyang Wang
 
数据科学分析协作平台CDSW
数据科学分析协作平台CDSW数据科学分析协作平台CDSW
数据科学分析协作平台CDSWJianwei Li
 
03.osb概览
03.osb概览03.osb概览
03.osb概览Meng He
 
MySQL 高可用方案及成功案例
MySQL 高可用方案及成功案例MySQL 高可用方案及成功案例
MySQL 高可用方案及成功案例郁萍 王
 
網站上線了,然後呢?
網站上線了,然後呢?網站上線了,然後呢?
網站上線了,然後呢?Kirk Chen
 
Raising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi LuRaising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi Lu郁萍 王
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践jins0618
 
Oracle saa s paas overview
Oracle saa s paas overviewOracle saa s paas overview
Oracle saa s paas overviewChris Lee
 
Oracle雲端服務介紹 taiwan
Oracle雲端服務介紹   taiwanOracle雲端服務介紹   taiwan
Oracle雲端服務介紹 taiwanChieh-An Yu
 
Kubernetes project update and how to contribute
Kubernetes project update and how to contributeKubernetes project update and how to contribute
Kubernetes project update and how to contributeinwin stack
 
Kafka cluster best practices
Kafka cluster best practicesKafka cluster best practices
Kafka cluster best practicesRico Chen
 
ASP.Net MVC Framework
ASP.Net MVC FrameworkASP.Net MVC Framework
ASP.Net MVC Framework國昭 張
 
02.wls概览
02.wls概览02.wls概览
02.wls概览Meng He
 
MySQL 網路參考架構
MySQL 網路參考架構MySQL 網路參考架構
MySQL 網路參考架構郁萍 王
 
百度数据库中间层
百度数据库中间层百度数据库中间层
百度数据库中间层yp_fangdong
 
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014Hubert Fan Chiang
 

Ähnlich wie 王涛:基于Cloudera impala的非关系型数据库sql执行引擎 (20)

Application express overview_cn_final -v2
Application express overview_cn_final -v2Application express overview_cn_final -v2
Application express overview_cn_final -v2
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介
 
hicloud PaaS 雲創平台 for java developer
hicloud PaaS 雲創平台 for java developerhicloud PaaS 雲創平台 for java developer
hicloud PaaS 雲創平台 for java developer
 
Oracle Compute Cloud Service介绍
Oracle Compute Cloud Service介绍Oracle Compute Cloud Service介绍
Oracle Compute Cloud Service介绍
 
数据科学分析协作平台CDSW
数据科学分析协作平台CDSW数据科学分析协作平台CDSW
数据科学分析协作平台CDSW
 
03.osb概览
03.osb概览03.osb概览
03.osb概览
 
MySQL 高可用方案及成功案例
MySQL 高可用方案及成功案例MySQL 高可用方案及成功案例
MySQL 高可用方案及成功案例
 
網站上線了,然後呢?
網站上線了,然後呢?網站上線了,然後呢?
網站上線了,然後呢?
 
Raising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi LuRaising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi Lu
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践
 
Oracle saa s paas overview
Oracle saa s paas overviewOracle saa s paas overview
Oracle saa s paas overview
 
Oracle雲端服務介紹 taiwan
Oracle雲端服務介紹   taiwanOracle雲端服務介紹   taiwan
Oracle雲端服務介紹 taiwan
 
Kubernetes project update and how to contribute
Kubernetes project update and how to contributeKubernetes project update and how to contribute
Kubernetes project update and how to contribute
 
Kafka cluster best practices
Kafka cluster best practicesKafka cluster best practices
Kafka cluster best practices
 
ASP.Net MVC Framework
ASP.Net MVC FrameworkASP.Net MVC Framework
ASP.Net MVC Framework
 
02.wls概览
02.wls概览02.wls概览
02.wls概览
 
MySQL 網路參考架構
MySQL 網路參考架構MySQL 網路參考架構
MySQL 網路參考架構
 
百度数据库中间层
百度数据库中间层百度数据库中间层
百度数据库中间层
 
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014
 

Mehr von hdhappy001

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systemshdhappy001
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战hdhappy001
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkabanhdhappy001
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务hdhappy001
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐hdhappy001
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践hdhappy001
 
肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践hdhappy001
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进hdhappy001
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架hdhappy001
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题hdhappy001
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术hdhappy001
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探hdhappy001
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scalehdhappy001
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群hdhappy001
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术hdhappy001
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sqlhdhappy001
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台hdhappy001
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略hdhappy001
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展hdhappy001
 

Mehr von hdhappy001 (20)

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践
 
肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展
 

王涛:基于Cloudera impala的非关系型数据库sql执行引擎