SlideShare ist ein Scribd-Unternehmen logo
1 von 45
Downloaden Sie, um offline zu lesen
服务创新推动科研领域
大数据应用
肖永红
数据堂(北京)科技有限公司
1

大数据的起源及特点

2

大数据时代下新思维

3

科研领域大数据应用及挑战

4

科研数据共享服务实践

5

科研数据采集处理服务实践
海量视频、图片、文本、语音及社会关系数据涌现
Internet of Things
物联网

工作娱乐

智能家居

智能医疗

智能交通

机动车辆

智能办公

万“物”皆数据

铁路运输

物流配送

农业种植

工业生产
传统行业的厚积薄发
云计算与大数据:相见恨晚
每个人都是大数据的“生产者”
80%的数据属于非结构化数据

超过
大数据的本质是什么?
1

大数据的起源及特点

2

大数据时代下新思维

3

科研领域大数据应用及挑战

4

科研数据共享服务实践

5

科研数据采集处理服务实践
信息时代 -> 数据“小”时代
数据成为生产要素
数据的资产/价值属性
大数据不同于一般物质性资源,它的价值不会随着使用
次数增多而减少,数据可以被不断的整合和处理,不断
的被发现新的价值。
数据公开 -> 数据开放 -> 数据互联
数据服务-DaaS
与数据相关的仸何服务都能够发生在一个集中化的位

置,如聚合、数据质量管理、数据清洗等,然后再将数
据提供给不同的系统和用户,而无需再考虑这些数据来
自于哪些数据源。
1

大数据的起源及特点

2

大数据时代下新思维

3

科研领域大数据应用及挑战

4

科研数据共享服务实践

5

科研数据采集处理服务实践
科学研究第四范式
Thousand years ago
Experimental Science
Last few hundred years
Theoretical Science
Last few decades
Computational Science

Today
Data-Intensive Science
一个关于Siri的敀事...
典垄应用:语音识别的逆袭
语音助手
语音客服

语音车载
智能家电
......
典垄应用:图像/视频处理技术
典垄应用:语义搜索,机器翻译,智能客服
大数据改变机器学习
新样本

传统方法

特征表示

模垄

结果
Yes/No
训练样本(小数据)

新样本

大数据方法

结果
Yes/No
已知样本(大数据)
数据越多越好!
Peter Noevig

 用来训练人工智能模垄的数据越多,模垄的准确度会越高。
挑战:数据极大丰富or匮乏 ?
Web Data

Social Network Data

E-Commerce Data
“有些部门把一些数据当成自己

的,放那里既不使用,也不提供
给研究者。大数据需要共享,数

据开放,平台利用,这是我国大
数据研究的软肋和需要解决的大
问题。”

---李国杰
挑战:如何驯服非结构化数据

语音

图像

视频

文本
1

大数据的起源及特点

2

大数据时代下新思维

3

科研领域大数据应用及挑战

4

科研数据共享服务实践

5

科研数据采集处理服务实践
国外科研数据共享:政府及科研

日本产业技术综合研
究院的RIO-DB

英国政府公开数据

国际科技数据委员会
国外科研数据共享:企业界
国内科研数据共享:政府及科研
数据堂科研数据共享服务
数据堂科研数据共享服务
数据集个数

数据量

43586组 分布在信息服务、交通科

135Tb 用于业务服务、产品研发、

学、材料科学、生命医药等领域。

实验教学的大、中、小数据。

用户数
166万 分布在信息服务、材料科
学、生命医药、交通科学等多个领
域。

公益效应
数据被科研领域用户免费下载 602万次
到数据堂共享数据的机构 100家
(清华,北大,搜狗,中科院,浙大…)
科研机构数据丏区
让聪明的人去“用”数据

35
科研数据云服务

客
户

科研人员

科研团队

科研机构

Research Dataset

微软AZURE
1

大数据的起源及特点

2

大数据时代下新思维

3

科研领域大数据应用及挑战

4

科研数据共享服务实践

5

科研数据采集处理服务实践
产
品
研
发
应
用

数
据
处
理
过
程

 多媒体处理

 生物信息处理

– 人脸识别、指纹识别
– 视频跟踪
– 声音识别
 自然语言处理
– 机器翻译
– 信息检索(google)
– 中文输入法

–基因挖掘
–大分子功能预测
–基因调控关系
 网络安全
–垃圾邮件过滤
–敏感图片识别
–病毒检测

输入

数
据
采
集

预
处
理
非结构
化数据

特
征
提
取

分
类
器

分类结果
采集:基于互联网络的定向采集、特定设备及特定情境下的定制采集;采集内
容包括人脸图片、文字图片、车辆图片、行人视频、车辆视频等多种类垄;
标注:全方位的图像标注,包括人脸识别标注、人体动作标注、车牌识别标注
等;标注的图片数量可达到数十万到百万级别。
应用:人脸识别、车牌识别、视频安全检测、智能交互
科研相关:图像处理、视频处理、模式识别
采集:不同语言的语音库建设;不同发音人的语音库建设:不同场景下的语音
库录制:不同内容的语音库建设:
标注:语音文本内容标注、发音人性别标注、发音人口音标注、语音信号标注
应用:语音导航、语音助手、语音搜索、语音合成
科研相关:语音处理、信息检索
采集:客户指定网站的定向采集和分析
客户指定主题的非定向采集和分析
为高中端企业提供丏业的数据采集服务(采集延迟小于2分钟)
应用:垂直搜索引擎、数据挖掘、
科研相关:信息检索、机器翻译、电子商务
大众力量,采集分散的高价值数据
大数据应用基础:数据可用、可信
数据共享:让梦想照进现实
• 云计算技术提供基础
• 商业应用驱动数据共享
• 科研新范式推动数据共享
• 用户共享理念日益开放

数据服务:以互联网的思维
• 科研数据/社会数据/商业数据界限模糊化
• 给用户“简单”的数据服务
• 用户是大数据的生产者
• 开放互联的数据服务
肖永红:科研数据应用和共享方面的实践

Weitere ähnliche Inhalte

Was ist angesagt?

Big Data For CIO_大數據白皮書_2015
Big Data For CIO_大數據白皮書_2015Big Data For CIO_大數據白皮書_2015
Big Data For CIO_大數據白皮書_2015Fang-hsun Yeh
 
Baidu's Big Data Engine
Baidu's Big Data EngineBaidu's Big Data Engine
Baidu's Big Data EngineWeijun Qin
 
鄧白氏大數據2015_SalesMarketing
鄧白氏大數據2015_SalesMarketing鄧白氏大數據2015_SalesMarketing
鄧白氏大數據2015_SalesMarketingFang-hsun Yeh
 
大數據時代的必備工具-Google Analytics
大數據時代的必備工具-Google Analytics大數據時代的必備工具-Google Analytics
大數據時代的必備工具-Google Analytics新頁 陳
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Etu Solution
 
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Denodo
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台hdhappy001
 
医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略Denodo
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱Denodo
 
数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅Denodo
 
Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Denodo
 
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)雲端網路架構師養成班 (資策會 / 中壢 / 網工班)
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)Hubert Yang
 
Accelerate Migration to the Cloud using Data Virtualization (Chinese)
Accelerate Migration to the Cloud using Data Virtualization (Chinese)Accelerate Migration to the Cloud using Data Virtualization (Chinese)
Accelerate Migration to the Cloud using Data Virtualization (Chinese)Denodo
 
Way to big date 資策會李進寶所長 20120620
Way to big date 資策會李進寶所長 20120620Way to big date 資策會李進寶所長 20120620
Way to big date 資策會李進寶所長 20120620Lawrence Huang
 
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionLeverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionDenodo
 
大数据下的大表Join计算和优化
大数据下的大表Join计算和优化大数据下的大表Join计算和优化
大数据下的大表Join计算和优化huhai463127310
 
数据服务和现代数据生态系统
数据服务和现代数据生态系统数据服务和现代数据生态系统
数据服务和现代数据生态系统Denodo
 
物聯網應用全貌以及微軟全球案例
物聯網應用全貌以及微軟全球案例物聯網應用全貌以及微軟全球案例
物聯網應用全貌以及微軟全球案例Herman Wu
 

Was ist angesagt? (20)

Big Data For CIO_大數據白皮書_2015
Big Data For CIO_大數據白皮書_2015Big Data For CIO_大數據白皮書_2015
Big Data For CIO_大數據白皮書_2015
 
Baidu's Big Data Engine
Baidu's Big Data EngineBaidu's Big Data Engine
Baidu's Big Data Engine
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
鄧白氏大數據2015_SalesMarketing
鄧白氏大數據2015_SalesMarketing鄧白氏大數據2015_SalesMarketing
鄧白氏大數據2015_SalesMarketing
 
大數據時代的必備工具-Google Analytics
大數據時代的必備工具-Google Analytics大數據時代的必備工具-Google Analytics
大數據時代的必備工具-Google Analytics
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台
 
医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
 
数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅
 
Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)
 
大數據的基本概念(上)
大數據的基本概念(上)大數據的基本概念(上)
大數據的基本概念(上)
 
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)雲端網路架構師養成班 (資策會 / 中壢 / 網工班)
雲端網路架構師養成班 (資策會 / 中壢 / 網工班)
 
Accelerate Migration to the Cloud using Data Virtualization (Chinese)
Accelerate Migration to the Cloud using Data Virtualization (Chinese)Accelerate Migration to the Cloud using Data Virtualization (Chinese)
Accelerate Migration to the Cloud using Data Virtualization (Chinese)
 
Way to big date 資策會李進寶所長 20120620
Way to big date 資策會李進寶所長 20120620Way to big date 資策會李進寶所長 20120620
Way to big date 資策會李進寶所長 20120620
 
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionLeverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
 
大数据下的大表Join计算和优化
大数据下的大表Join计算和优化大数据下的大表Join计算和优化
大数据下的大表Join计算和优化
 
数据服务和现代数据生态系统
数据服务和现代数据生态系统数据服务和现代数据生态系统
数据服务和现代数据生态系统
 
物聯網應用全貌以及微軟全球案例
物聯網應用全貌以及微軟全球案例物聯網應用全貌以及微軟全球案例
物聯網應用全貌以及微軟全球案例
 

Andere mochten auch

杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务hdhappy001
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战hdhappy001
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkabanhdhappy001
 
詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systemshdhappy001
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎hdhappy001
 
Cassandra Performance Benchmark
Cassandra Performance BenchmarkCassandra Performance Benchmark
Cassandra Performance BenchmarkBigstep
 

Andere mochten auch (7)

杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban
 
詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
 
Cassandra Performance Benchmark
Cassandra Performance BenchmarkCassandra Performance Benchmark
Cassandra Performance Benchmark
 

Ähnlich wie 肖永红:科研数据应用和共享方面的实践

Y20151003 詹文男-物聯網的商機與挑戰
Y20151003 詹文男-物聯網的商機與挑戰Y20151003 詹文男-物聯網的商機與挑戰
Y20151003 詹文男-物聯網的商機與挑戰m12016changTIIMP
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题hdhappy001
 
行政院3644次院會 報一 科技部 簡報
行政院3644次院會 報一 科技部 簡報行政院3644次院會 報一 科技部 簡報
行政院3644次院會 報一 科技部 簡報releaseey
 
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告R.O.C.Executive Yuan
 
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)張大明 Ta-Ming Chang
 
智慧系統服務研究 永鑫 V2
智慧系統服務研究 永鑫 V2智慧系統服務研究 永鑫 V2
智慧系統服務研究 永鑫 V2Lawrence Huang
 
机器学习推动金融数据智能
机器学习推动金融数据智能机器学习推动金融数据智能
机器学习推动金融数据智能Roger Xia
 
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合Gene Hong
 
迎戰未來製造用AIoT打造企業第二條成長曲線
迎戰未來製造用AIoT打造企業第二條成長曲線迎戰未來製造用AIoT打造企業第二條成長曲線
迎戰未來製造用AIoT打造企業第二條成長曲線Amazon Web Services
 
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢 [台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢 台灣資料科學年會
 
云趋势和实践 - 上海有孚网络股份有限公司
云趋势和实践 - 上海有孚网络股份有限公司云趋势和实践 - 上海有孚网络股份有限公司
云趋势和实践 - 上海有孚网络股份有限公司Hardway Hou
 
50期italk
50期italk50期italk
50期italkkongfat
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdfmarkmind
 
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622b0stey
 
数据科学家
数据科学家数据科学家
数据科学家Felix Liu
 
環保署 懶人包
環保署 懶人包環保署 懶人包
環保署 懶人包releaseey
 
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告R.O.C.Executive Yuan
 
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)releaseey
 
Med opening-tp3
Med opening-tp3Med opening-tp3
Med opening-tp3AI.academy
 

Ähnlich wie 肖永红:科研数据应用和共享方面的实践 (20)

Y20151003 詹文男-物聯網的商機與挑戰
Y20151003 詹文男-物聯網的商機與挑戰Y20151003 詹文男-物聯網的商機與挑戰
Y20151003 詹文男-物聯網的商機與挑戰
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题
 
行政院3644次院會 報一 科技部 簡報
行政院3644次院會 報一 科技部 簡報行政院3644次院會 報一 科技部 簡報
行政院3644次院會 報一 科技部 簡報
 
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告
20190321(簡報)科技部:「積層製造(3D列印)科技推動現況與未來展望」報告
 
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)
無限想像的科技創新未來—大數據專案管理與資料分析實務應用 20170927(龍華科技大學)
 
智慧系統服務研究 永鑫 V2
智慧系統服務研究 永鑫 V2智慧系統服務研究 永鑫 V2
智慧系統服務研究 永鑫 V2
 
机器学习推动金融数据智能
机器学习推动金融数据智能机器学习推动金融数据智能
机器学习推动金融数据智能
 
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
 
迎戰未來製造用AIoT打造企業第二條成長曲線
迎戰未來製造用AIoT打造企業第二條成長曲線迎戰未來製造用AIoT打造企業第二條成長曲線
迎戰未來製造用AIoT打造企業第二條成長曲線
 
2012-01-12資訊人員價值提升
2012-01-12資訊人員價值提升2012-01-12資訊人員價值提升
2012-01-12資訊人員價值提升
 
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢 [台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢
[台灣人工智慧學校] 主題演講: 人工智慧產業發展趨勢
 
云趋势和实践 - 上海有孚网络股份有限公司
云趋势和实践 - 上海有孚网络股份有限公司云趋势和实践 - 上海有孚网络股份有限公司
云趋势和实践 - 上海有孚网络股份有限公司
 
50期italk
50期italk50期italk
50期italk
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf
 
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622
106智慧srb會議 公眾討論簡報-2智慧系統與晶片技術-0622
 
数据科学家
数据科学家数据科学家
数据科学家
 
環保署 懶人包
環保署 懶人包環保署 懶人包
環保署 懶人包
 
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
 
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
 
Med opening-tp3
Med opening-tp3Med opening-tp3
Med opening-tp3
 

Mehr von hdhappy001

肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进hdhappy001
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架hdhappy001
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术hdhappy001
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探hdhappy001
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scalehdhappy001
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群hdhappy001
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术hdhappy001
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sqlhdhappy001
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略hdhappy001
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展hdhappy001
 
堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensionshdhappy001
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测hdhappy001
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统hdhappy001
 
Ted yu:h base and hoya
Ted yu:h base and hoyaTed yu:h base and hoya
Ted yu:h base and hoyahdhappy001
 
Raghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarksRaghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarkshdhappy001
 
Nicholas:hdfs what is new in hadoop 2
Nicholas:hdfs what is new in hadoop 2Nicholas:hdfs what is new in hadoop 2
Nicholas:hdfs what is new in hadoop 2hdhappy001
 
Michael stack -the state of apache h base
Michael stack -the state of apache h baseMichael stack -the state of apache h base
Michael stack -the state of apache h basehdhappy001
 
Gunther hagleitner:apache hive & stinger
Gunther hagleitner:apache hive & stingerGunther hagleitner:apache hive & stinger
Gunther hagleitner:apache hive & stingerhdhappy001
 
Bikas saha:the next generation of hadoop– hadoop 2 and yarn
Bikas saha:the next generation of hadoop– hadoop 2 and yarnBikas saha:the next generation of hadoop– hadoop 2 and yarn
Bikas saha:the next generation of hadoop– hadoop 2 and yarnhdhappy001
 

Mehr von hdhappy001 (19)

肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展
 
堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统
 
Ted yu:h base and hoya
Ted yu:h base and hoyaTed yu:h base and hoya
Ted yu:h base and hoya
 
Raghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarksRaghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarks
 
Nicholas:hdfs what is new in hadoop 2
Nicholas:hdfs what is new in hadoop 2Nicholas:hdfs what is new in hadoop 2
Nicholas:hdfs what is new in hadoop 2
 
Michael stack -the state of apache h base
Michael stack -the state of apache h baseMichael stack -the state of apache h base
Michael stack -the state of apache h base
 
Gunther hagleitner:apache hive & stinger
Gunther hagleitner:apache hive & stingerGunther hagleitner:apache hive & stinger
Gunther hagleitner:apache hive & stinger
 
Bikas saha:the next generation of hadoop– hadoop 2 and yarn
Bikas saha:the next generation of hadoop– hadoop 2 and yarnBikas saha:the next generation of hadoop– hadoop 2 and yarn
Bikas saha:the next generation of hadoop– hadoop 2 and yarn
 

肖永红:科研数据应用和共享方面的实践