Suche senden
Hochladen
Hadoop introduction
•
Als PPT, PDF herunterladen
•
0 gefällt mir
•
570 views
Tianwei Liu
Folgen
Melden
Teilen
Melden
Teilen
1 von 14
Jetzt herunterladen
Empfohlen
Hadoop hive
Hadoop hive
Wei-Yu Chen
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
Something about Kafka - Why Kafka is so fast
Something about Kafka - Why Kafka is so fast
ViSenze - Artificial Intelligence for the Visual Web
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
Hbase运维碎碎念
Hbase运维碎碎念
haiyuan ning
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Min Zhou
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
li luo
Empfohlen
Hadoop hive
Hadoop hive
Wei-Yu Chen
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
Something about Kafka - Why Kafka is so fast
Something about Kafka - Why Kafka is so fast
ViSenze - Artificial Intelligence for the Visual Web
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
Hbase运维碎碎念
Hbase运维碎碎念
haiyuan ning
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Min Zhou
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
li luo
Google LevelDB Study Discuss
Google LevelDB Study Discuss
everestsun
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
Leveldb background
Leveldb background
宗志 陈
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Level db
Level db
宗志 陈
Hadoop大数据实践经验
Hadoop大数据实践经验
Hanborq Inc.
Big Data, NoSQL, and MongoDB
Big Data, NoSQL, and MongoDB
Monster Supreme
Cassandra
Cassandra
FEG
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
My own sweet home!
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environment
Anna Yen
Hbase架构简介、实践
Hbase架构简介、实践
Li Map
redis 适用场景与实现
redis 适用场景与实现
iammutex
Hbase
Hbase
baggioss
Spark introduction - In Chinese
Spark introduction - In Chinese
colorant
Hadoop-分布式数据平台
Hadoop-分布式数据平台
Jacky Chi
Why use MySQL
Why use MySQL
Zhaoyang Wang
Zabbix in PPTV
Zabbix in PPTV
ViSenze - Artificial Intelligence for the Visual Web
诗檀软件 Oracle开发优化基础
诗檀软件 Oracle开发优化基础
maclean liu
大型网站架构的发展
大型网站架构的发展
Hesey
Hadoop 2
Hadoop 2
EasyMedico.com
The Family of Hadoop
The Family of Hadoop
Nam Nham
Weitere ähnliche Inhalte
Was ist angesagt?
Google LevelDB Study Discuss
Google LevelDB Study Discuss
everestsun
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
Leveldb background
Leveldb background
宗志 陈
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Level db
Level db
宗志 陈
Hadoop大数据实践经验
Hadoop大数据实践经验
Hanborq Inc.
Big Data, NoSQL, and MongoDB
Big Data, NoSQL, and MongoDB
Monster Supreme
Cassandra
Cassandra
FEG
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
My own sweet home!
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environment
Anna Yen
Hbase架构简介、实践
Hbase架构简介、实践
Li Map
redis 适用场景与实现
redis 适用场景与实现
iammutex
Hbase
Hbase
baggioss
Spark introduction - In Chinese
Spark introduction - In Chinese
colorant
Hadoop-分布式数据平台
Hadoop-分布式数据平台
Jacky Chi
Why use MySQL
Why use MySQL
Zhaoyang Wang
Zabbix in PPTV
Zabbix in PPTV
ViSenze - Artificial Intelligence for the Visual Web
诗檀软件 Oracle开发优化基础
诗檀软件 Oracle开发优化基础
maclean liu
大型网站架构的发展
大型网站架构的发展
Hesey
Was ist angesagt?
(20)
Google LevelDB Study Discuss
Google LevelDB Study Discuss
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Leveldb background
Leveldb background
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Level db
Level db
Hadoop大数据实践经验
Hadoop大数据实践经验
Big Data, NoSQL, and MongoDB
Big Data, NoSQL, and MongoDB
Cassandra
Cassandra
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environment
Hbase架构简介、实践
Hbase架构简介、实践
redis 适用场景与实现
redis 适用场景与实现
Hbase
Hbase
Spark introduction - In Chinese
Spark introduction - In Chinese
Hadoop-分布式数据平台
Hadoop-分布式数据平台
Why use MySQL
Why use MySQL
Zabbix in PPTV
Zabbix in PPTV
诗檀软件 Oracle开发优化基础
诗檀软件 Oracle开发优化基础
大型网站架构的发展
大型网站架构的发展
Andere mochten auch
Hadoop 2
Hadoop 2
EasyMedico.com
The Family of Hadoop
The Family of Hadoop
Nam Nham
Semantic web meetup 14.november 2013
Semantic web meetup 14.november 2013
Jean-Pierre König
Migration from FAST ESP to Solr
Migration from FAST ESP to Solr
TNR Global
Introduction to the Hadoop Ecosystem (IT-Stammtisch Darmstadt Edition)
Introduction to the Hadoop Ecosystem (IT-Stammtisch Darmstadt Edition)
Uwe Printz
TriHUG: Lucene Solr Hadoop
TriHUG: Lucene Solr Hadoop
Grant Ingersoll
Andere mochten auch
(6)
Hadoop 2
Hadoop 2
The Family of Hadoop
The Family of Hadoop
Semantic web meetup 14.november 2013
Semantic web meetup 14.november 2013
Migration from FAST ESP to Solr
Migration from FAST ESP to Solr
Introduction to the Hadoop Ecosystem (IT-Stammtisch Darmstadt Edition)
Introduction to the Hadoop Ecosystem (IT-Stammtisch Darmstadt Edition)
TriHUG: Lucene Solr Hadoop
TriHUG: Lucene Solr Hadoop
Ähnlich wie Hadoop introduction
What could hadoop do for us
What could hadoop do for us
Simon Hsu
Hadoop大数据实践经验
Hadoop大数据实践经验
Schubert Zhang
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Wei-Yu Chen
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
How We Prepared Etu Hadoop Competition 2014
How We Prepared Etu Hadoop Competition 2014
Yuen-Kuei Hsueh
Log collection
Log collection
FEG
Hdfs
Hdfs
baggioss
Hdfs
Hdfs
baggioss
大规模数据处理
大规模数据处理
Kay Yan
大规模数据处理
大规模数据处理
airsex
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
li luo
Introduction to big data
Introduction to big data
YuHsuan Chen
Hadoop 介紹 20141024
Hadoop 介紹 20141024
Jay Chu, PMP/OCM
大數據
大數據
brian401777
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Jazz Yao-Tsung Wang
HDInsight for Microsoft Users
HDInsight for Microsoft Users
Kuo-Chun Su
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
hdhappy001
HDFS與MapReduce架構研討
HDFS與MapReduce架構研討
Billy Yang
Hadoop与数据分析
Hadoop与数据分析
George Ang
Mapreduce
Mapreduce
瑤瑤 吳
Ähnlich wie Hadoop introduction
(20)
What could hadoop do for us
What could hadoop do for us
Hadoop大数据实践经验
Hadoop大数据实践经验
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
How We Prepared Etu Hadoop Competition 2014
How We Prepared Etu Hadoop Competition 2014
Log collection
Log collection
Hdfs
Hdfs
Hdfs
Hdfs
大规模数据处理
大规模数据处理
大规模数据处理
大规模数据处理
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
Introduction to big data
Introduction to big data
Hadoop 介紹 20141024
Hadoop 介紹 20141024
大數據
大數據
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
HDInsight for Microsoft Users
HDInsight for Microsoft Users
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
HDFS與MapReduce架構研討
HDFS與MapReduce架構研討
Hadoop与数据分析
Hadoop与数据分析
Mapreduce
Mapreduce
Mehr von Tianwei Liu
2021 ee大会-旷视ai产品背后的研发效能工具建设
2021 ee大会-旷视ai产品背后的研发效能工具建设
Tianwei Liu
2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟
Tianwei Liu
豆瓣Paa s平台 dae - 2017
豆瓣Paa s平台 dae - 2017
Tianwei Liu
douban happyday docker for daeqaci
douban happyday docker for daeqaci
Tianwei Liu
DAE 新变化介绍
DAE 新变化介绍
Tianwei Liu
Docker在豆瓣的实践 刘天伟-20160709
Docker在豆瓣的实践 刘天伟-20160709
Tianwei Liu
Mr&ueh数据库方面
Mr&ueh数据库方面
Tianwei Liu
Mr
Mr
Tianwei Liu
Kmeans in-hadoop
Kmeans in-hadoop
Tianwei Liu
Hadoop introduction 2
Hadoop introduction 2
Tianwei Liu
Ueh
Ueh
Tianwei Liu
Mehr von Tianwei Liu
(11)
2021 ee大会-旷视ai产品背后的研发效能工具建设
2021 ee大会-旷视ai产品背后的研发效能工具建设
2020 gops-旷视城市大脑私有云平台实践-刘天伟
2020 gops-旷视城市大脑私有云平台实践-刘天伟
豆瓣Paa s平台 dae - 2017
豆瓣Paa s平台 dae - 2017
douban happyday docker for daeqaci
douban happyday docker for daeqaci
DAE 新变化介绍
DAE 新变化介绍
Docker在豆瓣的实践 刘天伟-20160709
Docker在豆瓣的实践 刘天伟-20160709
Mr&ueh数据库方面
Mr&ueh数据库方面
Mr
Mr
Kmeans in-hadoop
Kmeans in-hadoop
Hadoop introduction 2
Hadoop introduction 2
Ueh
Ueh
Hadoop introduction
1.
Hadoop Introduction
Background && Installation && Hello world && related
2.
Outline •
Background • Hello world • Installation • Related 12/20/12 2
3.
Background • Why Hadoop?
• Accessible: AWS • Robust : handle most such failures • Scalable: linearly • Simple: 1 == 1 w • Key Points: • Scale-out • Moving code to data 12/20/12 3
4.
Background: History • Apache
Top Project: Doug Cutting • Lucence -> Nutch -> Hadoop(2004) • Yahoo (1w) • Facebook (Hive, Hbase,…) • HULU (Hbase) • Baidu (3000TB, one week) • Twitter (sweat data) 12/20/12 4
5.
Background • Comparing SQL
database and Hadoop • Structure: • SQL(structure data, Specific Pattern) • Hadoop(Key-value, like Text, Picture) • Scale-out <- scale-up • Key-Value <- Relation Tables • Functional Programming <- Declarative Queries • Offline batch processing <- Online (Once Write , Read many times) 12/20/12 5
6.
Background – Understanding •
Word Count • File Size ++ , Memory Leak • Disk-Hash Table (More complex) • Distributed: • Phase 1: Part Processing • Phase 2: Merge Results • Shuffle the partitions the appropriate machines(AlphaBeta) • Now, We have already finish a minimal Hadoop. 12/20/12 6
7.
Hello World: Word
Count • Two Phase: • Mapping: 获取输入数据,并将其装载到 mapper 中 • Reducing: 处理来自 mapper 的所有输出,产生最终结果。 • 1.1 list(filename, file content) • 1.2 list(word, 1) • 2.1 list(word, list(word)) • 2.2 list(word, count) 12/20/12 7
8.
Hello World • mapper.py •
Reducer.py 12/20/12 8
9.
Installation • Mode:
• 单机模式( default) • 伪分布模式 推荐开发和调试模式 • 全分布模式 • Configuration: • 基本配置 • Ssh 配置 • Ubuntu 配置 12/20/12 9
10.
Hadoop Framework • HDFS:
• NameNode : 跟踪,指导,记录 • DataNode :底层 IO 操作 • Secondary NameNode • Map Reduce : • Job Tracker • Task Tracker 12/20/12 10
11.
Related • Programming:
• Java • Python • Jython ( Translate Python ) • Hadoop Streaming ( stdin , stdout ) • Dumbo • Happy 12/20/12 11
12.
Related •
Pig: 高级数据流语言 • Hive: SQL 数据仓库 • Hbase : Google BigTable , 面向列的数据库 • ZookKeeper: 共享状态的协同系统 • Chukwa : 数据收集系统 • Mahout :数据挖掘与机器学习 • Hama: 矩阵计算 12/20/12 12
13.
Resource • Book:
• Hadoop In action • Hadoop 实战 (第二版) • Video && Google Course • URL: • 资源收藏 12/20/12 13
14.
thanks 12/20/12
14
Hinweis der Redaktion
素材天下 sucaitianxia.com
Jetzt herunterladen