Suche senden
Hochladen
Hadoop MapReduce Task Scheduler Introduction
•
0 gefällt mir
•
1,278 views
Hanborq Inc.
Folgen
Introduction of Hadoop MapReduce Task Scheduler, for training.
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 11
Empfohlen
Sql基础培训
Sql基础培训
Ji ZHANG
Hbase
Hbase
baggioss
Hadoop系统及其关键技术
Hadoop系统及其关键技术
冬 陈
7, OCP - configure database for backup and recovery
7, OCP - configure database for backup and recovery
ted-xu
Hadoop 設定與配置
Hadoop 設定與配置
鳥 藍
Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威
Awei Hsu
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
Hadoop安裝 (1)
Hadoop安裝 (1)
銘鴻 陳
Empfohlen
Sql基础培训
Sql基础培训
Ji ZHANG
Hbase
Hbase
baggioss
Hadoop系统及其关键技术
Hadoop系统及其关键技术
冬 陈
7, OCP - configure database for backup and recovery
7, OCP - configure database for backup and recovery
ted-xu
Hadoop 設定與配置
Hadoop 設定與配置
鳥 藍
Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威
Awei Hsu
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
Hadoop安裝 (1)
Hadoop安裝 (1)
銘鴻 陳
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
mysqlops
Hbase运维碎碎念
Hbase运维碎碎念
haiyuan ning
Hadoop hive
Hadoop hive
Wei-Yu Chen
Spark streaming经验介绍
Spark streaming经验介绍
Wenchun Xu
TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例
maclean liu
Spark性能调优分享
Spark性能调优分享
Wenchun Xu
深入了解Oracle自动内存管理asmm
深入了解Oracle自动内存管理asmm
maclean liu
Hadoop-分布式数据平台
Hadoop-分布式数据平台
Jacky Chi
HDInsight for Microsoft Users
HDInsight for Microsoft Users
Kuo-Chun Su
使用Ubuntu架設hadoop
使用Ubuntu架設hadoop
taishanla
PostgreSQL 9 Standby
PostgreSQL 9 Standby
March Liu
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
PostgreSQL Search
PostgreSQL Search
guestb75c3a
海量日志分析系统实践,Dba
海量日志分析系统实践,Dba
Cevin Cheung
HDInsight for Hadoopers
HDInsight for Hadoopers
Kuo-Chun Su
Spark 巨量資料處理基礎教學
Spark 巨量資料處理基礎教學
NUTC, imac
分区表基础知识培训
分区表基础知识培训
maclean liu
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
Oracle Instance 介紹
Oracle Instance 介紹
Chien Chung Shen
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
Hadoop architecture by ajay
Hadoop architecture by ajay
Hadoop online training
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Cloudera, Inc.
Weitere ähnliche Inhalte
Was ist angesagt?
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
mysqlops
Hbase运维碎碎念
Hbase运维碎碎念
haiyuan ning
Hadoop hive
Hadoop hive
Wei-Yu Chen
Spark streaming经验介绍
Spark streaming经验介绍
Wenchun Xu
TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例
maclean liu
Spark性能调优分享
Spark性能调优分享
Wenchun Xu
深入了解Oracle自动内存管理asmm
深入了解Oracle自动内存管理asmm
maclean liu
Hadoop-分布式数据平台
Hadoop-分布式数据平台
Jacky Chi
HDInsight for Microsoft Users
HDInsight for Microsoft Users
Kuo-Chun Su
使用Ubuntu架設hadoop
使用Ubuntu架設hadoop
taishanla
PostgreSQL 9 Standby
PostgreSQL 9 Standby
March Liu
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
PostgreSQL Search
PostgreSQL Search
guestb75c3a
海量日志分析系统实践,Dba
海量日志分析系统实践,Dba
Cevin Cheung
HDInsight for Hadoopers
HDInsight for Hadoopers
Kuo-Chun Su
Spark 巨量資料處理基礎教學
Spark 巨量資料處理基礎教學
NUTC, imac
分区表基础知识培训
分区表基础知识培训
maclean liu
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
Oracle Instance 介紹
Oracle Instance 介紹
Chien Chung Shen
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
Was ist angesagt?
(20)
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
Web请求异步处理和海量数据即时分析在淘宝开放平台的实践
Hbase运维碎碎念
Hbase运维碎碎念
Hadoop hive
Hadoop hive
Spark streaming经验介绍
Spark streaming经验介绍
TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例
Spark性能调优分享
Spark性能调优分享
深入了解Oracle自动内存管理asmm
深入了解Oracle自动内存管理asmm
Hadoop-分布式数据平台
Hadoop-分布式数据平台
HDInsight for Microsoft Users
HDInsight for Microsoft Users
使用Ubuntu架設hadoop
使用Ubuntu架設hadoop
PostgreSQL 9 Standby
PostgreSQL 9 Standby
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
PostgreSQL Search
PostgreSQL Search
海量日志分析系统实践,Dba
海量日志分析系统实践,Dba
HDInsight for Hadoopers
HDInsight for Hadoopers
Spark 巨量資料處理基礎教學
Spark 巨量資料處理基礎教學
分区表基础知识培训
分区表基础知识培训
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Oracle Instance 介紹
Oracle Instance 介紹
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Andere mochten auch
Hadoop architecture by ajay
Hadoop architecture by ajay
Hadoop online training
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Cloudera, Inc.
Hadoop Internals (2.3.0 or later)
Hadoop Internals (2.3.0 or later)
Emilio Coppa
Hadoop Summit Europe 2014: Apache Storm Architecture
Hadoop Summit Europe 2014: Apache Storm Architecture
P. Taylor Goetz
Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
sudhakara st
Seminar Presentation Hadoop
Seminar Presentation Hadoop
Varun Narang
Andere mochten auch
(6)
Hadoop architecture by ajay
Hadoop architecture by ajay
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Hadoop Summit 2012 | Optimizing MapReduce Job Performance
Hadoop Internals (2.3.0 or later)
Hadoop Internals (2.3.0 or later)
Hadoop Summit Europe 2014: Apache Storm Architecture
Hadoop Summit Europe 2014: Apache Storm Architecture
Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
Seminar Presentation Hadoop
Seminar Presentation Hadoop
Ähnlich wie Hadoop MapReduce Task Scheduler Introduction
Kafka in Depth
Kafka in Depth
YI-CHING WU
Nosql三步曲
Nosql三步曲
84zhu
Node cluster
Node cluster
aleafs
Hadoop 0.23 m_rv2_introduction
Hadoop 0.23 m_rv2_introduction
JinGui LI
MySQL压力测试经验
MySQL压力测试经验
Jinrong Ye
Zh tw introduction_to_map_reduce
Zh tw introduction_to_map_reduce
TrendProgContest13
ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1
medcl
淘宝主备数据库自动切换
淘宝主备数据库自动切换
mysqlops
诗檀软件 Oracle开发优化基础
诗檀软件 Oracle开发优化基础
maclean liu
10, OCP - flashback
10, OCP - flashback
ted-xu
Large-Scale Cluster Mangement & Kubernetes Under The Hood
Large-Scale Cluster Mangement & Kubernetes Under The Hood
Lei (Harry) Zhang
实时任务调度
实时任务调度
Tony Deng
1, OCP - architecture intro
1, OCP - architecture intro
ted-xu
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
Kmeans in-hadoop
Kmeans in-hadoop
Tianwei Liu
線上埋碼資料收集實作
線上埋碼資料收集實作
FEG
基于Spring batch的大数据量并行处理
基于Spring batch的大数据量并行处理
Jacky Chi
【Maclean liu技术分享】开oracle调优鹰眼,深入理解awr性能报告 第二讲 正式版 20130410
【Maclean liu技术分享】开oracle调优鹰眼,深入理解awr性能报告 第二讲 正式版 20130410
maclean liu
MySQL多机房容灾设计(with Multi-Master)
MySQL多机房容灾设计(with Multi-Master)
Lixun Peng
Log collection
Log collection
FEG
Ähnlich wie Hadoop MapReduce Task Scheduler Introduction
(20)
Kafka in Depth
Kafka in Depth
Nosql三步曲
Nosql三步曲
Node cluster
Node cluster
Hadoop 0.23 m_rv2_introduction
Hadoop 0.23 m_rv2_introduction
MySQL压力测试经验
MySQL压力测试经验
Zh tw introduction_to_map_reduce
Zh tw introduction_to_map_reduce
ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1
淘宝主备数据库自动切换
淘宝主备数据库自动切换
诗檀软件 Oracle开发优化基础
诗檀软件 Oracle开发优化基础
10, OCP - flashback
10, OCP - flashback
Large-Scale Cluster Mangement & Kubernetes Under The Hood
Large-Scale Cluster Mangement & Kubernetes Under The Hood
实时任务调度
实时任务调度
1, OCP - architecture intro
1, OCP - architecture intro
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Kmeans in-hadoop
Kmeans in-hadoop
線上埋碼資料收集實作
線上埋碼資料收集實作
基于Spring batch的大数据量并行处理
基于Spring batch的大数据量并行处理
【Maclean liu技术分享】开oracle调优鹰眼,深入理解awr性能报告 第二讲 正式版 20130410
【Maclean liu技术分享】开oracle调优鹰眼,深入理解awr性能报告 第二讲 正式版 20130410
MySQL多机房容灾设计(with Multi-Master)
MySQL多机房容灾设计(with Multi-Master)
Log collection
Log collection
Mehr von Hanborq Inc.
Introduction to Cassandra
Introduction to Cassandra
Hanborq Inc.
Hadoop HDFS NameNode HA
Hadoop HDFS NameNode HA
Hanborq Inc.
Hadoop大数据实践经验
Hadoop大数据实践经验
Hanborq Inc.
FlumeBase Study
FlumeBase Study
Hanborq Inc.
Flume and Flive Introduction
Flume and Flive Introduction
Hanborq Inc.
Hadoop MapReduce Streaming and Pipes
Hadoop MapReduce Streaming and Pipes
Hanborq Inc.
HBase Introduction
HBase Introduction
Hanborq Inc.
Hadoop Versioning
Hadoop Versioning
Hanborq Inc.
Hadoop MapReduce Introduction and Deep Insight
Hadoop MapReduce Introduction and Deep Insight
Hanborq Inc.
Hadoop HDFS Detailed Introduction
Hadoop HDFS Detailed Introduction
Hanborq Inc.
How to Build Cloud Storage Service Systems
How to Build Cloud Storage Service Systems
Hanborq Inc.
Hanborq Optimizations on Hadoop MapReduce
Hanborq Optimizations on Hadoop MapReduce
Hanborq Inc.
Mehr von Hanborq Inc.
(12)
Introduction to Cassandra
Introduction to Cassandra
Hadoop HDFS NameNode HA
Hadoop HDFS NameNode HA
Hadoop大数据实践经验
Hadoop大数据实践经验
FlumeBase Study
FlumeBase Study
Flume and Flive Introduction
Flume and Flive Introduction
Hadoop MapReduce Streaming and Pipes
Hadoop MapReduce Streaming and Pipes
HBase Introduction
HBase Introduction
Hadoop Versioning
Hadoop Versioning
Hadoop MapReduce Introduction and Deep Insight
Hadoop MapReduce Introduction and Deep Insight
Hadoop HDFS Detailed Introduction
Hadoop HDFS Detailed Introduction
How to Build Cloud Storage Service Systems
How to Build Cloud Storage Service Systems
Hanborq Optimizations on Hadoop MapReduce
Hanborq Optimizations on Hadoop MapReduce
Hadoop MapReduce Task Scheduler Introduction
1.
Introduction to Hadoop TaskScheduler
July 11, 2012 Guangxian Liao Big Data Engineering Team Hanborq Inc.
2.
MapReduce任务调度 •
配置:mapred.jobtracker.taskScheduler • 插件式Task调度器 • 基类TaskScheduler • JT收到TT的心跳时,使用调度器分配Task 2
3.
Task调度器
调度器 介绍 JobQueueTaskScheduler 一个队列,FIFO,可以指定优先级 CapacityTaskScheduler(contrib目 多个队列,每个队列可以指定资源百分比, 录) FIFO,支持优先级。可以设定单个用户占用 队列资源的百分比上限 FairScheduler(contrib目录) 默认每个用户有单独的Job pool,缺省平均 分配资源,每个job可以配置优先级,每个 pool可以配置权值和最低资源保障,支持 Slot抢占。 LimitTasksPerJobTaskScheduler 基本功能和JobQueueTaskScheduler一样,可 以指定每个Job同时运行的Task数量上限 mapred.jobtracker.scheduler.maxRunningTasks PerJob 3
4.
JobQueueTaskScheduler调度策略 • 按照数据局部性分配MapTask。 • 保证每个TaskTracker负载比较均衡。 •
默认TaskTracker和Map处理的数据片(split)在同一个节点或者同一个机 架认为是LocalMapTask。 • 网络拓扑由脚本来提供,脚本负责获取主机对应的拓扑位置。 ${topology.script.file.name} • 可以一次heartbeat分配多个LocalMapTask。 • 如果没有LocalMapTask可以分配,则可以分配一个NonLocalMapTask。 • ReduceTask一次最多分配一个。 4
5.
FairScheduler配置 •
配置:mapred.fairscheduler.poolnameproperty • Job的poolname由哪个JobConf参数来指定。 • 默认是user.name,按照用户分pool • 也可以指定为mapred.job.queue.name • 或者group.name 5
6.
FairScheduler配置 • 配置:mapred.fairscheduler.pool • 用户可以直接指定job放入哪个pool •
配置这个参数后,mapred.fairscheduler.poolnameproperty 失效 6
7.
FairScheduler配置 • 配置:mapred.fairscheduler.allocation.file • Pool分配的xml文件的路径 •
Absolute path 7
8.
FairScheduler xml文件举例 • <?xml
version="1.0"?> <allocations> <pool name="sample_pool"> <minMaps>5</minMaps> <minReduces>5</minReduces> <weight>2.0</weight> </pool> <user name="sample_user"> <maxRunningJobs>6</maxRunningJobs> </user> <userMaxJobsDefault>3</userMaxJobsDefault> </allocations> 8
9.
FairScheduler Task抢占 • mapred.fairscheduler.preemption •
Default:false • 是否支持抢占 9
10.
两种情况会抢占 • 一个Pool一定时间内没有分配到最低的资源 • 一个Job一定时间内没有占用到它应该被分
配资源的一半。 10
11.
The End Thank You
Very Much! liaoguangxian@gmail.com 11