SlideShare ist ein Scribd-Unternehmen logo
1 von 27
云梯的多namenode和跨
机房之路
罗李(花名:鬼厉)
guili.ll@taobao.com
@luoli523
提纲
• 项目背景
• 构建跨机房集群的困难
• 我们的方案
项目背景
• 云梯集群
• Hadoop集群
• 版本代码有云梯开发团队维护
• 2009年开始上线服务
• 跨机房之前(2013年4月)规模4500台,109PB
• 大集群,多租户(>5000),多资源组(>150)
• 生产任务、数据分析、数据开发和测试共享集群
• 计算分时,存储和计算quota
• 目前规模:5000 × 2 (分布在2个IDC)
项目背景
• 曾经限制云梯扩展性的因素
• NameNode处理RPC性能
• NameNode内存
• JobTracker处理RPC性能
• JobTracker带宽
• JDK限制
• 。。。
• 现在
• 云梯集群机房机位不够
• 数据量的日增长速度让云梯机房最多支撑到2013年6月底
项目背景
• 云梯机房机位已满
• 存储利用率超过85%
• 计算利用率接近100%
• 几乎每天都有新的存储和计算资源的申请
1. NameNode的扩展性
2. 机房间网络限制
3. 数据应该如何跨机房分布?
4. 计算应该如何跨机房分布?
5. 几十PB数据的迁移,带数据升级
6. 怎样做到对用户透明?
7. 方案是否能扩展到多机房(>=3)?
需要解决的问题
NAMENODE的扩展性
• 性能压力:存储容量
• N亿文件,N亿block
• 可垂直扩展:物理内存,96GB->192GB->…->1TB?
• 性能压力:RPC请求压力
• 几乎所有的RPC是有状态的,需要全局锁,更新树
• Client请求: 5000(slaves) * 20(slots/slaves) = 10w并发
• DataNode请求: blockReport & heartbeat ≈ 2000 qps
• 垂直扩展?CPU主频1.8GHz->3.2GHz->??? 多核???
• 多NameNode的目的:水平扩展,分散Client的RPC请求
压力
• 借鉴成熟的方案——HDFS Federation
跨机房网络限制
• 带宽
• 单机房内:点对点的带宽1Gbps
• 跨机房间(5000 vs. 5000):点对点的带宽≈20Mbps
• 总带宽较小,容易被打满,成为瓶颈
• 延时
• 1ms之内 -> 5-10ms
• 对离线作业的影响可控
• 故障
• 机房间网络故障如何处理?
• 如何保障断网后,任意一个机房内部的服务是否正常?
数据和计算如何跨机房分布
• N个资源组,M个机房
GroupA
GroupC
GroupB
DC1
DC2
GroupD
• 任意资源组的计算/存储资源不超过单个机房总量
• 单个计算任务 (Job) 的所有 Task 在同一机房内运行
• (默认)产生的数据只写到本地机房
• 也有部分数据需要跨机房写
• (默认)只读取本机房的文件副本
• 也有少部分作业直接跨机房读
尽量减少
跨机房的
数据流量
跨机房的架构
机房1 机房2
独享带宽
用户
Gateway
内部网络
NN1 NN2
JT1 JT2
/group/B
/group/D
/group/A
/group/C
DN
TT
DN
TT
DN
TT DN
TT
DN
TT
groupB
DN
TT
groupA
Task
Task
Task
TaskTask
DN
TT
/group/B
/tbl1
/group/A
/tbl2
Cross
Node
技术实现
多NAMENODE方案 —— FEDERATION
• 业界有成功案例:Facebook
• 原始方案:单机房多NameNode
• 目的:拆分Namespace
NN1
DN DN DN DN DN DN
NN2
Pool1
/disk*/p1
Pool2
/disk*/p2
/group/B
/group/D
/group/A
/group/C
Block
Pools
NAMESPACE SPLIT
• distcp? —— 慢,代价大
• FastCopy? —— 快很多,没有物理拷贝,但仍然太慢
• From Facebook
• https://issues.apache.org/jira/browse/HDFS-2139
1. 从源NameNode上获取文件信息和 block 信息,并在
目标 NameNode 上创建同样的文件
2. 获取 block 所在 DataNode 信息
3. 在DataNode上多个block pool之间复制数据(Hard
Link)
4. block report 给目标 NameNode
• 我们的方案
NAMESPACE SPLIT
• 我们的拆分方案
NN1 NN2
/group/A
/group/B
/group/C
/group/D
Pool2
/disk*/p2
DN1
Pool1
/disk*/p1
Pool2
/disk*/p2
DN2
Pool1
/disk*/p1
Pool2
/disk*/p2
DN3
Pool1
/disk*/p1
/group/A
/group/B
/group/C
/group/D
1,nn2 load fsimag1
2,hardlink pool1 to pool2
3,pool1 report to NN1 4,pool2 report to NN2
/group/A
/group/C
/group/B
/group/D
对CLIENT透明:VIEWFS
• 用户无需感知集群多机房的细节
• HDFS多NameNode
• ViewFS
• MapReduce 计算
• JobTracker Proxy
• ResourceManager Proxy(Hadoop 2.0)
对CLIENT透明:VIEWFS
• 配合HDFS Federation使用
• 要点:
• Client Side Mount Table
• 屏蔽多namespace细节
• fs.default.name: hdfs://nn.ali.com:9000/ -> viewfs://nsX/
• Defaut filesystem: DistributedFileSystem -> ViewFileSystem
• 用户路径随之改变
• 我们的改进
• Zookeeper保存Mount table,方便更新和统一管理
• 需要对以下场景真正的透明化
• 用户代码hard code:hdfs://nn.ali.com:9000/
• Hive元数据库:hdfs://nn.ali.com:9000/group/tb/hive/tb1
• Hive local mode:把非hdfs开头的路径作为local方式
• 一个新的FileSystem封装了ViewFileSystem
NewFileSystem
对CLIENT透明:VIEWFS
Zookeeper
nn1.ali.com nn2…. nn3.ali.com
/group/A /group/B
Config: mount table
ViewFileSystem
hdfs://nn.ali.com:9000/group/A/file
fs.hdfs.impl
ViewFS
Admin
Tools
Update
Watch
对CLIENT透明:VIEWFS
Yunti3
FileSystem
View
FileSystem
Distributed
FileSystem
Distributed
FileSystem
Distributed
FileSystem
NameNode
(NS1)
NameNode
(NS2)
mkdir
ZooKeeper
create
open
Client
viewfs://nsX
hdfs://nn1:9000 hdfs://nn2:9000
hdfs://hdpnn:9000
/group/B
/group/D
/group/A
/group/C
fs.hdfs.impl =
Yunti3FileSystem
/group/A -> nn1
/group/C-> nn1
/group/B -> nn2
/group/D -> nn2
MR PROXYNODE
• MR ProxyNode:
• 每个 JobTracker 只调度一个机房内的作业
• ProxyNode 直接处理 JobClient 请求,并自动转发给相应
的 JobTracker 或 ResourceManager
• 提供同一的Job查询接口(Web UI / App)
• Job 调度机制优化:把计算调度到数据所在的地方
1. 跨机房列表中的数据正在传输中(DC1->DC2),DC2
上的 Job 被暂停调度,等待传输完毕
2. Ad-hoc查询,DC2上的 Job 需要读DC1上的数据,Job
暂停调度,通知 CrossNode,数据传输完毕后继续调度
3. 跨机房数据 Join,DC1大表,DC2小表,Job 调度到
DC1上,跨机房直接读取DC2数据,无需等待
MR PROXYNODE (CONT.)
JobClient JobClient
MR
ProxyNode
JT1 JT2
TT TT TT TT TT TT
Mapping:
groupA -> JT1
groupB -> JT2
NM NM
RM1 RM2
数据跨机房迁移
NN1 NN2
Pool
2
DN1
Pool
1
Pool
2
DN2
Pool
1
Pool
2
DN3
Pool
1
DataCenter1 DataCenter2
Pool
2
DN4
Pool
1
Pool
2
DN5
Pool
1
Pool
2
DN6
Pool
1
/g/A
/g/C
/g/B
/g/D
CN1 CN2
/g/B
3:3
/g/D
3:3
block copy
NN2
/g/B
/g/D
CN2
/g/B
3:3
CROSSNODE
• 一个独立的服务,对NameNode发送指令
• 主要功能
1. 根据预置的跨机房文件列表计算待拷贝的文件
2. 让NameNode增加跨机房的文件副本
3. 维护文件原始副本数,跨机房副本数,实际副本数等状态
信息
4. 从NameNode实时同步文件创建,移动,删除等信息
5. 对跨机房的流量进行监控和限速
6. CrossFsck 检查当前跨机房文件的副本放置状况,并指挥
NameNode 进行纠正
CROSSNODE (CONT.)
• 跨机房数据迁移,几十PB的数据迁移
• 将整个资源组的数据作为跨机房文件列表(/group/B)
• 副本数 3:0 -> 3:3 -> 0:3
• 如何预先知道需要跨机房的文件?
• 通过历史作业分析得到大部分需要跨机房的文件或目录
• 形成一个跨机房文件列表,作为CrossNode的输入
• HDFS文件副本复制不及时?
• JobTracker对所有的Job输入做检查
• 和CrossNode进行通信
• 可以暂停Job的执行
CROSSNODE内部结构
/a/b DC2
/c/d DC2
云梯现在的样子
• 多NameNode,跨越2个物理机房:
• HDFS Federation
• 跨机房副本管理,数据迁移
• CrossNode
• 多机房对用户透明
• ViewFS
• MR ProxyNode
• 规模已接近万台(还没到一万,到那天我会告诉大家的)
• 可存储数据容量220PB
云梯将来的样子
• 对外服务?
• 云端企业私有hadoop集群?
• 集成分布式解决方案?
• 搭载云梯hadoop版本
• 搭载我们的hbase版本和hive版本
• hadoop淘宝开源发行版?
• 。。。。。
Q & A
谢谢!

Weitere ähnliche Inhalte

Was ist angesagt?

Cephfs架构解读和测试分析
Cephfs架构解读和测试分析Cephfs架构解读和测试分析
Cephfs架构解读和测试分析Yang Guanjun
 
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结redhat9
 
美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术团队
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at TaobaoJoshua Zhu
 
阿里云CDN技术演进之路
阿里云CDN技术演进之路阿里云CDN技术演进之路
阿里云CDN技术演进之路Joshua Zhu
 
Kubernetes use-ceph
Kubernetes use-cephKubernetes use-ceph
Kubernetes use-cephYang Guanjun
 
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2redhat9
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化Joshua Zhu
 
NoSQL-MongoDB介紹
NoSQL-MongoDB介紹NoSQL-MongoDB介紹
NoSQL-MongoDB介紹國昭 張
 
Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3redhat9
 
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentHow to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentAnna Yen
 
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010Chuanying Du
 
Building the Production Ready EB level Storage Product from Ceph - Dongmao Zhang
Building the Production Ready EB level Storage Product from Ceph - Dongmao ZhangBuilding the Production Ready EB level Storage Product from Ceph - Dongmao Zhang
Building the Production Ready EB level Storage Product from Ceph - Dongmao ZhangCeph Community
 
豆瓣数据架构实践
豆瓣数据架构实践豆瓣数据架构实践
豆瓣数据架构实践Xupeng Yun
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统Dai Jun
 
新浪微博Feed服务架构
新浪微博Feed服务架构新浪微博Feed服务架构
新浪微博Feed服务架构XiaoJun Hong
 
Divein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupDivein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupJiaying Ren
 
Use Alluxio to Unify Storage Systems in Suning
Use Alluxio to Unify Storage Systems in SuningUse Alluxio to Unify Storage Systems in Suning
Use Alluxio to Unify Storage Systems in SuningAlluxio, Inc.
 

Was ist angesagt? (20)

Cephfs架构解读和测试分析
Cephfs架构解读和测试分析Cephfs架构解读和测试分析
Cephfs架构解读和测试分析
 
Ceph perf-tunning
Ceph perf-tunningCeph perf-tunning
Ceph perf-tunning
 
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结
 
美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at Taobao
 
阿里云CDN技术演进之路
阿里云CDN技术演进之路阿里云CDN技术演进之路
阿里云CDN技术演进之路
 
Kubernetes use-ceph
Kubernetes use-cephKubernetes use-ceph
Kubernetes use-ceph
 
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化
 
NoSQL-MongoDB介紹
NoSQL-MongoDB介紹NoSQL-MongoDB介紹
NoSQL-MongoDB介紹
 
Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3
 
Ceph monitor-op
Ceph monitor-opCeph monitor-op
Ceph monitor-op
 
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentHow to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environment
 
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
 
Building the Production Ready EB level Storage Product from Ceph - Dongmao Zhang
Building the Production Ready EB level Storage Product from Ceph - Dongmao ZhangBuilding the Production Ready EB level Storage Product from Ceph - Dongmao Zhang
Building the Production Ready EB level Storage Product from Ceph - Dongmao Zhang
 
豆瓣数据架构实践
豆瓣数据架构实践豆瓣数据架构实践
豆瓣数据架构实践
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
 
新浪微博Feed服务架构
新浪微博Feed服务架构新浪微博Feed服务架构
新浪微博Feed服务架构
 
Divein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupDivein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetup
 
Use Alluxio to Unify Storage Systems in Suning
Use Alluxio to Unify Storage Systems in SuningUse Alluxio to Unify Storage Systems in Suning
Use Alluxio to Unify Storage Systems in Suning
 

Andere mochten auch

Fish, Meredith Resume
Fish, Meredith ResumeFish, Meredith Resume
Fish, Meredith ResumeMeredith Fish
 
computer history and generations
computer history and generationscomputer history and generations
computer history and generationsTaimur Muhammad
 
Rothbiz Rotherham Business News October 2008
Rothbiz Rotherham Business News October 2008Rothbiz Rotherham Business News October 2008
Rothbiz Rotherham Business News October 2008Rothbiz
 
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...Jayne Hunter-Rhys
 
Hash map (java platform se 8 )
Hash map (java platform se 8 )Hash map (java platform se 8 )
Hash map (java platform se 8 )charan kumar
 
2ºbach leng comunicación en los ámbitos profesional y administrativo
2ºbach leng comunicación en los ámbitos profesional y administrativo2ºbach leng comunicación en los ámbitos profesional y administrativo
2ºbach leng comunicación en los ámbitos profesional y administrativojcgarlop
 
Blockchain Эдди Астанин, НРД
Blockchain Эдди Астанин, НРДBlockchain Эдди Астанин, НРД
Blockchain Эдди Астанин, НРДfinopolis
 
Blockchain Nigel Vooght, PWC
Blockchain Nigel Vooght, PWCBlockchain Nigel Vooght, PWC
Blockchain Nigel Vooght, PWCfinopolis
 
Mock Server的应用与实践
Mock Server的应用与实践Mock Server的应用与实践
Mock Server的应用与实践qi lei
 
Data structure and algorithm with java implementation by obaid kakar
Data structure and algorithm with java implementation by obaid kakarData structure and algorithm with java implementation by obaid kakar
Data structure and algorithm with java implementation by obaid kakarObaid Kakar
 

Andere mochten auch (13)

Hamzeh AlJamal CV
Hamzeh AlJamal CVHamzeh AlJamal CV
Hamzeh AlJamal CV
 
Fish, Meredith Resume
Fish, Meredith ResumeFish, Meredith Resume
Fish, Meredith Resume
 
EDEN presentation
EDEN presentationEDEN presentation
EDEN presentation
 
computer history and generations
computer history and generationscomputer history and generations
computer history and generations
 
DISEÑO
DISEÑODISEÑO
DISEÑO
 
Rothbiz Rotherham Business News October 2008
Rothbiz Rotherham Business News October 2008Rothbiz Rotherham Business News October 2008
Rothbiz Rotherham Business News October 2008
 
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...
2016 Publications for the Professionals, CoSec, Practitioners, Company Direct...
 
Hash map (java platform se 8 )
Hash map (java platform se 8 )Hash map (java platform se 8 )
Hash map (java platform se 8 )
 
2ºbach leng comunicación en los ámbitos profesional y administrativo
2ºbach leng comunicación en los ámbitos profesional y administrativo2ºbach leng comunicación en los ámbitos profesional y administrativo
2ºbach leng comunicación en los ámbitos profesional y administrativo
 
Blockchain Эдди Астанин, НРД
Blockchain Эдди Астанин, НРДBlockchain Эдди Астанин, НРД
Blockchain Эдди Астанин, НРД
 
Blockchain Nigel Vooght, PWC
Blockchain Nigel Vooght, PWCBlockchain Nigel Vooght, PWC
Blockchain Nigel Vooght, PWC
 
Mock Server的应用与实践
Mock Server的应用与实践Mock Server的应用与实践
Mock Server的应用与实践
 
Data structure and algorithm with java implementation by obaid kakar
Data structure and algorithm with java implementation by obaid kakarData structure and algorithm with java implementation by obaid kakar
Data structure and algorithm with java implementation by obaid kakar
 

Ähnlich wie 云梯的多Namenode和跨机房之路

罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群hdhappy001
 
合久必分,分久必合
合久必分,分久必合合久必分,分久必合
合久必分,分久必合Qiangning Hong
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
HDInsight for Microsoft Users
HDInsight for Microsoft UsersHDInsight for Microsoft Users
HDInsight for Microsoft UsersKuo-Chun Su
 
DAE 新变化介绍
DAE 新变化介绍DAE 新变化介绍
DAE 新变化介绍Tianwei Liu
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索liu sheng
 
有道云笔记架构简介
有道云笔记架构简介有道云笔记架构简介
有道云笔记架构简介drewz lin
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese Vickie Zeng
 
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場twMVC
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Etu Solution
 
Zh tw introduction_to_hadoop and hdfs
Zh tw introduction_to_hadoop and hdfsZh tw introduction_to_hadoop and hdfs
Zh tw introduction_to_hadoop and hdfsTrendProgContest13
 
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践基于My sql的分布式数据库实践
基于My sql的分布式数据库实践锐 张
 
Nosql三步曲
Nosql三步曲Nosql三步曲
Nosql三步曲84zhu
 
D baa s_in_xiaomi
D baa s_in_xiaomiD baa s_in_xiaomi
D baa s_in_xiaomihdksky
 
Hadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research InstituteHadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research InstituteXu Wang
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAEq3boy
 
Accelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraAccelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraJunchi Zhang
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...acelyc1112009
 
開發環境建置
開發環境建置開發環境建置
開發環境建置Shengyou Fan
 

Ähnlich wie 云梯的多Namenode和跨机房之路 (20)

罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
 
合久必分,分久必合
合久必分,分久必合合久必分,分久必合
合久必分,分久必合
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
HDInsight for Microsoft Users
HDInsight for Microsoft UsersHDInsight for Microsoft Users
HDInsight for Microsoft Users
 
DAE 新变化介绍
DAE 新变化介绍DAE 新变化介绍
DAE 新变化介绍
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
 
有道云笔记架构简介
有道云笔记架构简介有道云笔记架构简介
有道云笔记架构简介
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese
 
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場
雲端環境的快取策略-Global Azure Bootcamp 2015 臺北場
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
 
Zh tw introduction_to_hadoop and hdfs
Zh tw introduction_to_hadoop and hdfsZh tw introduction_to_hadoop and hdfs
Zh tw introduction_to_hadoop and hdfs
 
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践基于My sql的分布式数据库实践
基于My sql的分布式数据库实践
 
Nosql三步曲
Nosql三步曲Nosql三步曲
Nosql三步曲
 
Mesos intro
Mesos introMesos intro
Mesos intro
 
D baa s_in_xiaomi
D baa s_in_xiaomiD baa s_in_xiaomi
D baa s_in_xiaomi
 
Hadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research InstituteHadoop development in China Mobile Research Institute
Hadoop development in China Mobile Research Institute
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAE
 
Accelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraAccelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud era
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
 
開發環境建置
開發環境建置開發環境建置
開發環境建置
 

云梯的多Namenode和跨机房之路

Hinweis der Redaktion

  1. Jobtracker的扩展性由hadoop 2.0 Yarn解决,这里不涉及
  2. 这里的资源组包括计算和存储资源,存储资源就是HDFS上保存的数据 资源组被绑定到一个固定的机房。如果是完全独立的资源组,怎么划分都没有问题,只需要保证多个机房之间的资源分布均衡。 考虑到资源组之间有相互依赖,这里的依赖就是就是跨组的数据访问,如何更好的把数据和计算做跨机房分布是我们遇到的最大难题。
  3. 第3个优化需要打破资源组和机房之间的绑定关系
  4. 计算还是跟着数据走? Proxy的图,JT,RM都画上 HA是个小问题
  5. 尽量减少对HDFS的改动