当前位置：移动技术网 > 网络运营>服务器>Linux > 【HDFS篇14】HA高可用 --- Federation架构设

【HDFS篇14】HA高可用 --- Federation架构设

2020年07月17日 | 移动技术网网络运营 | 我要评论

心累的时候不妨停下来休息一下，好好收拾一下情绪在继续前进

Federation架构设计

1. NameNode架构的局限性

（1）Namespace（命名空间）的限制

由于NameNode在内存中存储所有的元数据（metadata），因此单个NameNode所能存储的对象（文件+块）数目受到NameNode所在JVM的heap size的限制。50G的heap能够存储20亿（200million）个对象，这20亿个对象支持4000个DataNode，12PB的存储（假设文件平均大小为40MB）。随着数据的飞速增长，存储的需求也随之增长。单个DataNode从4T增长到36T，集群的尺寸增长到8000个DataNode。存储的需求从12PB增长到大于100PB。

（2）隔离问题

由于HDFS仅有一个NameNode，无法隔离各个程序，因此HDFS上的一个实验程序就很有可能影响整个HDFS上运行的程序。

（3）性能的瓶颈

由于是单个NameNode的HDFS架构，因此整个HDFS文件系统的吞吐量受限于单个NameNode的吞吐量。

2.HDFS Federation架构设计

能不能有多个NameNode

NameNode	NameNode	NameNode
元数据	元数据	元数据
Log	machine	电商数据/话单数据

3.HDFS Federation应用思考

不同应用可以使用不同NameNode进行数据管理，图片业务、爬虫业务、日志审计业务

Hadoop生态系统中，不同的框架使用不同的NameNode进行管理NameSpace。（隔离性）

但是呢，仅限于超大型公司，超大型数据量使用，中小型公司不用考虑这样的架构，毕竟服务器开销很大

相关资料

本文地址：https://blog.csdn.net/qq_31923871/article/details/107386263

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

linux seq命令

1.功能seq（sequence）命令可用于产生数值序列。2.选项选项描述-f使用printf 样式的浮点格式-... [阅读全文]
荐九章算法笔记D1-动态规划概述

tags:算法DP动态规划大家觉得写还可以，可以点赞、收藏、关注一下吧！也可以到我的个人博客参观一下，估计近几年... [阅读全文]
荐从面试到入职到离职，我在B站工作的30天时光！！！

从面试到入职到离职，我在B站工作的30天时光！！！2019年4月，我从工作两年的公司离职了。离职前我拿到了B站的... [阅读全文]
荐 Linux网络设置详解

文章目录前言云计算一：查看网络接口信息1.1使用ifconfig 命令查看网络接口地址1.2网卡介绍1.3查看主... [阅读全文]
灵备CDM系统介绍

第一章背景及概述随着云计算、虚拟化、大数据等一系列技术的不断发展，为企业及政府单位的数字化转型奠定了扎实的技... [阅读全文]
从零搭建阿里云托管版k8s集群-ingress（七）

预备知识：- k8s基本操作命令- yaml文件格式- linux基础操作（增加执行权限，移动文件，执行命令）-... [阅读全文]
是否也想过要入Linux这个坑？我刚入，并且很O(∩_∩)O~ ！(适合Linux新手)

阅读对象：不是老司机，也不是电脑小白，你得是个聪明人，同时需要一点点耐心！起因：Windows总是越用越慢，只能... [阅读全文]
Win知识 - 程序是怎样跑起来的——系统调用和高级编程语言的移植性

操作系统的硬件控制功能，通常是通过一些小的函数集合体的形式来提供的。这些函数及调用函数的行为统称为系统调用（sy... [阅读全文]
MPS DC-DC Designer帮你搞定DC-DC电路设计

你还在埋头调试DC-DC吗？ [阅读全文]
proteus仿真stm32控制呼吸灯

proteus仿真stm32控制呼吸灯设计思路：采用stm32f103r6为主控芯片，及led-green；时钟... [阅读全文]