#禅与计算机程序设计艺术# Hbase的基本架构以及对应的读写流程
一、HBase简介
1,定义:
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL 数据库。
2,HBase的架构图:
架构角色:
1)Master
Master是所有Region Server的管理者,其实现为HRegionServer,主要作用有:
a>对于表的DDL操作:create,delete,alter
b>对于RegionServer的操作:分配regions到每个RegionServer,监控每个RegionServer的状态,负载均衡和故障转移。
2)Zookeeper:
HBase通过Zookeeper来做Master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作。
3)WAL:
由于数据要经MemStore排序后才能刷写到HFile,但把数据保存在内存中会有很高的概率导致数据丢失,为了解决这个问题,数据会先写入Write-Ahead logfile的文件中,然后再写入到Memstore中。所以在系统出现故障的时候,数据可以通过这个日志文件重建。
4)MemStore:
写缓存,由于HFile中的数据要求是有序的,所以数据是先存储在MemStore中,排好序后,等到达刷写时机才会刷写到HFile,每次刷写都会形成一个新的HFile。
5)StoreFile:
保存实际数据的物理文件,StoreFile以HFile的形式存储在HDFS上。每个Store会有一个或多个StoreFile(HFile),数据在StoreFile上是有序的。
3,数据模型:
1)Name Space
命名空间,类似于关系型数据库的DataBase概念,每个命名空间下有多个表。HBase有两个自带的命名空间,分别是hbase和default,hbase中存放的是HBase的内置表,default表示用户默认使用的命名空间。
2)Region
类似于关系型数据库的表概念。不同的是,HBase定义表时只需要生命列簇即可,不需要声明具体的列。这意味着,往HBase写入数据时,字段可以动态、按需指定。
3)Row
HBase表中的每行数据都由一个RowKey和多个Column(列)组成,数据是按照RowKey的字典顺序存储的,并且查询时智能根据RowKey进行检索,所以RowKey的书籍十分重要。
4)Cloumn
HBase中的每个列都由Cloumn Family(列簇)和Cloumn Qualifier(列限定符)进行限定,例如info:name,info:age。建表时,只需指明列簇,而列限定符无需预先定义。
5)Time Stamp
用于标识数据的不同版本(version),每条数据写入时,如果不指定时间戳,系统会自动为其加上该字段,其值为写入HBase的时间。
6)Cell
由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数据是没有类型的,全部是字节码形式存贮。
一、HBase简介
1,定义:
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL 数据库。
2,HBase的架构图:
架构角色:
1)Master
Master是所有Region Server的管理者,其实现为HRegionServer,主要作用有:
a>对于表的DDL操作:create,delete,alter
b>对于RegionServer的操作:分配regions到每个RegionServer,监控每个RegionServer的状态,负载均衡和故障转移。
2)Zookeeper:
HBase通过Zookeeper来做Master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作。
3)WAL:
由于数据要经MemStore排序后才能刷写到HFile,但把数据保存在内存中会有很高的概率导致数据丢失,为了解决这个问题,数据会先写入Write-Ahead logfile的文件中,然后再写入到Memstore中。所以在系统出现故障的时候,数据可以通过这个日志文件重建。
4)MemStore:
写缓存,由于HFile中的数据要求是有序的,所以数据是先存储在MemStore中,排好序后,等到达刷写时机才会刷写到HFile,每次刷写都会形成一个新的HFile。
5)StoreFile:
保存实际数据的物理文件,StoreFile以HFile的形式存储在HDFS上。每个Store会有一个或多个StoreFile(HFile),数据在StoreFile上是有序的。
3,数据模型:
1)Name Space
命名空间,类似于关系型数据库的DataBase概念,每个命名空间下有多个表。HBase有两个自带的命名空间,分别是hbase和default,hbase中存放的是HBase的内置表,default表示用户默认使用的命名空间。
2)Region
类似于关系型数据库的表概念。不同的是,HBase定义表时只需要生命列簇即可,不需要声明具体的列。这意味着,往HBase写入数据时,字段可以动态、按需指定。
3)Row
HBase表中的每行数据都由一个RowKey和多个Column(列)组成,数据是按照RowKey的字典顺序存储的,并且查询时智能根据RowKey进行检索,所以RowKey的书籍十分重要。
4)Cloumn
HBase中的每个列都由Cloumn Family(列簇)和Cloumn Qualifier(列限定符)进行限定,例如info:name,info:age。建表时,只需指明列簇,而列限定符无需预先定义。
5)Time Stamp
用于标识数据的不同版本(version),每条数据写入时,如果不指定时间戳,系统会自动为其加上该字段,其值为写入HBase的时间。
6)Cell
由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数据是没有类型的,全部是字节码形式存贮。
一起瘋世足吧⚽️
為我們支持球隊歡呼吶喊
4年前蘭桂坊瘋狂吶喊
轉眼4年後只能國內吶喊
慶幸沒有因疫情停賽
後疫情接下來一個月
會儘量低調洗版紀念這歷史一刻
讓我們一起熱血0時差
看球技還可以一次看齊各個俱樂部最具價值的球星們機會難得(認真
看不懂沒關係
可以看身材看臉蛋(誤
當一日球迷迷關係
.
今天適合:BTS Jungkook-Dreamers
#fifaworldcup# goal
#QAT# #ECU# #ENG# #IRN# #SEN#
#NED# #USA# #WAL# #ARG# #KSA##DEN##TUN# #MEX# #POL# #FRA##AUS##MAR# #Vatreni##GER# #JPN# #ESP##CRC##BEL##CAN#
#SUI# #CMR# #URU##KOR##POR#
#GHA# #BRA# #SRB##simplelife##生活日常##ilikefootball##fifa#
為我們支持球隊歡呼吶喊
4年前蘭桂坊瘋狂吶喊
轉眼4年後只能國內吶喊
慶幸沒有因疫情停賽
後疫情接下來一個月
會儘量低調洗版紀念這歷史一刻
讓我們一起熱血0時差
看球技還可以一次看齊各個俱樂部最具價值的球星們機會難得(認真
看不懂沒關係
可以看身材看臉蛋(誤
當一日球迷迷關係
.
今天適合:BTS Jungkook-Dreamers
#fifaworldcup# goal
#QAT# #ECU# #ENG# #IRN# #SEN#
#NED# #USA# #WAL# #ARG# #KSA##DEN##TUN# #MEX# #POL# #FRA##AUS##MAR# #Vatreni##GER# #JPN# #ESP##CRC##BEL##CAN#
#SUI# #CMR# #URU##KOR##POR#
#GHA# #BRA# #SRB##simplelife##生活日常##ilikefootball##fifa#
QAT 0-2 ECU
ENG 6-2 IRN
SEN 0-2 NED
USA 1-1 WAL
ARG 1-2 KSA
DEN 0-0 TUN
MEX 0-0 POL
FRA 4-1 AUS
MAR 0-0 CRO
GER 1-2 JPN
ESP 7-0 CRC
BEL 1-0 CAN
SUI 1-0 CMR
URU 0-0 KOR
POR 3-2 GHA
BRA 2-0 SRB
#卡塔尔世界杯##2022卡塔尔世界杯#
ENG 6-2 IRN
SEN 0-2 NED
USA 1-1 WAL
ARG 1-2 KSA
DEN 0-0 TUN
MEX 0-0 POL
FRA 4-1 AUS
MAR 0-0 CRO
GER 1-2 JPN
ESP 7-0 CRC
BEL 1-0 CAN
SUI 1-0 CMR
URU 0-0 KOR
POR 3-2 GHA
BRA 2-0 SRB
#卡塔尔世界杯##2022卡塔尔世界杯#
✋热门推荐