HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。
HBase适用场景:
大数据量存储,大数据量高并发操作
需要对数据随机读写操作
读写访问均是非常简单的操作
HDFS:
分布式存储提供文件系统
优化存储大尺寸的文件,不对文件进行随机读写
直接使用文件
数据模型不灵活
优化一次写入,多次读取的方式
使用文件系统和处理框架
使用文件系统和处理框架
HBase:
行键 | 时间戳 | 列族 contents | 列族 anchor | 列族 mime |
---|---|---|---|---|
“com.cnn.www” | T9 | Contents:html = “…” | Anchor.cnnsi.com = “CNN” | Mime.type = “text/html” |
行键:
列族(ColumnFamily):
时间戳(TimeStamp): 每个Cell可能有多个版本,他们之间用时间戳区分
单元格(Cell):
区域(Region):
Client: 包含访问HBase的接口
Master:
Region Server:
Zookeeper作用:
list:查看有哪些表
create:创建表
disable:删除表
describe:查看表的结构
enable:启用表
alter:修改表结构
grant:分配权限
user_permission:查看权限
revoke:收回权限
put:添加数据
get:查询数据——查询某行记录
scan:查询数据——扫描表
count:查询表中的数据行数
delete:删除行中的某个列值
deleteall:删除行
truncate:删除表中所有数据
move:移动Region
balance_swithch:开启/关闭Region
$HBASE_HOME/bin/hbase shell # 进入hbase shell console
####################表的管理####################
list # 查看有哪些表
# 创建表的语法如下:
create <table>, {NAME => <family>, VERSIONS => <VERSIONS>}
# 例子 创建表t1,有两个family name:f1,f2,且版本数均为2
create 't1',{NAME => 'f1', VERSIONS => 2},{NAME => 'f2', VERSIONS => 2}
# 删除表要分两步,首先disable 然后drop
disable 't1'
drop 't1'
# 查看表的结构
describe 't1'
# 修改表的结构
# 修改表结构必须先disable
# 语法:alter 't1', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'}
# 一个例子:修改表test1的cf的TTL为180天
disable 'test1'
alter 'test1',{NAME=>'body',TTL=>'15552000'},{NAME=>'meta', TTL=>'15552000'}
enable 'test1'
#################权限管理###################
#分配权限
# 语法 : grant <user> <permissions> <table> <column family> <column qualifier> 参数 后面用逗号分隔
# 权限用五个字母表示: "RWXCA".
# READ('R'), WRITE('W'), EXEC('X'), CREATE('C'), ADMIN('A')
# 例如,给用户‘test'分配对表t1有读写的权限,
grant 'test','RW','t1'
# 查看权限
# 语法:user_permission <table>
# 例如,查看表t1的权限列表
user_permission 't1'
# 收回权限
# 与分配权限类似,语法:revoke <user> <table> <column family> <column qualifier>
# 例如,收回test用户在表t1上的权限
revoke 'test','t1'
###################表数据的增删改查#######################
# 添加数据
# 语法:put <table>,<rowkey>,<family:column>,<value>,<timestamp>
# 例如:给表t1的添加一行记录:rowkey是rowkey001,family name:f1,column name: col1,value:value01,timestamp:系统默认
put 't1','rowkey001','f1:col1','value01'
# 查询数据——查询某行记录
# 语法:get <table>,<rowkey>,[<family:column>,....]
# 例如:查询表t1,rowkey001中的f1下的col1的值
get 't1','rowkey001', 'f1:col1'
# 或者:
get 't1','rowkey001', {COLUMN=>'f1:col1'}
# 查询表t1,rowke002中的f1下的所有列值
hbase(main)> get 't1','rowkey001'
# 查询数据扫描全表
# 语法:scan <table>, {COLUMNS => [ <family:column>,.... ], LIMIT => num} # 另外,还可以添加STARTROW、TIMERANGE和FITLER 等高级功能
# 例如:扫描表t1的前5条数据
scan 't1',{LIMIT=>5}
# 查询表中的数据行数
# 语法:count <table>, {INTERVAL => intervalNum, CACHE => cacheNum} #INTERVAL设置多少行显示一次及对应的rowkey,默认1000; CACHE每次去取的缓存区大小, 默认是10,调整该参数可提高查询速度
# 例如,查询表t1中的行数,每100条显示一次,缓存区为500
count 't1', {INTERVAL => 100, CACHE => 500}
# 删除数据——删除行中的某个列值
# 语法:delete <table>, <rowkey>, <family:column> , <timestamp>,必须指定列名
# 例如:删除表t1,rowkey001中的f1:col1的数据
delete 't1','rowkey001','f1:col1'
# 删除数据——删除表中的所有数据
# 语法: truncate <table> # 其具体过程是:disable table -> drop table -> create table
# 例如:删除表t1的所有数据
truncate 't1'
######################Region管理##########################
# 移动Region
# 语法:move 'encodeRegionName', 'ServerName' # encodeRegionName 指的 regioName 后面的编码,ServerName 指的是 master-status 的 Region Servers列表
# 示例
move '4343995a58be8e5bbc739', 'db-41.xxx.xxx.org,60020,139'
# 开启/关闭 Region
# 语法:balance_switch true|false
hbase(main)> balance_switch
# 手动split
# 语法:split 'regionName', 'splitKey'
Hadoop分布系统入门(一):HDFS篇
Hadoop分布系统入门(二):MapReduce篇
Hadoop分布系统入门(三):Zookeeper篇
本文地址:https://blog.csdn.net/Kingsleyandher/article/details/107448701
如对本文有疑问, 点击进行留言回复!!
Algebra:Chapter 0 - 预备知识: 集合论和categories
springboot + vue上传图片在服务器并实现在线预览
请谨慎使用增强for循环,刚接触Java值得一看(手动狗头)
【Nginx】还不会使用Nginx解决跨域问题?肝这一篇就够了!!
网友评论